Sci-fi 照进现实，从 xAI 看 “马斯克经济学” 中的 AI 布局与前沿应用

Grok 底层是一个能实时能访问 X 平台的 AI 模型，不仅能够实时更新其知识库，能处理并回应那些大多数 AI 系统会避免的敏感或 “辣味” 问题，且计划未来将具备视觉和音频等多模态能力。

在刚刚过去的这个周末，马斯克在自家的 X 平台发布了 xAI 对标 OpenAI 旗下 ChatGPT 的产品 —— “Grok”，这篇内容将聊聊 xAI 的能力，以及掰扯 “Muskonomics” 马斯克经济学中的 AI 纵向一体化。

先来说说最新发布的 xAI “Grok”，这款聊天机器人具备以下能力：

实时知识库接入：Grok 能够实时更新其知识库，这意味着它能够接入最新的信息，为用户提供最新的数据和资讯，比如以加密货币 SBF 近期的案件报道询问：

敢于触及敏感话题：与其他 AI 系统不同，Grok 能够处理并回应那些大多数 AI 系统会避免的敏感或 “辣味” 问题，这表明了其在理解复杂话题和用户意图方面的先进性；

快速迭代与成长：尽管 Grok 仅仅训练了两个月，但它承诺会根据用户反馈进行快速迭代，通过每周更新迅速成长和改进；

高效能的技术栈：Grok 由一个高效和稳定的训练和推理堆栈支持，使用了 Kubernetes、Rust 和 JAX 等先进技术。这些技术不仅确保了训练过程的可靠性，也提升了系统的性能和灵活性；

优异的基准测试表现：Grok 的核心引擎 Grok-1 在基准测试中的表现超越了许多同级别的模型，包括 ChatGPT-3.5 和 Inflection-1，在编码任务和多学科选择题上的表现尤为出色；

未来的多模态能力：Grok 计划未来将具备视觉和音频等多模态能力，这将极大扩展其应用场景和互动方式；

有趣的交互体验：Grok 在设计时融入了一种诙谐乃至叛逆的特质，这使得与它的互动更加生动有趣，但也意味着对于特别敏感的用户可能需要一些时间去适应；

研究和创新的赋能者：xAI 团队希望 Grok 能够成为研究者和创新者的强有力助手，无论是在快速访问信息、处理大量数据还是孵化新想法上，Grok 都有望发挥关键作用；

推理能力与鲁棒性：xAI 正在努力提升 Grok 的推理能力，以克服当前系统的局限性，提高对抗性攻击的鲁棒性，确保其在各种情境下都能做出可靠和准确的推理；

那么"Grok"是什么意思呢？这个词首次出现自 20 世纪科幻文学的 “三巨头” 之一 Robert A. Heinlein 的代表作《异星奇客》(Stranger in a Strange Land) ，“Grok” 的意思是理解某事物的本质。

在 Heinlein 的设定中，"Grok"是火星语言中一个非常丰富和复杂的概念，涵盖了 “饮水” 这个物理动作的同时，也隐含了人与宇宙的深层连接与理解，它涉及了一个生物体对另一个生物体或事物的全面感知、理解和同化。

“Grok” 这个词语随着《异星奇客》的流行而进入了现实世界，特别是在技术和黑客文化中，"Grok"常常用来表示某人彻底理解了一项技术或概念，这种理解不仅仅是表面的，而是透彻到了本质。

除了《异星奇客》之外，你也能常常看到马斯克将英国作家 Douglas Adams 出品的《银河系漫游指南》（The Hitchhiker's Guide to the Galaxy）挂在嘴边。

根据传记作家 Issacson 的描述，这本马斯克童年时代的启蒙 “圣经” 所记载的内容与马斯克的愿景使命相似，这本书中存在多种形式的 AI，很少有具有深度个性的 AI 角色，除了 Marvin 和 Eddie。

Marvin 是一台悲观却具备超强数学和逻辑能力的机器人，而 Eddie 是一台乐观开朗且搭载在星舰飞船上的计算机，也许马斯克在 SpaceX 的 Starship 上开发了同款 AI 系统？

相信马斯克在悲观以及乐观之间选择了乐观，就像他在过去采访以及近期与英国首相苏纳克的对谈中表示的那样 ——“我认为 AI 很有可能是一种积极的力量，但它出现问题的概率不是 0%，所以我们只需要减轻潜在的风险”。

在与苏纳克对谈中，马斯克也谈到了另一本科幻小说 Iain M. Banks 的《The Culture》，这本书讲述了一个高度发达、后稀缺经济的星际共同体—— The Culture。

这个共同体由各种不同的人类、外星生物以及极为先进的 AI 共同组成，这些 AI 经常存在于大型的星舰和空间站中，它们拥有极其发达的智能和自主意识，通常是文明中的决策者，所以结合 “AI、星舰、火星、人类以及外星人”，你的脑海中会勾勒出什么样的画面呢？

回到 xAI，马斯克也在 X 上表示在即将到来的 Beta 版本上，所有订阅 X Premium 付费订阅用户都将体验到 Grok 这款产品。

数据是 AI 的燃料。都知道马斯克早期接连从 Deepmind 以及 OpenAI 两家公司失利，以及与 Google 和 Microsoft 的恩怨情仇，拥有或遏制这几家数据以及 AI 的发展至关重要，无论是在公开场合警示 AI 的风险以及戏剧化的收购 Twitter，我想不仅有真实的需要，也有潜在的对于数据资产的布局。

Grok 底层是一个能实时能访问 X 平台的 AI 模型，根据《埃隆·马斯克传》的描述，X 平台上的信息流在多年来发布超过 10000 亿条，每天增加 5 亿条，这里汇聚了来自全球的人类集体思维，是世界上最及时的真实人类对话、新闻、兴趣、趋势、争论和行话的数据集。

在马斯克收购以前，X 采取宽松的政策让 Google 以及 Microsoft 使用这些数据，而在被私有化后，马斯克能够限制这些大厂对于这个宝贵数据集的开发，马斯克在 7 月 xAI 全员动员大会上的原话 —— “我认为每个从事 AI 的大大小小的 AI 组织，都在非法地使用 Twitter 的数据进行训练，所以我们之前对请求进行了限制”。

在此之后，xAI 对于 Grok 的训练也将拥有独一无二的高质量数据源，并且是持续实时的。但是，作为一款对标 ChatGPT 的竞品，这只是马斯克对 xAI 的第 2 个目标。

在早之前的 4 月，马斯克就向 xAI 骨干成员 Babuschkin 以及团队其它成员提出 xAI 的 3 大目标：

开发一款能够编写程序的 AI；
开发一款 ChatGPT 的竞品；
成为一款具备相信真理、具备推理和思考能力的 AGI；

再次来到 7 月的 xAI 全员动员大会，马斯克也是秉持 “Build in Public” 的理念，公开讨论了 xAI 的第三大目标 —— AGI，马斯克的愿景是 AI 能够理解宇宙的真实本质，从物理学的视角探讨了一些关于宇宙的未解之谜，例如外星人的存在和重力的本质等。

为什么马斯克一直强调物理学，并且像 Igor Babuschkin 这样的核心技术骨干都具有物理学背景呢？马斯克曾引用《2001 太空漫游》的例子：

Hal 9000 是科幻电影《2001 太空漫游》中的虚构角色，Hal 9000 是一台 AI 超级计算机，被安装在太空船 Discovery One 上，负责船上的自动操作和与宇航员的交互，在电影中，Hal 9000 逐渐表现出异常的行为，包括误导宇航员、隐藏真相和威胁船员的生命，这引发了剧情中的紧张和冲突，成为电影的重要元素之一。

对此，马斯克表示不要让 AI 面对不可能的目标，不要强迫 AI 撒谎，而物理学是真实的，实际上我们无法颠倒它，物理学不会说假话，它要么是物理学，要么不是物理学，反而人类坚持强烈的现实，到最后可能发现那实际上是虚假的。

以上只是 “软” 的层面，“硬” 的层面其实 Walter Issacson 在《埃隆·马斯克传》也提到， Issacson 认为特斯拉的全自动驾驶与通过处理视频信息使用 Dojo 技术的 Optimus 机器人相结合的真实世界 AI 将会比 LLM 的生成式 AI 更加重要。

马斯克眼中的 “AI” 并非我们今天在讨论的 LLM、ChatBot 或者 Robot，而是非常广泛所有由计算机控制的东西，比如马斯克认为特斯拉汽车实际上是有轮子的机器人，而任何连接到互联网的东西实际上都是 AI 的端点执行器。

在 Infra 层面，除了上层的数据源 X 以及端到端的模型&ChatBot —— Grok，更底层的是 AI 所需的算力，而这部分指责则由马斯克的特斯拉正在加速研发的 Dojo 来承担。

Dojo 除了在 ChatBot 今天看到的生成式 AI 产品发挥作用，也能用于优化特斯拉电动汽车的电池，以及商业航天领域：摩根士丹利的分析师认为，SpaceX 的数千颗卫星可以通过 ISL 相互通信，无需中间地面段来中继数据。

另外，卫星的运行需要避免碰撞的轨道碎片，这背后需要大量的算力，而其中所需的计量法可以受益于 Al 计算，与 Dojo 可以用于自主驾驶以避免障碍物并创建计划路径的方式相同，Spacex 可以使用 Dojo 来训练其系统以进行通信和避免碎片碰撞。

根据 2023 年 6 月马斯克的推文，Dojo V1 已经针对大量的视频训练进行了高度优化，而 Dojo V2 将整合 V1 目前面临的任何通用 AI 限制；特斯拉认为，下一代 V2 的开发和实施可以实现高达 10 倍的性能提升，从而使公司能够在 2024 年第四季度达到 100 exaFLOP。

马斯克表示早期的 Dojo 是关于训练的，但并不是用来运行 LLMs 的，但在图像方面 Dojo 做得很好，之后将迭代到高效运行 LLM 以及其他形式的 AI 训练，未来有望曾为一种潜在的可出售服务，类似亚马逊的云服务。

在摩根士丹利的报告中，截至去年 9 月，特斯拉拥有 3 台超级计算机，总共配备了 14000 个英伟达 A100，其中 10000 个用于训练，4000 个用于自动标注，而特斯拉最大的超级计算机系统配备了 7360 个 A100，如果按 GPU 数量计算，这将使其成为全球第 7 大超级计算机。

此外，马斯克有明确表示特斯拉不生产 GPU，但是这些定制芯片 D1 的算力等效 GPU，例如 H100 等等，而特斯拉设计的核心是车载硬件套件 Hardware（包含摄像头和多个传感器），Hardware 将承担推理任务，尤其是每天车辆出行决策中的数十亿查询量时，高效的推理非常重要。

进一步往下的是，这个量级的推理并不能通过纯资本来解决，马斯克认为这需要电力能源的承担，需要降压变压器，而在两年后，世界可能因为 AI 训练开始出现电力能源的紧缺问题。

在节能方面，摩根士坦利分析师 Jonas 也曾在报告中提到 D1 芯片将使特斯拉更多地控制其用于运行 AI 软件的能源消耗，且能够比使用英伟达芯片更快地处理视频数据。

除了节能，芯片制造成本也是发挥着 Gigafactory 的理念，与当前的替代方案相比，特斯拉预计 Dojo 在性能方面将提供 4 倍提升，在性能/瓦特方面将提供 1.3 倍的提升，并且在占地面积方面将缩小 5.0 倍。

换句话说，特斯拉可以在 4 个 Dojo 机柜上实现与使用 4000 个 GPU 相同的吞吐量，关于这点，iPhone 的包装设计与物流运输也要直呼 “内行”。此外，通过使用较少的系统，而不是当前的 A100 集群，超级计算机可以更有效地冷却。

最后，关于竞争优势，在马斯克看来真正的竞争优势在于你创新低速度，而不是任何但一定创新，事实上 SpaceX 几乎没有专利，特斯拉开放专利让更多人免费使用，只要创新的速度足够快，那就是对抗竞争的真正防线，而不是拼接专利或者隐藏某些东西。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。