中美大模型对决:GRAPH三登顶 DeepSeek紧追

中美大模型对决:GRAPH三登顶 DeepSeek紧追

在今天下午,马斯克旗下的XAI公司发布了最新一代GRAPH大模型——GRAPH three。该模型一经推出便在AI性能排行榜上引发热议,以1,402分的成绩登顶全球第一,在多个分类测试中表现尤为突出。

与此前备受关注的谷歌Gemini 2.0、OpenAI的GPT-4以及中国近期走红的DeepSeek R1大模型相比,在GRAPH three面前这些模型的性能都显得略逊一筹。马斯克在直播演示中展示了GRAPH three的强大功能:不仅能生成3D动画、求解开普勒定律,还能完成游戏开发等复杂任务。

值得注意的是,在测试过程中GRAPH three展现出自我修正能力——可以实时检查运算逻辑并自动修正错误。而其他大模型在执行类似操作时往往不够流畅。此外,马斯克团队还基于GRAPH three开发了名为Deep Search的新一代智能体。

虽然Deep Search这个名字看似借鉴了Deep Think的概念(可能为Deep Thought笔误),但其实际性能远超普通搜索引擎。马斯克曾表示未来实习生岗位或将被取代:因为实习生能完成的工作它都能胜任。

马斯克的成功并非偶然。一方面他凭借资本优势投入巨资训练GRAPH three:专门建造了AI数据中心,并采购了10万张H100芯片;三个月后又追加10万张GPU算力。在算法不变的前提下算力直接决定性能表现。

另一方面也离不开人才支持。从发布会现场照片可见,在GRAPH three发布时马斯克团队中有5位华人成员:包括多伦多大学科学系助理教授Jimmy Bah和来自杭州的AI数学家吴宇怀等。

尽管GRAPH three目前占据榜首位置,但其优势并不绝对明显。与谷歌Gemini 2.0等国际大模型相比综合性能仅略胜一筹。对于中国普通用户和企业而言,在性价比方面DeepSeek更具吸引力——它既开源又价格亲民。

值得关注的是,在美国本土市场GRAPH three也面临竞争压力。谷歌的Jupyter多模态大模型表现不俗;而OpenAI CEO已透露将在数周内发布GPT 4.5版本,并计划数月后推出GPT 5。

考虑到OpenAI同样拥有充足的资金和技术资源,在未来GPT 5问世后GRAPH three能否保持领先仍存疑。从本质上看,这仍是美国依靠算力堆叠打造的技术奇迹:20万张H100芯片的功耗相当于一个欧洲小国全年用电量。

相较之下中国DeepSeek采取了更务实的发展路线——低成本高性能模式已初见成效。就在今日其创始人梁文峰又提交了一篇技术论文:提出NSA技术可同时实现推理加速与预训练成本降低。

这项技术突破在于降低成本的同时不牺牲性能甚至能提升表现:在64K上下文长度训练场景下正向传播效率提升9倍、反向传播效率提升6倍,并且上下文越长优势越明显。

虽然尚不确定这篇论文能否掀起新一轮技术热潮,但可以肯定的是它已对马斯克形成有力冲击。当前虽然资本和算力让马斯克占据先机,但DeepSeek正通过新算法实现技术突围。

这场中美大模型竞赛才刚刚拉开序幕。

贷款计算器2025最新版


免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考;文章版权归原作者所有!本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息;本站不提供任何相关服务,阁下应知本站所提供的内容不能做为操作依据。市场有风险,投资需谨慎!如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系本站,我们会及时删除处理。

展开全部内容

为您推荐