马斯克点火全]球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训

  更新时间:2026-01-18 20:05   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

Colossus 2将拥有相当于140万块H100 GPU等效算力 暴力出奇迹外界对于Colossus 1的了解从0到200MW Colossus 2项目

<p class="f_center"><br></p> <p id="48HKQ3QL"><strong>新智元报道</strong></p> <p id="48HKQ3QO">编?辑:桃子 KinghZ</p> <p id="48HKQ3QQ"><strong>【]新智元导读】全网震撼!马斯克官宣,全球首个吉瓦级超算Colossus 2正式上线,狂堆55万块GPU,目标直指百万。下一代Grok 5已在训练,6万亿参数将引爆智能奇点。</strong></p> <p id="48HKQ3QT">全球首个吉瓦级训练集群!</p> <p id="48HKQ3QU">马斯克一早激动官宣,专为训下一代Grok打造的「超算巨兽」Colossus 2,今天正式上线。</p> <p class="f_center"><br></p> <p id="48HKQ3R0">它可是全球首个,达到吉瓦级的AI训练集群。这是什么概念?</p> <p class="f_center"><br></p> <p id="48HKQ3R2">Colossus 2的用电,要比旧金山全市用电峰值还要高。</p> <p id="48HKQ3R3">预计在今年4月,升级到1.5GW,约等于一座大型核电站的输出。</p> <p class="f_center"><br></p> <p id="48HKQ3R5">OpenAI、Anthropic在内的很多劲敌还在规划2027年路线图,xAI这边直接把「城市级」算力搞定了。</p> <p id="48HKQ3R6">更夸张的,是他们的执行速度:</p> <p></p> <ul> <p id="48HKQ3R7">Colossus 1:从零到全面上线,只用了122天</p> <p></p> <p id="48HKQ3R8">Colossus 2:刚突破1GW门槛,目标直接冲着总共2GW去</p> <p></p> </ul> <p class="f_center"><br></p> <p id="48HKQ3RB">Epoch AI此前一份报告称,Colossus 2将拥有相当于140万块H100 GPU等效算力</p> <p id="48HKQ3RC">暴力出奇迹,依旧是马斯克坚信的路线——Scaling算力对于快速逼近「奇点」那一刻至关重要。</p> <p id="48HKQ3RD">毕竟,在马斯克的叙事中,未来全球最强的AI玩家中,只有谷歌和xAI。</p> <p class="f_center"><br></p> <p id="48HKQ3RG"><strong>全球首个GW级超算:55万GPU</strong></p> <p id="48HKQ3RH">xAI展现出的惊人速度,连老黄都为之惊叹。他曾这样高度评价道——</p> <p id="48HKQ3RI">马斯克对工程学的理解是独一无二的。别人需要1年完成的事情,xAI仅用19天就搞定了。</p> <p id="48HKQ3RJ">外界对于Colossus 1的了解,要比Colossus 2系统得多。</p> <p id="48HKQ3RK">从0开始仅用122天就拔地而起,拥有大约20万张H100/H200,以及约3万张GB200 NVL72。</p> <p id="48HKQ3RM">去年,SemiAnalysis高级分析师一篇文章,曾深度分析了Colossus 2工程设计和所取得的成就。</p> <p id="48HKQ3RN">接下来,就扒一下其背后的细节。</p> <p class="f_center"><br></p> <p id="48HKQ3RQ"><strong>六个月,从0到200MW</strong></p> <p id="48HKQ3RR">Colossus 2项目,于2025年3月7日启动。</p> <p id="48HKQ3RS">它将配备55万块芯片,由GB200和GB300 GPU组成,最终未来扩展到百万GPU。</p> <p id="48HKQ3RT">当时xAI在孟菲斯(Memphis)收购了一个100万平方英尺的仓库,以及两个总计100英亩的相邻地块。</p> <p class="f_center"><br></p> <p id="48HKQ3RV">不到六个月的时间,SemiAnalysis统计了现场已部署119台风冷冷水机组,即大约200MW的冷却能力。</p> <p id="48HKQ3S0">这就足以驱动,大约11万张GB200 NVL72。</p> <p id="48HKQ3S1">而且,这个巨大的超算,全部采用的是液冷设计。</p> <p class="f_center"><br></p> <p id="48HKQ3S3">马斯克一条推文显示,一些机架在7月份就已经安装好了</p> <p id="48HKQ3S4">令人惊叹的是,xAI只用了6个月就完成了甲骨文、OpenAI<strong>花了15个月才完成的工作</strong>!</p> <p id="48HKQ3S5">据介绍, Colossus 2造价高达数百亿美元。而xAI现在基本没外部收入,主要靠母公司X输血。</p> <p id="48HKQ3S6">而且,报告里特意提了一嘴——</p> <p id="48HKQ3S7">马斯克跟中东几个「土豪」关系很铁,沙特、阿联酋、卡塔尔的主权基金,都是潜在的金主。</p> <p class="f_center"><br></p> <p id="48HKQ3SA"><strong>Grok 5在训,奇点更近了</strong></p> <p id="48HKQ3SB">Colossus 2的全面上线,也意味着「全球首个吉瓦级大模型」——Grok即将出世。</p> <p id="48HKQ3SC">马斯克曾坚定地表示,xAI有机会通过Grok 5实现AGI。</p> <p class="f_center"><br></p> <p class="f_center"><br></p> <p id="48HKQ3SF">此前,在一期采访中,马斯克还表示Grok 5拥有高达6万亿参数,而且智能密度更高,预计将在上半年发布。</p> <p id="48HKQ3SG">不仅如此,它还原生支持视频理解。</p> <p class="f_center"><br></p> <p id="48HKQ3SI">可以预见,在首个吉瓦级超算上训出的Grok 5,实力一定超乎想象。</p> <p id="48HKQ3SK"><strong>爆冲2GW,今年上线</strong></p> <p id="48HKQ3SL">去年12月底,马斯克斥资超200亿美元,买下了孟菲斯第三栋建筑,计划将Colossus总容量扩展至2GW。</p> <p id="48HKQ3SM">这栋新建筑——MACROHARDRR,延续了Macrohard命名,位于Colossus 2旁,占地面积超80万平方英尺。</p> <p class="f_center"><br></p> <p class="f_center"><br></p> <p id="48HKQ3SP">Grok估计,在2025年中,按AI算力排名前10中,Colossus 2和特斯拉Dojo位居第一和第7:</p> <p class="f_center"><br></p> <p id="48HKQ3SR">在AI算力上,马斯克疯狂加码,甚至他「已经在规划10GW甚至更高的算力」。</p> <p class="f_center"><br></p> <p id="48HKQ3SU"><strong>狂飙吉瓦级超算,硅谷巨头乱战</strong></p> <p id="48HKQ3SV">如今,全世界AI巨头们,正掀起一场前所未有的算力军备赛。</p> <p id="48HKQ3T0">除了马斯克xAI之外,OpenAI、Meta、Anthropic也在纷纷加码,目标直指吉瓦(GW)级,甚至更大规模的AI超算。</p> <p class="f_center"><br></p> <p id="48HKQ3T2">2022年GPT发布以来,OpenAI、xAI、Anthropic、Meta Superintelligence等AI训练算力飙升</p> <p id="48HKQ3T4"><strong>OpenAI:星际之门</strong></p> <p id="48HKQ3T5">「星际之门」,便是众所周知的典型代表之一。</p> <p id="48HKQ3T6">2025年1月初,OpenAI联合软银、甲骨文等伙伴正式启动了名为「星际之门」(Stargate)的宏大计划。</p> <p id="48HKQ3T7">这项「AI曼哈顿计划」,要在未来4年砸5000亿美金,建设总容量达到10GW的集群。</p> <p id="48HKQ3T8">首期立即部署1000亿美元,如今进展迅猛。</p> <p class="f_center"><br></p> <p class="f_center"><br></p> <p id="48HKQ3TB">去年9月,OpenAI公布了五个新站点,要在未来三年,实现7GW算力规模。</p> <p id="48HKQ3TC">这样的规模相当于同时为数百万家庭供电,却全部用于驱动AI训练与推理。</p> <p class="f_center"><br></p> <p id="48HKQ3TF"><strong>Meta:普罗米修斯</strong></p> <p id="48HKQ3TG">Meta同样在加速狂奔。</p> <p id="48HKQ3TH">早在去年,小扎就公开了资金代号Prometheus(普罗米修斯)的GW级AI超算项目,目标在2026年上半年上线。</p> <p class="f_center"><br></p> <p id="48HKQ3TJ">不仅如此,Meta正在建设多个吉瓦级集群:</p> <p></p> <ul> <p id="48HKQ3TK">Prometheus预计2026年率先达到1GW+</p> <p></p> <p id="48HKQ3TL">后续的Hyperion项目,计划逐步扩展到5GW规模,占地堪比曼哈顿相当一部分区域</p> <p></p> </ul> <p class="f_center"><br></p> <p id="48HKQ3TO">几天前,小扎再次重磅宣布启动全新顶级计划——Meta Compute。</p> <p id="48HKQ3TP">计划明确表示,将在本十年内建设数十吉瓦AI超算,长期目标甚至指向数百吉瓦级别。</p> <p class="f_center"><br></p> <p id="48HKQ3TR">为此,Meta内部已组建专责团队,并与核电企业签订长期协议,确保能源供应跟得上疯狂扩张的步伐。</p> <p id="48HKQ3TT"><strong>Anthropic:百万TPU下单,GPU也要</strong></p> <p id="48HKQ3TU">Anthropic选择了一条更聚焦的路线:深度绑定Google Cloud的TPU。</p> <p id="48HKQ3TV">去年10月官宣,将把Google Cloud TPU扩展到最多100万颗TPU,合同价值数百亿美元。</p> <p class="f_center"><br></p> <p id="48HKQ3U1">而且,预计在2026年上线远超1GW的容量。</p> <p class="f_center"><br></p> <p id="48HKQ3U3">而且,Anthropic采用多平台策略,同时使用谷歌TPU、亚马逊Trainium和英伟达GPU。</p> <p id="48HKQ3U4">如今,AI竞赛的胜负手,正从模型参数本身向基础设施倾斜。</p> <p id="48HKQ3U5">硅谷巨头们狂建超算,原因很简单:下一代前沿模型所需的算力远超想象。</p> <p id="48HKQ3U6">这场吉瓦级超算的全球军备赛,才刚刚拉开帷幕。</p> <p id="48HKQ3U9"><strong>6千亿算力投资,AI榨干美国人钱包?</strong></p> <p id="48HKQ3UA">网友直呼,马斯克的算力赌注「太疯狂了。AGI最难的部分已不再是数学,而是字面意义上的能不能找到足够多的电源插座」。</p> <p class="f_center"><br></p> <p id="48HKQ3UC">2026年,这一趋势只会愈演愈烈——</p> <p id="48HKQ3UD">亚马逊AWS、微软、谷歌、Meta、甲骨文(Oracle)等超级云计算巨头正加速扩张。</p> <p class="f_center"><br></p> <p id="48HKQ3UF">它们的资本支出预计将超过6000亿美元,重点已全面转向AI专用基础设施建设,边缘服务成为次要关注点。</p> <p id="48HKQ3UG">独立的市场研究和分析公司Dell’Oro分析师Baron Fung指出:「预计在未来2至3年内,这些部署将新增数十GW总电力容量,反映出加速计算对算力规模和密度提出了极高要求。」</p> <p class="f_center"><br></p> <p id="48HKQ3UI">Baron Fung是戴尔奥罗集团(Dell’Oro Group)的高级研究总监,负责数据中心IT资本支出、半导体与组件,以及以太网适配器与智能网卡研究项目</p> <p id="48HKQ3UJ">虽然整体趋势是「全面转向AI」,但各家打法并不相同:</p> <p></p> <ul> <p id="48HKQ3UK"><strong>亚马逊与谷歌</strong>聚焦自研AI加速器,围绕内部芯片构建数据中心;</p> <p></p> <p id="48HKQ3UL"><strong>微软</strong>则持续重金押注OpenAI以及自己的AI平台战略;</p> <p></p> <p id="48HKQ3UM"><strong>Oracle</strong>借Stargate项目强势崛起,迅速构建新一代AI算力园区;</p> <p></p> <p id="48HKQ3UN"><strong>Meta</strong>正在打造当前全球最庞大的AI数据中心项目,代表作包括Prometheus与Hyperion。</p> <p></p> </ul> <p id="48HKQ3UP">Baron Fung表示,这类新一代数据中心将集成大规模AI集群、高密度加速卡机架、先进网络连接与支持型存储系统。</p> <p id="48HKQ3UQ">「预计未来2到3年内,数十GW级的新超级数据中心产能将陆续上线,服务对象既包括内部AI平台,也涵盖大客户的关键AI工作负载。」Fung总结道。</p> <p id="48HKQ3UR">但与此同时,电力短缺、设备交付周期拉长以及地方政府与社区的反对,也让扩张变得日益困难。</p> <p id="48HKQ3US">那些AI数据中心年入千万美元,而且零交通压力,零学区负担,看起来只会带来现金流。</p> <p id="48HKQ3UT">这番说辞深得美国政界青睐——白宫如此,各州政府亦如此。</p> <p id="48HKQ3UU">但对数据中心附近的居民而言,「根本没有好处可言」。</p> <p id="48HKQ3UV">因为这些算力设施全天候24小时运转,内部部署着数以千计的服务器,而服务器需要大量电力与水来保持冷却。</p> <p id="48HKQ3V0">一方面,数据中心建设热潮助推了AI革命;另一方面,AI热潮可能耗尽美国电网资源、榨干普通人的钱包。</p> <p class="f_center"><br></p> <p id="48HKQ3V2">AI正在推高电价,而没有人对此感到满意。甚至有媒体称:</p> <p id="48HKQ3V3">美国对数据中心的「战争」即将到来。</p> <p class="f_center"><br></p> <p id="48HKQ3V6">2025年12月1日,密歇根州塞林(Saline)的居民集会,反对一座耗资70亿美元的「星际之门」(Stargate)数据中心。</p> <p id="48HKQ3V7">根据美国能源信息署(EIA)的数据,自2022年以来,全美几乎所有地区的居民零售电价涨幅均超过通胀率,且这一现象很可能持续至2026年。</p> <p id="48HKQ3V8">比如,去年,新泽西州的电费账单上涨了约 20%。</p> <p class="f_center"><br></p> <p id="48HKQ3VA">美国电价飙升的深层矛盾源于积弊数十年的结构性问题:老化的基础设施亟待更新,而过时的商业模式与法规体系拖慢了电网升级的步伐。</p> <p id="48HKQ3VB">而数据中心建设浪潮,给美国的电力供应体系前所未有的难题。</p> <p id="48HKQ3VC">据《Data Center Watch》统计,反对数据中心建设的浪潮正在加速:</p> <p id="48HKQ3VD">2025年仅第二季度就有980亿美元的在建项目受到阻碍或严重拖延。</p> <p id="48HKQ3VF">去年上半年,美国已有36个项目涉及投资高达1620亿美元的AI算力项目受到阻碍或严重拖延。</p> <p class="f_center"><br></p> <p id="48HKQ3VH">如果说AI热潮给全世界带了硬件短缺,那给美国带来的更严重的问题将是电力短缺。</p> <p id="48HKQ3VI">保算力,还是保电力,成了美国不得不考虑的问题。</p> <p id="48HKQ3VJ">要支持数十GW级的新超级数据中心产能,电力而非算力卡了美国AI的脖子。</p> <p id="48HKQ3VK">参考资料:<br></p> <p id="48HKQ3VL">https://x.com/elonmusk/status/2012500968571637891?s=20</p> <p id="48HKQ3VM">https://x.com/MobofJoggers/status/1947708915958870344?s=20</p> <p id="48HKQ3VN">https://x.com/mark_k/status/2012510296485618078</p> <p id="48HKQ3VO">https://x.com/elonmusk/status/2012500968571637891</p> <p id="48HKQ3VP">https://x.com/XFreeze/status/2012493620331610607</p> <p class="f_center"><br></p>

编辑:迭戈·卡尔瓦