Meta争分夺秒追赶人工智能
Meta CEO马克·扎克伯格在2022年夏末召集高管们开会,讨论了公司的计算能力,重点关注了人工智能工作的能力。
据路透社4月25日报道,Meta CEO马克·扎克伯格在2022年夏末召集高管们开会,讨论了公司的计算能力,重点关注了人工智能工作的能力。
据公司备忘录显示,尽管Meta进行了高调的人工智能研究投资,但该社交媒体巨头在主营业务上采用昂贵的人工智能友好型硬件和软件系统的速度较慢,这导致其在规模上难以跟上创新步伐,即使它越来越依赖于人工智能支持其增长.
备忘录、公司声明以及接受采访的12名熟悉这些变化的人士均要求匿名。备忘录是由新任基础设施负责人桑托什·贾纳达写的,他在九月份将备忘录发布在Meta的内部信息板上,这是第一次报道这一备忘录。
备忘录中写道:“在AI开发方面,我们在工具、工作流程和流程方面存在重大差距。我们需要在这里大力投资。”支持人工智能工作需要Meta“从根本上改变我们的物理基础设施设计、软件系统和提供稳定平台的方法”,备忘录补充道。
Meta一直在进行大规模项目,以完善其人工智能基础设施。
尽管该公司公开承认在人工智能硬件趋势上“有些跟不上时代”,但关于大规模改革的细节,包括容量危机、领导层变动和一个被废弃的人工智能芯片项目,此前并未有报道。
Meta发言人乔恩·卡维尔(Jon Carvill)对备忘录和重组表示,“Meta在创建和部署规模化最先进的基础设施方面拥有良好的记录,同时具备深厚的人工智能研究和工程专业知识。”
“我们有信心继续扩展我们基础设施的能力,以满足我们的短期和长期需求,同时为我们的应用程序和消费产品带来新的AI驱动体验。”他拒绝就Meta是否放弃其AI芯片发表评论。
落后于人
据五位消息人士透露,Meta在人工智能领域的烦恼主要源于对GPU芯片的迟缓接纳。GPU芯片由于能够同时执行大量任务,因此非常适合进行人工智能处理,可减少处理数十亿个数据所需的时间。
然而,GPU芯片价格也比其他芯片更昂贵,芯片制造商英伟达(Nvidia Corp)掌握了80%的市场份额,并在软件方面拥有绝对优势。
Meta直到去年仍然主要使用通用的中央处理器(CPU)来运行人工智能工作负载。
CPU是计算机世界中的工作马力芯片,已经填满数据中心几十年,但却执行人工智能工作较差。据两位消息人士透露,该公司还开始使用自己设计的内部定制芯片进行推理,这是一种基于大量数据训练的算法进行判断和产生响应的人工智能过程。
然而,到2021年,这种双重方法比基于GPU的方法更慢且效率更低,后者也比Meta的芯片更灵活,能够运行不同类型的模型。Meta拒绝对其AI芯片的性能发表评论。
在扎克伯格将公司转向元宇宙——一组通过增强现实和虚拟现实实现的数字世界——时,容量不足问题正在减缓其部署AI以应对威胁的能力,例如社交媒体竞争对手TikTok的崛起和由苹果领导的广告隐私变更,据四位消息人士称。这些失误引起了前Meta董事会成员彼得·蒂尔的注意,他在2022年初无言地辞职。
在离开之前的一次董事会会议上,蒂尔告诉扎克伯格及其高管,他们在关注元宇宙时变得自满,而忽视了Meta的核心社交媒体业务,这使得该公司容易受到TikTok的挑战,据两位知情人士透露。Meta拒绝对这次对话发表评论。
从外贸经济的角度看,Meta的AI策略存在战略定位的失误,短期内难以在人工智能领域占据优势。
Janardhan和其他高管没有接受公司内部申请采访的请求。 根据公司披露,这次全面改革使Meta的资本支出每季度增加约40亿美元,几乎是2021年的两倍,并导致其暂停或取消了之前计划在四个地点建造的数据中心。
这些投资恰逢Meta面临严重的财务挤压时期,自去年11月以来,该公司一直在进行大规模的员工裁员,规模之大前所未见,类似于2000年互联网泡沫时期的情形。
与此同时,微软支持的OpenAI的ChatGPT在11月30日推出后迅速成为历史上增长最快的消费应用程序,引发了科技巨头之间的竞争,以发布使用所谓的生成式AI的产品,该AI不仅能像其他AI一样识别数据模式,而且能够根据提示创建类似于人类的文字和视觉内容。 据五位消息人士称,生成式AI需要大量的计算能力,从而加剧了Meta的容量争夺的紧迫性。
迎头赶上
据消息人士透露,在规模庞大的Meta自家推出的推断芯片计划中止后,该公司执行官们反而开始在2022年下单采购了价值数十亿美元的Nvidia GPU芯片。这项订单的详情尚不清楚,Meta拒绝对此发表评论。
但是在采购GPU芯片之前,Meta已经远远落后于像谷歌这样的竞争对手。谷歌早在2015年就开始部署自己定制的GPU芯片TPU。
之后,Meta开始对其人工智能部门进行重新组织。这其中涉及到了大量高管的离职。据这些离职高管的领英档案和一位熟悉离职情况的消息人士透露,在这段时间里,Meta基本上更换了所有人工智能基础架构领导层的高管。
之后,Meta开始重新调整其数据中心,以适应即将到来的GPU芯片。这些GPU芯片需要更多的功耗和散热系统,且需要专门的网络连接它们之间的计算集群。根据Janardhan的备忘录和四位知情人士透露,这些计算集群需要24至32倍的网络容量和新的液冷系统,因此需要对数据中心进行彻底的重新设计。
在这项工作开始之际,Meta开始制定内部计划,以开发一款新的、更有野心的自研芯片。这款芯片既能够用于AI模型训练,也能够用于推断。据两位消息人士透露,这项计划预计将于2025年完成。这项计划此前尚未有任何报道。
Meta的发言人Carvill表示,数据中心的建设将在今年晚些时候恢复,而此前由于转型至新的设计而被暂停。他拒绝就该芯片计划发表评论。
权衡取舍
Meta一直在扩大其GPU能力,但目前还没有像微软和谷歌等竞争对手推广商业生成AI产品的公开展示。
首席财务官Susan Li在2月份承认,Meta目前并没有将大部分计算能力用于生成工作上,她说:“基本上所有的AI能力都用于广告、信息流和Reels,即其类似于TikTok的短视频格式,受到年轻用户的欢迎。”
据四位消息人士透露,Meta直到去年11月ChatGPT推出后才优先考虑建立生成AI产品。尽管其研究实验室FAIR(Facebook AI Research)自2021年底以来一直在发布该技术的原型,但他们表示,公司并没有专注于将其著名的研究转化为产品。
随着投资者的兴趣飙升,情况正在发生改变。扎克伯格在2月份宣布成立了一个新的高级生成AI团队,他表示这将“加速”公司在这一领域的工作。
首席技术官安德鲁·博斯沃斯特本月也表示,生成AI是他和扎克伯格花费最多时间的领域,预测Meta将于今年推出产品。
两位熟悉新团队的人表示,他们的工作处于早期阶段,专注于构建基础模型,这是一个核心程序,以后可以进行微调并适应不同的产品。
Meta的发言人Carvill表示,该公司已经在不同的团队上构建生成AI产品超过一年了。他确认,在ChatGPT推出后,这项工作在几个月内加速进行。
来源 路透社