近日,科技界传出了一则引人注目的消息,据知名科技媒体The Information报道,meta Platforms在人工智能领域的竞赛中正面临巨大的成本压力。据悉,为了支撑其旗舰大语言模型Llama的训练,meta曾在2024年向包括微软、亚马逊在内的多家竞争对手寻求资金支持
报道指出,meta内部对于Llama模型所需的庞大资源感到担忧,因此提出了“Llama Consortium”的构想,并愿意让潜在投资者参与到Llama未来功能的开发中,以此作为吸引合作的筹码。然而,据知情人士透露,这一提议的初期反响并不热烈,目前尚不清楚是否已达成正式的资金协议
这一事件凸显了构建先进AI系统所需承担的巨额成本,即便是像meta这样财力雄厚的科技巨头也难以承受。这也进一步揭示了生成式AI领域的高风险性,即便是行业领先者也可能面临资金短缺的困境
值得注意的是,meta近期推出的Llama 4系列模型进一步展示了其在AI技术方面的雄心壮志以及所面临的成本挑战。其中,Llama 4 Scout专为单GPU使用设计,拥有109亿总参数和17亿活跃参数,以及超大的1000万token上下文窗口,能够一次性处理约750万字的内容。而Llama 4 Maverick则针对更大规模的任务,拥有400亿总参数和17亿活跃参数,以及128个专家系统
这两款模型均采用Mixture-of-Experts(MoE)架构,通过激活特定的子网络来提升效率。meta内部还开发了一款参数高达2万亿的Llama 4 Behemoth模型,用于训练小型模型,这一过程需要动用多达3.2万块GPU
meta寻求资金的行为与其Llama模型在公司业务中的核心地位密切相关。自Llama 4发布以来,它迅速被集成到WhatsApp、Instagram和Facebook的meta AI功能中,并通过亚马逊SageMaker JumpStart和微软Azure AI Foundry等云平台提供商用许可。这一举措不仅展示了meta在AI技术方面的实力,也为其带来了可观的商业收益
同时,meta在竞争中展现出了强硬的姿态。据报道,meta已阻止苹果的Apple Intelligence功能在其iOS应用中使用,迫使用户转向基于Llama的AI工具。这一举动不仅彰显了meta在AI领域的竞争力,也反映了其对于自身技术优势的自信
好文章,需要你的鼓励