近日,科技界迎来了一场震撼性的变革,由中国DeepSeek公司发布的R1模型,对美国AI领域的领先地位构成了前所未有的挑战。这款模型不仅以极具竞争力的价格超越了多个美国顶尖模型,还选择了完全开源的路径,这一举动引发了业界的广泛关注和讨论
据透露,美国meta公司的员工甚至表示,R1模型的发布让他们感到恐慌。这种情绪在本周一的美股市场上得到了体现,尤其是半导体板块,股价普遍遭遇重挫。其中,英伟达公司的股价表现尤为引人注目,周一收跌16.79%,市值一夜之间蒸发了约5900亿美元,创下了美国金融史上的新纪录
除英伟达外,台积电、ARM、阿斯麦以及美光科技等半导体行业巨头也未能幸免,股价均出现大幅下跌。美股三大指数收盘时涨跌不一,道指微涨0.65%,而标普500指数和纳指则分别下跌1.46%和3.07%
面对DeepSeek带来的冲击,英伟达发言人于27日发表评论称,DeepSeek是一项杰出的人工智能进步,是测试时间缩放的完美典范。他还指出,DeepSeek的工作展示了如何利用该技术创建新模型,同时充分利用广泛可用的模型和符合出口管制的计算资源
然而,DeepSeek并未止步于此。在1月28日凌晨,该公司又发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。据DeepSeek介绍,Janus-Pro是JanusFlow大模型的高级版本,在训练策略、训练数据以及模型规模上均进行了优化。这款模型在多模态理解和文本到图像的指令功能方面取得了重大突破,还显著增强了文本到图像生成的稳定性
在文生图领域的基准测试中,Janus-Pro-7B的表现尤为亮眼。在Geneval和DPG-Bench两项测试中,其准确率分别高达80%和84.2%,远超包括OpenAI DALL-E 3在内的其他对比模型。这一成果标志着DeepSeek正式进军文生图领域,为AI技术的发展开辟了新的方向
DeepSeek的R1模型之所以能够引发如此大的轰动,主要得益于其在AI技术上的突破以及对美国科技巨头地位的撼动。长期以来,美国科技公司在AI大模型领域一直处于领先地位,而中国科技公司则被视为追赶者。然而,DeepSeek的R1模型在第三方测试中表现优异,打破了这一固有印象
在当前美国对中国实施制裁、中国公司无法使用高端芯片的背景下,DeepSeek仍然能够开发出领先模型,这一成就更显得尤为珍贵。这不仅说明当前AI大模型所需的算力资源可能被高估,也为其他科技公司提供了新的启示:在有限条件下,通过技术优化同样可以进行AI研发
DeepSeek的创始人梁文锋在接受采访时曾表示,中国AI不可能永远处在跟随的位置。他认为,中国AI与美国之间的差距主要在于原创与模仿之间的差异。为了改变这一现状,中国必须有人站到技术的前沿,进行原创性的探索和研究。DeepSeek的成就正是这一理念的生动体现
好文章,需要你的鼓励