04月
19

豆包大模型声称已达GPT-4水平,首次展示300万字长文处理能力引发关注

16:13:55

字节跳动旗下豆包大模型于今日发布2024年度技术进展报告,透露其最新版本Doubao-pro-1215在综合性能上已经实现与GPT-4的全面对齐,并在部分专业领域表现出更强的能力。这一进展标志着中国大模型技术正式跻身全球第一梯队。

自今年5月首次亮相以来,豆包大模型仅用7个月时间就实现了32%的能力提升。据官方介绍,通过优化海量数据处理和创新模型架构,包括提高模型稀疏度和引入强化学习等技术手段,豆包在理解精度和生成质量方面都取得了显著进步。特别是在数学和专业知识等复杂场景中,其表现甚至超越了GPT-4,而服务价格仅为后者的八分之一。

豆包、Grace、字节跳动

值得注意的是,豆包首次公开了其300万字的超长文本处理能力,这意味着它能够同时处理相当于"上百篇"学术报告的内容量。通过采用STRING等上下文关联数据算法,以及优化的稀疏化和分布式方案,豆包将百万tokens的处理延迟控制在15秒以内,大幅提升了模型对海量外部知识的处理效率。

这一技术突破不仅展示了中国AI技术的快速发展,也预示着大模型应用的普及可能将因更优的性价比而加速推进。

+1
0

好文章,需要你的鼓励

下一篇

长安汽车近日揭晓了两款备受瞩目的新车型——长安逸动PHEV与长安CS55 PLUS PHEV的上市日期,定于3月20日正式亮相。这两款新车均采用了先

2025-04-19 16:07:51

24小时热榜
最近更新