04月
10

腾讯申请专利以优化“大语言模型训练技术”,提升模型的泛化能力和精度表现

03:36:42

天眼查App显示,腾讯科技(深圳)有限公司近日申请了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。这项专利的摘要揭示了该方法通过引入第一摘要文本和第二摘要文本,在大语言模型的训练过程中为模型提供更多可学习的信息。

QQ20250210-103054.png

根据专利描述,第一摘要文本和第二摘要文本所包含的信息量不同,其中第一摘要文本中还包含了正确语句和错误语句。通过对同一文本的这两个不同摘要进行对比学习,并区分学习其中的正确语句与错误语句,能够有效避免摘要文本单一可能导致的模型过拟合和生成不准确等问题。

腾讯 (2)

该方法的创新之处在于提升了模型的泛化性能,并有效提高了模型的准确性。通过引入多样化的摘要文本内容,腾讯的这一训练方法为大语言模型的训练过程带来了更高效、更精准的提升。

+1
0

好文章,需要你的鼓励

下一篇

近期,Windows 11操作系统迎来了一个重要的更新,其24H2版本的企业版和教育版新增了Hotpatch(热补丁)功能,这一改进使得用户无需重启设

2025-04-10 03:32:53

24小时热榜
最近更新