腾讯公布大语言模型训练专利，可提高模型的准确性

腾讯公布大语言模型训练专利，可提高模型的准确性

2025年2月9日

2月7日，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。

最新资讯

“智采云科技”完成数亿元A轮融资2025年3月12日
On昂跑公布2024年全年业绩，增长29.4%2025年3月12日
字节跳动AI大将加入生数科技担任CEO2025年3月12日
芯片设计公司SkyeChip据悉计划今年在马来西亚进行IPO2025年3月12日
“古都外中式汉堡”完成超5000万元A轮融资2025年3月12日

Fastdata极数是一家具备全球服务与竞争力能力的数字技术服务与数据研究分析公司

18510809459

guoliang@ifastdata.com

北京市经济技术开发区凯王共和商务花园