之江实验室程翠萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉之江实验室申请的专利一种基于轻量门控机制的大模型推理优化方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721236B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411614980.4,技术领域涉及:G06N5/04;该发明授权一种基于轻量门控机制的大模型推理优化方法和系统是由程翠萍;高翔设计研发完成,并于2024-11-13向国家知识产权局提交的专利申请。
本一种基于轻量门控机制的大模型推理优化方法和系统在说明书摘要公布了:本发明公开了一种基于轻量门控机制的大模型推理优化方法和系统,旨在提升大规模预训练模型在推理任务中的效率,并显著减少计算资源消耗。该方法首先对预训练模型进行初始化,在推理过程中引入动态路由机制,结合轻量门控和阈值判断机制,有效筛选推理过程中的关键层输出。通过对每层的输出进行动态评估,利用门控LSTM单元生成门控输出值,并通过sigmoid函数激活生成层的重要性分数。如果该分数低于预设阈值,则跳过该层计算,以减少不必要的计算开销。此优化策略能够自适应地判断每层输出的重要性,在保证模型输出质量的前提下,减少冗余计算,提高推理速度。本发明适用于多种任务场景,包括自然语言处理、图像生成等,具有广泛的应用价值。
本发明授权一种基于轻量门控机制的大模型推理优化方法和系统在权利要求书中公布了:1.一种基于轻量门控机制的大模型推理优化方法,其特征在于,包括以下步骤: 1使用大规模数据集对大模型进行预训练,生成适用于推理任务的预训练模型;将数据输入预训练模型; 2利用轻量门控机制对预训练模型的每层输出进行重要性分数的量化评估,得到每层输出的置信度或重要性分数; 3基于每层输出的置信度或重要性分数,动态决定是否跳过该层的计算; 4通过门控LSTM单元,对各层输出进行门控评估,筛选出关键输出特征;若输出重要性分数低于设定阈值,则跳过该层及后续部分计算;门控机制采用轻量级神经网络结构,使用一个轻量的门控LSTM来决定是否跳过当前层的计算;这个LSTM根据输入特征生成一个门控值,其值在0和1之间,通过torch.sigmoid函数处理;如果门控值小于设定的阈值,则跳过该层的计算,返回None,否则继续进行层的计算; 5根据筛选出的关键输出特征执行推理任务,从而提高推理速度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励