苏州大学罗垲毅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州大学申请的专利一种基于蚁群动态机制的大模型微调方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121706854B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610210639.5,技术领域涉及:G06N3/0455;该发明授权一种基于蚁群动态机制的大模型微调方法是由罗垲毅;王邦军;张莉;李凡长;杨壮设计研发完成,并于2026-02-13向国家知识产权局提交的专利申请。
本一种基于蚁群动态机制的大模型微调方法在说明书摘要公布了:本发明涉及大模型调参技术领域,尤其是指一种基于蚁群动态机制的大模型微调方法,在现有的LoRA+MoE方法基础上,首先基于蚁群优化算法的自适应特性构建ACO优化器,在每个训练轮次,根据预训练大模型各层的特征复杂度自适应调整包括秩、缩放因子和选择专家数量的超参数,并以模型的性能指标为导向更新蚁群优化算法的信息素浓度,实现了参数配置的智能化调优,使微调大模型能够根据特征复杂度自动调整秩配置,以适应不同任务需求;并且,本发明对现有的门控网络进行改进,构建ACO‑MoE门控网络,以蚁群优化算法进行专家分配,并进一步基于专家的使用率构建负载均衡损失,以避免专家负载不均衡导致模型性能下降的问题。
本发明授权一种基于蚁群动态机制的大模型微调方法在权利要求书中公布了:1.一种基于蚁群动态机制的大模型微调方法,其特征在于,包括: 冻结预训练大模型的所有参数后,在预训练大模型的编码器中并入ACO-LoRA-A模块,在预训练大模型的解码器前的卷积层中并入ACO-LoRA-B模块,得到微调大模型;所述ACO-LoRA-A模块采用标准的LoRA并行分支;ACO-LoRA-B模块嵌入ACO-MoE门控网络; 基于蚁群优化算法构建ACO优化器; 微调大模型的每个训练轮次的步骤包括: 获取上一训练轮次的微调大模型的特征复杂度,输入ACO优化器;以上一训练轮次的微调大模型的特征复杂度作为启发式信息,求解当前训练轮次的最优超参数组合;所述超参数组合包括秩、缩放因子和选择专家数量; 基于当前训练轮次的最优超参数组合配置ACO-LoRA-A模块和ACO-LoRA-B模块; 将训练图像数据集输入微调大模型,进行前向传播,以总损失函数更新微调大模型的可学习参数; 当前训练轮次结束后,基于当前训练轮次的微调大模型的质量评价指标,更新ACO优化器中的信息素浓度; ACO-LoRA-B模块嵌入ACO-MoE门控网络,数据处理过程包括: 基于可学习矩阵和ACO-LoRA-B模块的输入特征,利用可学习矩阵和ACO-LoRA-B模块的秩,计算中间图像特征; 将中间图像特征输入ACO-MoE门控网络,得到门控特征; 基于门控特征,利用可学习矩阵和ACO-LoRA-B模块的秩,计算ACO-LoRA-B模块的输出特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215299 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励