浙江大学邓水光获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种结合抽象语法树高效参数微调代码模型的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118733052B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410868774.X,技术领域涉及:G06F8/41;该发明授权一种结合抽象语法树高效参数微调代码模型的方法是由邓水光;陈佳亮;智晨;李国昌设计研发完成,并于2024-07-01向国家知识产权局提交的专利申请。
本一种结合抽象语法树高效参数微调代码模型的方法在说明书摘要公布了:本发明公开了一种结合抽象语法树高效参数微调代码模型的方法:收集代码片段作为训练数据和测试数据;对代码片段进行自动化分析,将代码片段转化为包含代码结构和语法信息的抽象语法树AST;将抽象语法树转化为图数据结构,构建包含节点和边关系的图结构;通过降维嵌入技术将图结构数值化,生成抽象语法树嵌入向量;以图结构的边关系和嵌入向量作为图神经网络的输入,学习代码片段的结构化表示,得到构建后的图神经网络;将构建后的图神经网络作为适配器模块,采用训练数据对预训练的代码模型进行训练,在训练过程中进行高效参数微调,得到微调后的代码模型。该方法在减少微调参数量的同时,能够显著提升代码模型在各类代码任务上的性能。
本发明授权一种结合抽象语法树高效参数微调代码模型的方法在权利要求书中公布了:1.一种结合抽象语法树高效参数微调代码模型的方法,其特征在于,所述方法包括如下步骤: S1、数据收集与预处理:收集代码片段作为训练数据和测试数据; S2、抽象语法树自动构建:对代码片段进行自动化分析,将代码片段转化为包含代码结构和语法信息的抽象语法树AST; S3、抽象语法树转化为图结构:将抽象语法树转化为图数据结构,构建包含节点和边关系的图结构; S4、图结构嵌入:通过降维嵌入技术将图结构数值化,生成抽象语法树嵌入向量;具体包括: S4.1对图结构中的节点的类型和源代码符号进行分词处理; S4.2扩充预训练的代码模型的词表,将新的节点类型和符号添加到词表中,得到预训练的代码模型的词向量矩阵; S4.3使用预训练的代码模型的词向量矩阵初始化图结构中分词后的节点嵌入向量; S4.4通过求平均或加权求和的方式,将每个节点的分词后的节点嵌入向量组合为节点嵌入向量; S5、图神经网络构建:以步骤S3中图结构的边关系和步骤S4中的嵌入向量作为图神经网络的输入,学习代码片段的结构化表示,得到构建后的图神经网络;具体包括: S5.1根据步骤S3中图结构的边关系和步骤S4中的嵌入向量作为GNN的输入; S5.2GNN通过将图结构中的每个节点及其邻域信息聚合来反映其在图结构中的位置和邻居的特征; S5.3通过堆叠多个GNN层得到构建后的图神经网络; S6、代码模型参数微调:将构建后的图神经网络作为适配器模块,采用步骤S1的训练数据对预训练的代码模型进行训练,在训练过程中进行高效参数微调,得到微调后的代码模型;具体包括: S6.1、加载预训练的代码模型; S6.2、将步骤S5构建后的图神经网络作为适配器模块,通过软提示或前缀微调的方式接入预训练的代码模型; S6.3、在下游任务的训练数据上,仅微调代码模型中的适配器模块参数,冻结代码模型中的其余部分; 在步骤S6.2中,软提示微调的方式为:预训练代码模型的输入端插入图神经网络的向量输出作为"软提示",将所述"软提示"与源代码片段的文本嵌入向量拼接,作为代码模型中编码器的输入;在微调阶段,仅更新图神经网络的向量的参数,冻结代码模型的其余部分; 在步骤S6.2中,前缀微调的方式为:在代码模型的编码器和解码器的每个多头注意力层中,引入可学习的前缀向量,引入方法为:将图嵌入模块的输出作为前缀向量,与多头注意力层的键值矩阵进行拼接。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励