北京大学梁清源获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学申请的专利一种自动代码的演化和编辑方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118778942B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410768557.3,技术领域涉及:G06F8/33;该发明授权一种自动代码的演化和编辑方法及系统是由梁清源;朱琪豪;孙泽宇;胡俊豪;赵逸凡;陈逸洲;朱明煊;王国庆;张路设计研发完成,并于2024-06-14向国家知识产权局提交的专利申请。
本一种自动代码的演化和编辑方法及系统在说明书摘要公布了:本发明公开一种自动代码的演化和编辑方法及系统,属于信息技术领域。所述方法包括:构建训练数据集,所述训练数据集由若干个新旧代码对构成;基于代码编辑目标生成损失、代码保留片段掩码损失以及结合去噪自编码的代码编辑损失,在所述训练集上训练一代码演化和编辑模型;其中,所述代码演化和编辑模型是基于Transformer的Encoder‑Decoder框架构建;基于代码演化和编辑模型实现测试代码的演化或编辑。本发明可以在修改旧代码的过程中高效地生成正确的目标代码。
本发明授权一种自动代码的演化和编辑方法及系统在权利要求书中公布了:1.一种自动代码的演化和编辑方法,其特征在于,所述方法包括: 构建训练数据集,所述训练数据集由若干个新旧代码对构成; 基于代码编辑目标生成损失、代码保留片段掩码损失以及结合去噪自编码的代码编辑损失,在所述训练数据集上训练一代码演化和编辑模型;其中,所述代码演化和编辑模型是基于Transformer的Encoder-Decoder框架构建,所述代码编辑目标生成损失,所述代码保留片段掩码损失,所述结合去噪自编码的代码编辑损失,t表示当前生成的步骤,表示生成的编辑后的代码的第t个token,N表示生成序列的最大长度,表示模型生成目标序列的概率分布,表示模型的可学习参数,表示代码编辑前后不变的token,表示编辑前后的变化的token,表示引入噪音后的旧代码; 基于代码演化和编辑模型实现测试代码的演化或编辑; 其中,所述构建训练数据集,包括: 根据项目在Github中的受欢迎程度进行项目选择,并将被选择项目的代码作为旧代码; 从该被选择项目中提取合并的拉取请求,并通过从所述拉取请求中提取代码编辑补丁,得到新代码;其中,原始旧代码与原始新代码之间的差异不超过行,且从原始旧代码到原始新代码更改的token不超过token总数的为正整数; 基于代码长度、代码内容和代码更改对旧代码和新代码进行过滤后,得到训练数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号北京大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励