北京极佳视界科技有限公司朱政获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京极佳视界科技有限公司申请的专利视觉语言动作模型的训练方法和机械臂操作装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121267892B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511356681.X,技术领域涉及:B25J9/16;该发明授权视觉语言动作模型的训练方法和机械臂操作装置是由朱政;王啸峰;黄冠;董哲镐设计研发完成,并于2025-09-22向国家知识产权局提交的专利申请。
本视觉语言动作模型的训练方法和机械臂操作装置在说明书摘要公布了:本公开提供了一种视觉语言动作模型的训练方法和机械臂操作装置,通过获取多模态训练数据集,多模态训练数据集包括多个第一多模态训练数据和多个第二多模态训练数据,各第一多模态训练数据和各第二多模态训练数据均包括机械臂操作视频、文本描述信息和各视频帧分别对应的真值关节角度信息,基于多模态训练数据集,对待训练的第一视觉语言动作模型进行多轮迭代训练,直至满足预设结束训练条件,得到目标视觉语言动作模型,在各轮迭代训练中,确定策略失败关联视频帧,提高策略失败关联视频帧在下一轮迭代训练中的帧权重,由此,能够有效提升训练得到的目标视觉语言动作模型对复杂、高难度操作场景的适应能力,提高执行任务的成功率。
本发明授权视觉语言动作模型的训练方法和机械臂操作装置在权利要求书中公布了:1.一种视觉语言动作模型的训练方法,其特征在于,包括: 获取多模态训练数据集,所述多模态训练数据集包括多个第一多模态训练数据和多个第二多模态训练数据,各所述第一多模态训练数据和各所述第二多模态训练数据分别包括机械臂操作视频、文本描述信息和所述机械臂操作视频中各视频帧分别对应的机械臂的真值关节角度信息,所述文本描述信息用于描述所述机械臂操作视频的视频内容,其中,包括:获取多个所述第一多模态训练数据,多个所述第一多模态训练数据的机械臂操作视频为基于不同机械臂视角采集得到;对于多个所述第一多模态训练数据,对所述第一多模态训练数据的文本描述信息中的目标对象属性信息和或背景信息进行调整,得到所述第二多模态训练数据的文本描述信息;基于所述第一多模态训练数据的机械臂操作视频和所述第二多模态训练数据的文本描述信息,确定所述第二多模态训练数据的机械臂操作视频,所述第一多模态训练数据的机械臂操作视频与所述第二多模态训练数据的机械臂操作视频具有不同的目标对象属性信息和或背景信息;基于至少一个所述第一多模态训练数据和至少一个所述第二多模态训练数据构建所述多模态训练数据集; 基于所述多模态训练数据集,对待训练的第一视觉语言动作模型进行多轮迭代训练,直至满足预设结束训练条件,由所述待训练的第一视觉语言动作模型得到目标视觉语言动作模型,其中,在各轮迭代训练中,基于所述待训练的第一视觉语言动作模型输出的各所述机械臂操作视频中各视频帧分别对应的预测策略推理结果,确定策略失败关联视频帧,提高所述策略失败关联视频帧在下一轮迭代训练中的帧权重,每个所述视频帧对应的预测策略推理结果包括机械臂的预测关节角度序列,所述预测关节角度序列包括基于所述视频帧预测的未来视频帧所对应的预测关节角度信息,以及所述视频帧对应的预测关节角度信息,所述策略失败关联视频帧表示使所述待训练的第一视觉语言动作模型生成导致任务执行失败的策略推理结果的视频帧。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京极佳视界科技有限公司,其通讯地址为:102206 北京市昌平区能源东路1号院1号楼3层304-68(集群注册);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励