Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京神州泰岳软件股份有限公司刘鹏获国家专利权

北京神州泰岳软件股份有限公司刘鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京神州泰岳软件股份有限公司申请的专利一种基于多模态大模型的数字人生成方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120107427B

龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510569988.1,技术领域涉及:G06T13/40;该发明授权一种基于多模态大模型的数字人生成方法和装置是由刘鹏;韩文静;王晓君;陈阵;郑欣欣设计研发完成,并于2025-05-06向国家知识产权局提交的专利申请。

一种基于多模态大模型的数字人生成方法和装置在说明书摘要公布了:本申请提供了一种基于多模态大模型的数字人生成方法和装置,涉及数字人生成技术领域,突破了传统基于姿态关键点或三维表示的生成局限性,能生成在目标部位表现细腻自然的数字人形象。方法包括:获取用户输入的多模态数据并基于多模态大模型进行意图识别和情感分析,确定响应文本数据对应的音频序列数据;获取参考图像数据的视觉特征向量表示;根据人物的目标部位在参考图像数据中的位置,确定目标部位对应的掩码特征向量表示;基于扩散模型依据音频序列数据、视觉特征向量表示、掩码特征向量表示,对至少一个噪声向量表示进行去噪处理,生成至少一帧数字人的图像数据;根据至少一帧数字人的图像数据和音频序列数据,生成带有语音的数字人动画。

本发明授权一种基于多模态大模型的数字人生成方法和装置在权利要求书中公布了:1.一种基于多模态大模型的数字人生成方法,其特征在于,包括: 获取用户输入的多模态数据; 基于多模态大模型对所述多模态数据进行意图识别和情感分析,确定响应文本数据; 根据所述响应文本数据确定对应的音频序列数据; 获取参考图像数据的视觉特征的向量表示,所述参考图像数据的内容包含人物和背景; 根据所述人物的目标部位在所述参考图像数据中的位置,确定对应的掩码图像数据; 基于区域指导模型分析所述掩码图像数据中掩码区域的特征,得到所述目标部位对应的掩码特征的向量表示,所述掩码区域为所述目标部位在所述掩码图像数据中对应的区域; 基于扩散模型依据所述音频序列数据、所述参考图像数据的视觉特征的向量表示、所述目标部位对应的掩码特征的向量表示,对至少一个噪声向量表示进行去噪处理,生成至少一帧数字人的图像数据,所述噪声向量表示是通过对所述参考图像数据的视觉特征的向量表示进行加噪得到的,其中,所述基于扩散模型依据所述音频序列数据、所述参考图像数据的视觉特征的向量表示、所述目标部位对应的掩码特征的向量表示,对至少一个噪声向量表示进行去噪处理,生成至少一帧数字人的图像数据,包括: 将所述目标部位对应的掩码特征的向量表示和至少一个噪声向量表示相加,得到至少一个初始数字人图像数据的向量表示; 基于扩散模型依据所述音频序列数据、所述参考图像数据的视觉特征的向量表示,对所述至少一个初始数字人图像数据的向量表示进行去噪处理,得到至少一个数字人的图像数据的向量表示,所述扩散模型为去噪U型网络模型; 对所述至少一个数字人的图像数据的向量表示进行解码,生成至少一帧数字人的图像数据; 根据所述至少一帧数字人的图像数据和所述音频序列数据,生成带有语音的数字人动画。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京神州泰岳软件股份有限公司,其通讯地址为:100080 北京市海淀区海淀大街34号8层818室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。