合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)佘骏晖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)申请的专利基于分层监督的跨模态凝视目标估计方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121640552B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610155236.5,技术领域涉及:G06V40/16;该发明授权基于分层监督的跨模态凝视目标估计方法、系统及介质是由佘骏晖;杨勋;段章领设计研发完成,并于2026-02-04向国家知识产权局提交的专利申请。
本基于分层监督的跨模态凝视目标估计方法、系统及介质在说明书摘要公布了:本发明公开了基于分层监督的跨模态凝视目标估计方法、系统及介质,涉及计算机视觉技术领域,对所获取RGB图像中的目标人物添加人脸框坐标标注后输入到凝视目标模型中,据以生成对应的凝视目标估计热图;凝视目标模型的训练过程如下:构建训练集并进行特征提取得到原始视觉特征和原始文本特征,同时生成人脸掩码以及强化后视觉特征;对原始文本特征和强化后视觉特征编码后拼接;将拼接得到的拼接特征序列输入到跨模态Transformer,将强化后视觉特征与跨模态Transformer输出的视觉特征残差连接,生成凝视目标估计热图;设置分层监督损失,以优化模型参数;该方法提升了目标估计精度。
本发明授权基于分层监督的跨模态凝视目标估计方法、系统及介质在权利要求书中公布了:1.基于分层监督的跨模态凝视目标估计方法,其特征在于,对所获取RGB图像中的目标人物添加人脸框坐标标注后输入到凝视目标模型中,据以生成对应的凝视目标估计热图; 凝视目标模型的训练过程如下: 构建包含人脸凝视图像和文本描述的训练集; 对训练集进行特征提取得到原始视觉特征和原始文本特征,并生成人脸掩码; 将人脸掩码与原始视觉特征逐元素相乘得到强化后视觉特征,对原始文本特征和强化后视觉特征编码后拼接; 将拼接得到的拼接特征序列输入到跨模态Transformer,将强化后视觉特征与跨模态Transformer输出的视觉特征残差连接,生成凝视目标估计热图; 计算跨模态Transformer每层输出的文本Token与原始文本特征的均方误差,所有层的均方误差加权求和作为分层监督损失,以优化模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室),其通讯地址为:230026 安徽省合肥市高新区望江西路5089号, 中国科学技术大学先进技术研究院未来中心B1205-B1208;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励