温州电力设计有限公司普华招标咨询分公司赵舒雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉温州电力设计有限公司普华招标咨询分公司申请的专利基于边缘增强和瓶颈向量的指代图像分割方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120852767B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510857741.X,技术领域涉及:G06V10/26;该发明授权基于边缘增强和瓶颈向量的指代图像分割方法及系统是由赵舒雷;郑晓云;陈建村;王大锋;张扬;夏勤勤;李彬旗;王奔;郑明设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。
本基于边缘增强和瓶颈向量的指代图像分割方法及系统在说明书摘要公布了:本发明公开了一种基于边缘增强和瓶颈向量的指代图像分割方法及系统,涉及指代图像分割技术领域,方法包括:基于多个样本图像以及每个样本图像的文本描述,对渐进式跨模态瓶颈融合网络进行训练,渐进式跨模态瓶颈融合网络中,通过文本编码器对预设样本图像的文本描述进行嵌入表示;在视觉编码器对预设样本图像进行多阶段视觉提取的过程中,利用跨模态注意力融合模块在每个视觉提取阶段的视觉特征中均引入嵌入表示结果;在通过解码器对所有视觉特征进行多阶段解码的过程中,通过局部边缘细化模块生成多个解码阶段的局部边缘增强的特征;利用训练完成的渐进式跨模态瓶颈融合网络能够对目标图像进行精准地指代图像分割。
本发明授权基于边缘增强和瓶颈向量的指代图像分割方法及系统在权利要求书中公布了:1.一种基于边缘增强和瓶颈向量的指代图像分割方法,其特征在于,包括: 基于多个样本图像以及每个样本图像的文本描述,对渐进式跨模态瓶颈融合网络进行训练,得到训练完成的渐进式跨模态瓶颈融合网络,其中,所述渐进式跨模态瓶颈融合网络包括文本编码器、视觉编码器、跨模态注意力融合模块、局部边缘细化模块和解码器,通过所述文本编码器对预设样本图像的文本描述进行嵌入表示,得到嵌入表示结果;在所述视觉编码器对所述预设样本图像进行多阶段视觉提取的过程中,利用所述跨模态注意力融合模块在每个视觉提取阶段的视觉特征中均引入嵌入表示结果,得到每个视觉提取阶段的融合视觉特征;在通过所述解码器对所有视觉特征进行多阶段解码的过程中,通过局部边缘细化模块生成多个解码阶段的局部边缘增强的特征,将每个解码阶段的局部边缘增强的特征作为下个解码阶段的输入,直至得到最后1个解码器的输出,根据最后1个解码器的输出生成所述预设样本图像对应的指代目标分割图,其中,预设样本图像为任一样本图像; 将目标图像以及所述目标图像的文本描述输入所述训练完成的渐进式跨模态瓶颈融合网络,得到所述目标图像对应的指代图像分割结果; 所述嵌入表示结果包括词汇级嵌入,所述视觉编码器包括N个依次排列的网络层; 在所述视觉编码器对所述预设样本图像进行多阶段视觉提取的过程中,利用所述跨模态注意力融合模块在每个视觉提取阶段的视觉特征中均引入嵌入表示结果,得到每个视觉提取阶段的融合视觉特征,包括: 当通过第1个网络层得到第1个视觉提取阶段的视觉特征后,使第1个跨模态注意力融合模块基于注意力机制和瓶颈向量机制,对所述词汇级嵌入和第1个视觉提取阶段的视觉特征进行融合,得到第1个引导特征,基于门控机制抽取第1个引导特征中的上下文信息特征,并将第1个引导特征中的上下文信息特征与第1个视觉提取阶段的视觉特征进行融合,得到第1个视觉提取阶段的融合视觉特征,将第1个视觉提取阶段的融合视觉特征作为第2个网络层的输入,并通过第2个网络层得到第2个视觉提取阶段的视觉特征,使第2个跨模态注意力融合模块基于注意力机制和瓶颈向量机制,对所述词汇级嵌入和第2个视觉提取阶段的视觉特征进行融合,直至得到每个视觉提取阶段的融合视觉特征; 跨模态注意力融合模块具体步骤包括:对于视觉编码器层输出的视觉特征和文本编码器输出的单词嵌入特征,以视觉特征为查询、单词嵌入特征为键和值,进行交叉注意力计算,进行初步跨模态特征融合;利用第一层视觉编码器输出的视觉特征和文本编码器输出的句子级嵌入表示,通过像素级乘法和平均池化,获得初始的瓶颈向量;在每个视觉编码阶段,将本阶段的瓶颈向量分别与视觉特征和单词嵌入进行交叉注意力计算得到的文本特征进行向量拼接,然后分别通过Transformer层进行特征变换以过滤冗余信息;将经过Transformer层处理后的两个特征进行向量分割,对于视觉特征部分进行像素级乘法,用于融入下一层的视觉编码;对于瓶颈向量部分,进行像素级均值计算,作为下一层的瓶颈向量; 所述局部边缘细化模块用于:将接收到的视觉特征进行双分支卷积运算,生成两个中间特征,基于残差空间注意力机制对其中一个中间特征和接收到的解码器的输出进行处理,得到第一处理结果,基于残差空间注意力机制和残差通道注意力机制对另外一个中间特征和所述第一处理结果进行处理,得到第二处理结果,根据所述第一处理结果和第二处理结果确定边缘信息,将所述边缘信息与所述两个中间特征进行自适应融合,生成局部边缘增强的特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人温州电力设计有限公司普华招标咨询分公司,其通讯地址为:325000 浙江省温州市飞霞桥路68号国信大厦22层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励