上海交通大学魏浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海交通大学申请的专利基于计算机视觉的轻量化视频动作理解方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115205753B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210866689.0,技术领域涉及:G06V20/40;该发明授权基于计算机视觉的轻量化视频动作理解方法及系统是由魏浩;甄沛宁;陈海宝设计研发完成,并于2022-07-22向国家知识产权局提交的专利申请。
本基于计算机视觉的轻量化视频动作理解方法及系统在说明书摘要公布了:本发明提供了一种基于计算机视觉的轻量化视频动作理解方法及系统,包括:根据原始RGB图像得到RGB视频帧图像序列;将RGB视频帧图像序列应用于深度光流提取网络提取相邻视频帧之间的光流场;通过深度神经网络提取RGB视频帧图像中的高维空间特征信息以及光流场之间的高维时间序列特征信息;进行特征融合得到混合后的信息融合特征;将混合后的信息融合特征应用于长短时间记忆网络,训练得到用于视频动作理解的时空网络模型;将时空网络模型进行张量化的精简压缩,得到可实时运行的视频分析模型。本发明可运行于低功耗,低空间占用的移动端平台,可有效的节省电力、空间体积等资源消耗;可有效保证视频理解系统的鲁棒性与普适性。
本发明授权基于计算机视觉的轻量化视频动作理解方法及系统在权利要求书中公布了:1.一种基于计算机视觉的轻量化视频动作理解方法,其特征在于,包括: 步骤S1:将短视频序列的图像截取处理为统一大小尺寸的原始RGB图像,根据原始RGB图像得到RGB视频帧图像序列; 步骤S2:将RGB视频帧图像序列通过深度光流提取网络提取相邻视频帧之间的光流场; 步骤S3:通过深度神经网络提取RGB视频帧图像中的高维空间特征信息以及光流场之间的高维时间序列特征信息; 步骤S4:将RGB视频帧图像中的高维空间特征和光流场之间的高维时间序列特征进行特征融合,得到混合后的信息融合特征; 步骤S5:将混合后的信息融合特征应用于长短时间记忆网络,训练得到用于视频动作理解的时空网络模型; 步骤S6:将时空网络模型进行张量化的精简压缩,得到可实时运行的视频分析模型; 在所述步骤S6中: 对训练后的基于长短时间记忆网络的动作理解时空网络模型进行张量化的精简压缩,得到复杂度降低的可实时运行的视频分析模型,其包括如下步骤: 步骤S6.1:对训练后的基于长短时间记忆网络的动作理解时空网络模型的权重参数矩阵和输入特征进高维张量表示,得到张量化的模型参数和输入特征;根据高维张量表示的模型参数和输入特征得到用高维张量表示参数的深度动作理解LSTM模型; 步骤S6.2:对步骤S6.1中的用高维张量表示参数的深度动作理解LSTM模型进行张量列式分解得到权重参数张量列式分解后的深度动作理解LSTM模型; 步骤S6.3:对权重参数张量列分解后的深度动作理解LSTM模型进行模型低比特量化精简得到量化后的深度动作理解LSTM模型;通过逐次渐进低比特量化模型压缩方法,压缩量化后的深度动作理解LSTM模型得到可实时运行的视频模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励