江西省水投江河信息技术有限公司李志珍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西省水投江河信息技术有限公司申请的专利一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120823533B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511329017.6,技术领域涉及:G06V20/17;该发明授权一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统是由李志珍;黄志坚;章文;杨俊;彭雪康设计研发完成,并于2025-09-17向国家知识产权局提交的专利申请。
本一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统在说明书摘要公布了:本发明公开了一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统,包括以下步骤:S1、多源数据采集与预处理:采用无人机与地面设备采集图像视频数据,对数据进行降噪、增强以及时空对齐处理;S2、改进YOLO目标检测:优化网络结构与训练策略;S3、VLM后链路分析:采用VLM实现目标场景关联判断;S4、报告生成。本发明通过设置YOLO与VLM融合的水库安全智能巡检方法及系统;利用视觉语言大模型所具备的跨模态语义理解、零样本推理及视频全局分析能力,将其作为YOLO的后处理工具,并与其相互融合并行工作,可实现“目标检测‑语义分析‑报告生成”的全流程智能化,有效解决现有技术问题,增强水利工程安全监测系统的全面性。
本发明授权一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统在权利要求书中公布了:1.一种基于YOLO与VLM融合的水库安全智能巡检方法,其特征在于:包括以下步骤, S1、多源数据采集与预处理: 采用无人机与地面设备采集图像视频数据,对数据进行降噪、增强以及时空对齐处理; S2、改进YOLO目标检测: 优化网络结构与训练策略,实现无人机场景下对坝体裂缝、漂浮物目标的高精度检测; S3、VLM后链路分析: 提取步骤S2中目标的视觉特征向量,同时提取整幅图像的全局视觉特征向量,构建含水库巡检核心语义概念的文本词典,采用VLM实现目标场景关联判断、零样本目标识别及视频时序理解; S4、报告生成: 基于检测结果与语义分析,生成含隐患信息、风险评估及处置建议的结构化报告; 在步骤S2中,具体包括: 网络结构优化:在YOLOv8架构基础上,将backbone部分卷积替换为深度可分离卷积以减少参数量,在neck部分新增注意力模块,增强对小尺寸坝体裂缝目标的特征提取能力; 训练策略优化:构建含坝体裂缝、漂浮物的多类目标的水库巡检专用数据集,采用余弦退火学习率策略结合FocalLoss损失函数进行模型训练,直至验证集准确率稳定; 目标检测执行:将预处理后的数据集输入改进的YOLO模型,设置合理置信度与IOU阈值,通过非极大值抑制去除重复检测框,实现坝体裂缝、漂浮物、违规人员的目标检测,输出目标类别、边界框坐标及置信度; 在步骤S3中,具体包括: 目标场景关联判断:计算目标ROI视觉特征向量与场景关键区域文本嵌入向量的余弦相似度,相似度达到设定阈值时判定目标与场景关联; 零样本目标识别:对未检测到的未知目标,提取其ROI视觉特征向量,与文本词典候选类别文本嵌入向量计算距离,选取距离最小的类别作为识别结果,无需额外训练; 视频时序理解:对连续多帧视频检测结果,分析目标运动轨迹和状态变化,输出目标时序关联信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西省水投江河信息技术有限公司,其通讯地址为:330000 江西省南昌市南昌高新技术产业开发区紫阳大道3399号云中城A#办公楼39楼3905室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励