Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京航空航天大学马鑫烨获国家专利权

南京航空航天大学马鑫烨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京航空航天大学申请的专利一种基于强化学习的巡检机器人最近点搜索与导航方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115903771B

龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211168493.0,技术领域涉及:G05D1/43;该发明授权一种基于强化学习的巡检机器人最近点搜索与导航方法是由马鑫烨;曾庆喜;宋雨昕;王荣琛;胡义轩设计研发完成,并于2022-09-19向国家知识产权局提交的专利申请。

一种基于强化学习的巡检机器人最近点搜索与导航方法在说明书摘要公布了:本发明提供了一种基于强化学习的巡检机器人最近点搜索与导航方法,包括:步骤1:设定巡检机器人需要巡检两处路线A和B;步骤2:获得当前巡检机器人的初始位置坐标,开启激光雷达;步骤3:获取巡检机器人当前的偏航角,巡检机器人直走m秒,获得此时的巡检机器人位置坐标,统一坐标系;步骤4:选取最近路径点作为循迹的初始点;步骤5:将初始点与下一个路径点之间连线,得到相对于imu坐标系的角度,控制巡检机器人点到点的移动;步骤6:当完成巡检路线A的巡检时,开始巡检路线B,使用强化学习算法选取距离路线B的最近路径点作为巡检的初始点。本发明方法具有较高效率与精度,大幅降低了现有技术计算的复杂度。

本发明授权一种基于强化学习的巡检机器人最近点搜索与导航方法在权利要求书中公布了:1.一种基于强化学习的巡检机器人最近点搜索与导航方法,其特征在于,包括以下步骤: 步骤1:设定巡检机器人需要巡检两处路线A和B; 步骤2:通过车载GNSS-RTK获得当前巡检机器人的初始位置坐标x1,y1,并开启激光雷达; 步骤3:车载imu惯性测量单元获取到巡检机器人当前的偏航角,巡检机器人直走m秒,获得此时的巡检机器人位置坐标x2,y2,计算RTK与imu坐标系的角度差为arctany2-y1x2-x1,从而统一坐标系; 步骤4:使用强化学习算法选取最近路径点作为循迹的初始点; 步骤4包括: 步骤4-1,建立并初始化一个空的容量为N的数据库D存储优化过程中的数据和轨迹; 步骤4-2,设置训练次数为H; 步骤4-3,建立并初始化神经网络Q,用来近似当前选择的最近路径点的动作价值函数,随机生成神经网络的参数w1; 步骤4-4,建立并初始化另一个与Q相同结构的神经网络T,用来产生目标动作价值作为当前神经网络Q网络优化的依据,设定与Q相同的参数w2=w1; 步骤4-5,利用车载RTK获得巡检机器人当前时刻状态state的值为St,St表示当前位置; 步骤4-6,将最近路径点逼近过程通过时间间隔离散为等间隔的M个时间点; 步骤4-7,返回步骤4-5继续执行训练过程,直到完成H次的训练任务; 步骤4-6-1,利用激光雷达采集周围环境点云数据,将激光返回的距离数据小于或等于N1米的判定为障碍物点云,对障碍物点云聚类处理,对获取的聚类结果进行计算得到巡检机器人能够安全通过的区域范围边界; 步骤4-6-2,通过障碍物范围边界得到相对于车身位置的左偏航角度与右偏航角度,分别计算当前位置St与路径坐标点的偏航角,表示当前位置St与路径第k个坐标点的偏航角; 将分别与、对比,并将,的路径点放入约束集合E,如果激光雷达未检测到障碍物,则; 步骤4-6-3,利用贪婪策略在约束集合中搜索并生成当前选择的最近路径点,t取值为1~M; 步骤4-6-4,使用PID算法,将当前位置St与最近路径点之间连线,得到相对于imu坐标系的角度,将角度作为pid的控制量,控制巡检机器人点到点的移动一段时间;接收奖励reward的值为rt,rt为当前位置与选定最近路径点欧几里得距离的倒数,rt=,并通过车载RTK接收位置状态state的新的值为St+1; 步骤4-6-5,收集历史数据,,rt,St+1存入数据库D中; 步骤4-6-6,从数据库D中随机抽取一个样本djSj,,rj,Sj+1,j取值为1~M,并且j≠t; 步骤4-6-7,将样本djSj,,rj,Sj+1输入神经网络Q生成当前价值,Q为的函数; 步骤4-6-8,同时将样本djSj,,rj,Sj+1输入神经网络T生成目标价值yj,用来作为目标监督神经网络Q的优化; 步骤4-6-9,计算yj与的差值,求解的梯度; 步骤4-6-10,对于参数w1使用梯度下降法进行更新,,其中为学习率; 步骤4-6-11,每隔C步更新神经网络T参数,令w2=w1,C为正实数; 步骤5:使用PID算法,将初始点与下一个路径点之间连线,得到相对于imu坐标系的角度,将角度作为PID的控制量,控制巡检机器人点到点的移动; 步骤6:当完成巡检路线A的巡检时,开始巡检路线B,使用强化学习算法选取距离路线B的最近路径点作为巡检的初始点。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:211106 江苏省南京市江宁区将军大道29号南京航空航天大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。