南通市测绘院有限公司袁春东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南通市测绘院有限公司申请的专利基于置信度计算的地名地址清洗匹配方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120705295B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510858435.8,技术领域涉及:G06F16/334;该发明授权基于置信度计算的地名地址清洗匹配方法及系统是由袁春东;赵嘉旸;齐志飞;龚天宇设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。
本基于置信度计算的地名地址清洗匹配方法及系统在说明书摘要公布了:本发明公开了一种基于置信度计算的地名地址清洗匹配方法及系统,该系统具体包括:待清洗数据输入接口、待清洗数据预处理模块、层级化标准地址库、分词字典库、高频词管理模块、含二次匹配的清洗引擎、置信度计算模块。本发明构建包含二次匹配、标准地址库热更新、高频词介入的地名地址智能清洗匹配系统,克服了传统层级模型在地址清洗匹配中的静态性缺陷,实现了精度提升、效率突破以及资源优化。
本发明授权基于置信度计算的地名地址清洗匹配方法及系统在权利要求书中公布了:1.基于置信度计算的地名地址清洗匹配方法,其特征在于:包括如下步骤: S1、待清洗数据输入:构建数据输入接口,接受用户请求信息后,从输入的地址文件中解析获取待清洗地址文本,记录输入元数据信息; S2、待清洗数据预处理:对输入的待清洗数据进行预处理操作; S3、层级化标准地址库:以权威部门的标准地址数据库为基准,融合别名历史地名数据库多源信息,通过多层级模型表达地址要素间的逻辑关系; S4、分词字典库热更新:当步骤S3层级化标准地址库热更新后,触发本步骤,获取新增地址条目并利用中文分词引擎按照当前字典进行分词处理,在系统内向数据库管理人员推送分词结果,自动识别分词存疑的文本信息,通过人机交互将新增的地址进行标注并加入字典库实现热更新; S5、高频词管理:当用户输入不明确的地址时,由清洗引擎根据相应的高频词信息,实现高频结果优先匹配; S6、初次匹配:对步骤S2预处理后的待清洗数据进行初次匹配; S7、初次匹配结果评价:对步骤S6的初次匹配结果进行评价,决定是否进入二次匹配流程; S8、二次匹配:将初次匹配后剩余的未匹配的地址文本再次进行匹配; S9、置信度计算:匹配流程完成后计算匹配置信度,以反映匹配成果的可靠性;根据时空差异计算匹配置信度,计算方法为:置信度=层级系数×历史地址系数×高频词系数,各系数计算规则如下: 层级系数由匹配结果的最细粒度地址层级决定,根据地址空间定位能力,对城市与农村地址层级系数采用差异化的计算方式; 历史地址系数的默认值为1,当匹配结果为历史地名时,计算历史地名消亡时间与用户查询时间的时间差,利用线性函数将历史地址系数映射至预设区间[0.6,1; 高频词系数默认设置为1,当匹配过程中接收到步骤S5的高频词系数时,因可能出现“异地同名”歧义,使用该值对匹配置信度进行抑制并触发系统提示; 当置信度依照上述公式计算完成时,若仅存在单次匹配结果,直接将置信度与匹配结果向步骤S10输出;若存在二次匹配,则比较两次匹配结果,若初次匹配与二次匹配结果属于同一区县级行政区内,选择置信度更高的结果向步骤S10输出,否则仍以初次匹配结果向步骤S10输出,降低误匹配概率; S10、标准化地址输出:输出符合多层级结构的标准化地址。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南通市测绘院有限公司,其通讯地址为:226000 江苏省南通市崇川区城山路78号金和大厦B301室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励