Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中电汇智科技有限公司张文斌获国家专利权

北京中电汇智科技有限公司张文斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中电汇智科技有限公司申请的专利一种OCR文字识别方法、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115457565B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211110305.9,技术领域涉及:G06V30/148;该发明授权一种OCR文字识别方法、电子设备及存储介质是由张文斌;黄伟;贾瑶设计研发完成,并于2022-09-13向国家知识产权局提交的专利申请。

一种OCR文字识别方法、电子设备及存储介质在说明书摘要公布了:本发明公开了一种OCR文字识别方法、电子设备及存储介质,获取待识别的文本数据,文本数据进行预处理得到文本图像,文本图像提取特征信息并标注数据进行训练得到相应训练模型,根据训练模型对文本图像的文本区域进行预测定位并剪裁,通过图片的旋转矫正模型对文本图像进行旋转矫正得到目标文本图像,对目标文本图像中的文字进行切分得到字符区域,将字符区域上的点垂直映射到最下方的位置,将每个位置点上的统计结果作为切分字符的标准,使文本中的多字符切分成单字符,根据切分好的单字符送入OCR识别引擎进行文字识别,输出被识别的文字,对文本图像中的文字进行快速切分和精确识别,从而提高了OCR文字识别效率。

本发明授权一种OCR文字识别方法、电子设备及存储介质在权利要求书中公布了:1.一种OCR文字识别方法,其特征在于,包括以下步骤: 获取待识别的文本数据,并对文本数据进行预处理得到文本图像; 基于神经网络对文本图像提取特征信息并标注数据进行训练得到相应训练模型,根据训练模型对文本图像的文本区域进行预测定位并剪裁,通过图片的旋转矫正模型对文本图像进行旋转矫正得到目标文本图像; 对目标文本图像中的文字进行切分得到字符区域,将字符区域上的点垂直映射到最下方的位置,统计垂直投影后的最下方每个位置上黑色像素点的个数,将每个位置点上的统计结果作为切分字符的标准,使文本中的多字符切分成单字符; 根据切分好的单字符送入OCR识别引擎进行文字识别,输出被识别的文字; 将字符区域上的点垂直映射到最下方的位置,包括: S20:垂直投影后,统计目标文本图像中每个位置上黑色像素点的个数; S21:根据黑色像素点个数进行初步字符切分,并记录切分位置和切分结果的宽度; S22:找出切分结果宽度的众位数,作为目标文本图像中切分目标字符的宽度,其依据印刷体文字具有相同的字符宽度; S23:根据第三步的众位数值,验证S21中的宽度,若相差大且计算宽度超出宽度众位数值的三分之二,则确定字符存在重叠部分,需要做进一步切分操作,执行下述S24,反之,确定字符宽度正常; S24:使用计算宽度除以宽度众位数,并向上取整得到结果将其作为循环次数,获取重叠区域包含的字符个数,在相邻两个字符中心位置附近,查找具有最小投影点的位置并将其作为重叠字符的切分位置; 通过图片的旋转矫正模型对文本图像进行旋转矫正得到目标文本图像,包括: 对文本图像中的文本进行行合并,选取长度大的文本进行文本识别得到其置信度,经过与置信度阈值对比后判断其是否为正立的文字; 预设置信度阈值为0.5,若文本经过文本识别模型识别的置信度小于0.5,则确定该文本是倒立的;反之,若置信度大于0.5,则确定文本是正立的; 其中,合并文本框的过程中,将文本的所有文本框安装好左上角点纵坐标从小到大排序即纵坐标相同则按照横坐标从小到大排序;在y方向上通过不断增加y方向的值来对文本框进行是否在某一行的判定,待找出若干行后,再对每一行按照x方向进行文本框排序后,按从左往右的顺序合并每一行的文本框; 采用模板切分法得到单字符,包括: 获取第一个字符的左边界,向量V保存着每一列的字符像素,V中第一个为第一个字符模板的左边界位置,确定第二个字符模板的左边界,从文本行中文字的排列位置上得到,排列位置大于第一个字符模板的右边界位置,且同时满足; 第三个以及之后的字符模板左边界的确定过程重复第二个字符的处理过程即可,字符模板左边界的确定过程表达式为;后续字符的左边界表达式为,其中表示第j个字符的左边界,表示第j个字符的右边界; 设定右边界响应函数为,根据后续字符的左边界表达式构建字符模板响应函数的表达式为,其中表示健壮因子用于提高字符模板内部响应函数值的影响度,L为字符左边界,r为字符右边界; 通过改变字符模板的右边界位置,逐渐增大字符模板宽度,计算对应的函数响应值,当取到极大值时,当前的模板的左右边界位单个字符的左右边界。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中电汇智科技有限公司,其通讯地址为:100000 北京市海淀区北四环西路52号8层808;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。