Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学李帅获国家专利权

杭州电子科技大学李帅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利基于两阶段深度学习网络的场景手写文本擦除方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119418352B

龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411507790.2,技术领域涉及:G06V30/224;该发明授权基于两阶段深度学习网络的场景手写文本擦除方法是由李帅;邵李焕;郑晓隆设计研发完成,并于2024-10-28向国家知识产权局提交的专利申请。

基于两阶段深度学习网络的场景手写文本擦除方法在说明书摘要公布了:本发明公开了基于两阶段深度学习网络的场景手写文本擦除方法,包括以下步骤:S1,构建一个包含若干种场景的手写文本擦除数据集,并将数据集划分为训练集、验证集和测试集;S2,构建一个两阶段生成器‑判别器网络用于训练数据集,得到训练好的网络模型。本发明构建一个包含大量复杂背景的场景手写文本擦除数据集进行训练,通过构建的两阶段生成对抗网络对图像中手写文本进行擦除。实现了图像中手写文本完整擦除,背景图像修复的任务。

本发明授权基于两阶段深度学习网络的场景手写文本擦除方法在权利要求书中公布了:1.一种基于两阶段深度学习网络的场景手写文本擦除方法,其特征在于,包括以下步骤: S1,构建一个包含若干种场景的手写文本擦除数据集,并将数据集划分为训练集、验证集和测试集; S2,构建一个两阶段生成器-判别器网络用于训练数据集,得到训练好的网络模型; 在所述S2后,还包括:S3,将训练好的网络模型进行验证实验,分别用构建的手写文本擦除数据集和其他若干种文本擦除数据集进行验证试验,并与其他若干种网络模型进行对比实验; 所述S1包括以下步骤: S11,构建的数据集包含两种类型的图像,第一种是通过生成文本与原始图像进行融合的图像,第二种是将图像上原有的手写文本进行人工标识并擦除; S12,利用手写字体生成器,随机生成若干含有随机字迹手写文本的不同尺寸图像,手写文本分布在整张图像的随机位置、随机大小,图像中只包含手写文本,字体为黑色或彩色,背景为纯白; S13,收集若干种背景图像,包括单一背景和多重背景,然后通过对两个图像进行噪声消除,将两种图像进行尺寸对比,以匹配手写文本与背景图像,将图像进行融合,生成含有手写文本的图像;此时每一组数据图像包括含有手写文本的图像、只含有手写文本图像和只包含背景的图像; S14,收集若干种含有手写文本的原始图像,通过图像修复方法,将手写文本擦除并填充背景;此时每一组数据包含含有手写文本的原始图像和去除手写文本的背景图像;再通过将此两种图像作差并进行噪声消除,得到只包含手写文本的图像; S15,构建的数据集包含千组以上图片,每组图片包括三种类型:带手写文本的图像、擦除手写文本后的参考图像和手写文本掩码图像,该千组以上图片中80%用于训练,10%用于验证,5%用于测试;所述S2包括以下步骤: S21,在网络的生成器阶段,通过设计的多尺度特征融合注意力机制对图像中的手写文本进行定位,来帮助初步擦除阶段网络识别手写文本并擦除,通过初步擦除阶段的图像还包含若干未擦除的手写文本,将其视为图像噪声,通过迭代噪声去除网络将图像进行再擦除,其中设计了一个多尺度特征提取模块用于提取图像特征,最后得到擦除手写文本后的图像; S22,网络判别器阶段,将生成器生成的图像与真实擦除手写文本的图像输入到预训练的VGG特征提取网络提取特征进行对比分析,通过两者的差别分析进一步通过生成器网络生成擦除图像; 所述S21中的多尺度特征融合注意力机制包括将输入特征层使用不同采样率的多个并行空洞卷积层捕捉不同尺度的上下文信息进行加权融合增强特征图的表示能力,然后通过平均池化和最大池化和多层感知机操作获得通道维度上的两个特征,将两个特征进行相加,再通过激活函数调整特征维度得到通道维度特征,最后再通过池化和卷积层操作获得空间维度特征,将通道维度特征和空间维度特征相乘并调整维度,得到经过处理后的输出特征; 所述S21中的多尺度特征融合注意力机制过程可由以下公式表示: ; ; ; ; 其中,X表示输入到模块的特征,Y1表示经过空洞卷积后的特征,AiX表示空洞卷积率为i的特征图;U表示Mc函数的输入,其中σ表示Sigmoid激活函数;W1和W0分别表示两个卷积操作;Umax和Uavg表示对特征进行最大池化和平均池化;f7*7表示卷积核大小为7*7的卷积操作,最终经过模块整合得到的输出特征为Y。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。