Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学罗锦尚获国家专利权

电子科技大学罗锦尚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学申请的专利一种基于汉字多特征融合词典信息的中文命名实体识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121503482B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610038660.1,技术领域涉及:G06F40/295;该发明授权一种基于汉字多特征融合词典信息的中文命名实体识别方法是由罗锦尚;刘俊修;滕云龙;刘荣幸;李冉设计研发完成,并于2026-01-13向国家知识产权局提交的专利申请。

一种基于汉字多特征融合词典信息的中文命名实体识别方法在说明书摘要公布了:本发明提供了一种基于汉字多特征融合词典信息的中文命名实体识别方法,所述方法基于汉字字符、字形和拼音特征,融合词典信息,构建三个字词序列,通过查表获得字、词的字符嵌入向量,将字拆分成基础部件,将词拆分成字的合成部件,利用卷积神经网络,提取相应的字形嵌入向量,再将字转化为拼音,将词转化为字的声韵母,利用卷积神经网络,提取相应的拼音嵌入向量,最后将字符、字形和拼音嵌入向量进行线性映射,在相应的字词序列,融合相对位置编码,通过改进后的Transformer模型,获得最终的字符、字形和拼音特征向量,拼接所述特征向量,进行线性映射,得到融合特征向量,并通过条件随机场,预测实体标签类型。本发明方案能够提高中文命名实体识别的准确性与效率。

本发明授权一种基于汉字多特征融合词典信息的中文命名实体识别方法在权利要求书中公布了:1.一种基于汉字多特征融合词典信息的中文命名实体识别方法,其特征在于,所述方法包括: 步骤S1,给定输入文本序列,其中,表示中第个字符,并利用开放的中文词库作为词典L,构建具有树形结构的词前缀树; 步骤S2,通过词前缀树,遍历输入序列中所有的字符子序列,将其与词典L进行匹配,找到所有可能匹配词,形成匹配词序列,将匹配词序列拼接在相应文本序列之后,形成字词组合序列; 步骤S3,通过查找嵌入表,得到的字序列的字符嵌入表示和词序列的词嵌入表示,将字符嵌入表示和词嵌入表示进行拼接,得到的字词嵌入特征; 步骤S4,对字序列的字采用基础部件字形拆解,获得字符的字形序列,对词序列的词采用合成部件字形拆分,获得词的字形序列; 步骤S5,将字序列和词序列的字形序列,输入到第一卷积神经网络CNN1,先后进入卷积层、最大池化层,最后通过全连接层进行转换,得到字序列字形嵌入表示和词序列字形嵌入表示,并将字序列字形嵌入表示和词序列字形嵌入表示进行拼接,得到的字形嵌入特征; 步骤S6,通过字音查找表,获得输入序列中字的拼音和声调,对字序列的字采用声母字母、韵母字母和声调的组成方式,获得字符的拼音序列,对于词序列的词采用声母、韵母和声调的组成方式,获得词的的拼音序列; 步骤S7,将字序列和词序列的拼音序列,输入到第二卷积神经网络CNN2,得到字序列和词序列的拼音嵌入表示,并将字序列拼音嵌入表示和词序列拼音嵌入表示进行拼接,得到的拼音嵌入特征; 步骤S8,将序列中所有字、词作为跨度,统一按顺序编号,形成序列,然后利用Transformer编码器进行编码,得到最终的融合特征; 步骤S9,将最终的融合特征输入到条件随机场CRF解码器中,进行序列标注。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。