常州大学周奂月获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉常州大学申请的专利一种融合词汇边界及语义信息的实体识别及关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115879453B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211458382.3,技术领域涉及:G06F40/284;该发明授权一种融合词汇边界及语义信息的实体识别及关系抽取方法是由周奂月;徐守坤;袁扬;石林;张华君;庄佳设计研发完成,并于2022-11-17向国家知识产权局提交的专利申请。
本一种融合词汇边界及语义信息的实体识别及关系抽取方法在说明书摘要公布了:本发明涉及自然语言处理技术领域,尤其涉及一种融合词汇边界及语义信息的实体识别及关系抽取方法,包括构建预处理语言模型的样本输入及标签;通过BERT模型输出最后一层的特征向量;构建实体识别任务的任务特征向量,并计算损失;构建关系抽取任务相关的任务特征向量计算损失;将两种损失按照系数相加得到总损失;联合实体识别以及关系抽取的结果,得出最后的三元组。本发明解决深度学习方法存在误差积累、实体冗余,交互缺失的问题;以及解决现有嵌套实体基于片段排列的方式显示的提取所有可能的片段排列的问题。
本发明授权一种融合词汇边界及语义信息的实体识别及关系抽取方法在权利要求书中公布了:1.一种融合词汇边界及语义信息的实体识别及关系抽取方法,其特征在于,包括以下步骤: 步骤一、构建预处理语言模型的样本输入及标签; 步骤二、将样本输入预训练BERT模型,通过BERT模型输出最后一层的特征向量; 步骤三、构建实体识别任务的任务特征向量,由句子最大池化后的特征、预测片段边界词元特征、及样本末尾拼接的边界特征进行拼接得到,特征向量送入NER分类器得到分类结果并计算损失; 步骤三具体包括: 步骤31、将词向量特征信息进行最大池化得到,计算公式为: ; 步骤32、对部分特征向量进行拼接得到任务特征向量,计算公式为: , 其中,cat表示concatenate操作,表示预测实体片段的首位置信息特征,表示预测实体片段的尾位置信息特征,表示为样本末尾添加的待预测片段的首位置信息特征,表示为样本末尾添加的待预测片段的尾位置信息特征,通过组合一次识别m个候选片段; 步骤33、将送入NER分类器,得到实体类型为的预测结果,公式为: , 其中,表示为实体抽取和关系抽取的任务模型的可训练参数,表示为实体的类型,表示为实体类型集合; 步骤34、计算NER部分的交叉熵损失,公式为: , 其中,表示是否为当前类别; 步骤四、构建关系抽取任务相关的任务特征向量,由句向量、待预测主体片段的边界特征、待预测的客体片段的边界特征进行拼接得到,送入RE分类器得到分类结果并计算损失; 步骤五、将损失与损失按照系数相加得到总损失; 步骤四具体包括: 步骤41、对部分特征向量进行拼接得到任务特征向量,公式为: ], 其中,cat表示为concatenate操作,表示为预训练语言模型输出的[CLS]句特征向量;表示为主体片段a的首位置特征,表示为主体片段a的尾位置特征,表示为候选客体片段的首位置特征,表示为候选客体片段的尾位置特征; 步骤S42、将送入RE分类器,得到主体片段a与客体片段b之间的关系类型为的预测结果,公式为: , 其中,表示为模型可训练的参数,表示为关系的类型,表示为关系类型的集合; 步骤43、计算RE部分的交叉熵损失,公式为: , 其中,表示分词后的文本语句中共包含n个词元,表示是否为当前类别; 步骤六、联合实体识别以及关系抽取的结果,得出三元组。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人常州大学,其通讯地址为:213164 江苏省常州市武进区滆湖中路21号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励