中债金科信息技术有限公司;清华大学华娇娇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中债金科信息技术有限公司;清华大学申请的专利一种面向金融的语言情感分析和标注方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116578697B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310283869.0,技术领域涉及:G06F16/353;该发明授权一种面向金融的语言情感分析和标注方法是由华娇娇;唐华云;周泽龙;万海;赵曦滨;商丽丽;王延昭;黄鑫玉设计研发完成,并于2023-03-22向国家知识产权局提交的专利申请。
本一种面向金融的语言情感分析和标注方法在说明书摘要公布了:本发明公开了一种面向金融的语言情感分析和标注方法,本发明涉及机器学习技术领域,其中包括:获取待分析的舆情文本;根据预设文字索引表,确定所述舆情文本中每个字符对应的索引;根据所述每个字符对应的索引,确定所述舆情文本对应的输入向量矩阵;将所述舆情文本对应的输入向量矩阵输入至预设舆情分析模型中进行文本情感分类,得到所述舆情文本对应的情感分类结果,其中,在所述预设舆情分析模型的精调训练过程中对舆情训练样本进行局部文字遮挡;基于所述情感分类结果对所述舆情文本进行情感极性标注。本发明能够提高海量舆情文本数据的分析效率和精度。
本发明授权一种面向金融的语言情感分析和标注方法在权利要求书中公布了:1.一种面向金融的语言情感分析和标注方法,其特征在于,包括: 获取待分析的舆情文本; 根据预设文字索引表,确定所述舆情文本中每个字符对应的索引; 根据所述每个字符对应的索引,确定所述舆情文本对应的输入向量矩阵; 将所述舆情文本对应的输入向量矩阵输入至预设舆情分析模型中进行文本情感分类,得到所述舆情文本对应的情感分类结果,其中,在所述预设舆情分析模型的精调训练过程中对舆情训练样本进行局部文字遮挡; 基于所述情感分类结果对所述舆情文本进行情感极性标注; 其中,所述预设舆情分析模型包括增强语义向量提取模型和情感分类模型,所述增强语义向量提取模型包括注意力层,所述将所述舆情文本对应的输入向量矩阵输入至预设舆情分析模型中进行文本情感分类,得到所述舆情文本对应的情感分类结果,包括: 将所述输入向量矩阵分别与所述注意力层的相应权重矩阵相乘,得到所述输入向量矩阵对应的查询向量矩阵、键向量矩阵和值向量矩阵; 根据所述查询向量矩阵、所述键向量矩阵和所述值向量矩阵,计算所述注意力层输出的注意力矩阵; 根据所述注意力矩阵,确定所述舆情文本中每个字符对应的增强语义向量; 将所述每个字符对应的增强语义向量输入至所述情感分类模型中进行情感分类,得到所述舆情文本对应的情感分类结果; 其中,在所述将所述舆情文本对应的输入向量矩阵输入至预设舆情分析模型中进行文本情感分类,得到所述舆情文本对应的情感分类结果之前,所述方法还包括: 收集舆情数据样本; 对所述舆情数据样本进行预处理,得到预处理后的舆情数据样本; 根据所述预处理后的舆情数据样本,确定所述舆情训练样本; 获取初始增强语义向量提取模型和初始情感分类模型,所述初始增强语义向量提取模型已经过预训练; 将所述舆情训练样本对应的输入向量矩阵输入至所述初始增强语义向量提取模型的注意力层进行处理,得到舆情训练样本对应的初始注意力矩阵; 对所述初始注意力矩阵进行调整,得到调整后的初始注意力矩阵;具体包括:随机确定所述舆情训练样本中的遮挡字符;根据所述遮挡字符和非遮挡字符,构建遮挡矩阵,其中,在所述遮挡矩阵中所述遮挡字符所在位置的数值为1,非遮挡字符所在位置的数值为0;利用所述遮挡矩阵,对所述初始注意力矩阵进行调整,得到调整后的初始注意力矩阵; 根据所述调整后的初始注意力矩阵,确定所述舆情训练样本中每个字符对应的初始增强语义向量; 将所述舆情训练样本中每个字符对应的初始增强语义向量输入至所述初始情感分类模型中进行情感分类,得到所述舆情训练样本对应的预测情感分类结果; 根据所述预测情感分类结果和所述舆情训练样本对应的实际情感分类结果,对所述初始增强语义向量提取模型和所述初始情感分类模型进行联合迭代训练,重复模型迭代训练过程,直至满足预设条件时,停止迭代训练,输出训练好的增强语义向量提取模型和情感分类模型; 根据所述增强语义向量提取模型和所述情感分类模型,确定所述预设舆情分析模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中债金科信息技术有限公司;清华大学,其通讯地址为:101119 北京市通州区宋庄镇壁富路与徐尹路交叉口(汇天云端产业园8号楼);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励