中医药广东省实验室刘毓东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中医药广东省实验室申请的专利一种基于深度学习和化学语言的中西药药味预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121726101B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610221771.6,技术领域涉及:G16H70/40;该发明授权一种基于深度学习和化学语言的中西药药味预测方法是由刘毓东;潘胡丹;刘良设计研发完成,并于2026-02-25向国家知识产权局提交的专利申请。
本一种基于深度学习和化学语言的中西药药味预测方法在说明书摘要公布了:本发明提供了一种基于深度学习和化学语言的中西药药味预测方法,包括S1:初始化基于RoBERTa架构的化学语言预训练模型ChemBERTa,作为简化分子线性输入规范表达式的语义编码器;S2:构建涵盖中西药味道信息的标准化药物味道数据集;S3:基于S1模型框架,搭建药味预测的基础预训练模型;S4:采用迁移学习策略,利用S2构建的药味数据集对S3的基础预训练模型进行再训练与域适配,获得药味智能预测模型;S5:利用S4模型进行药物分子的药味预测。该方法实现了药味的深度语义建模,是一种中西药通用、可解释且可扩展的药味智能辨识技术,有助于中西药配伍规律解析以及临床精准用药。
本发明授权一种基于深度学习和化学语言的中西药药味预测方法在权利要求书中公布了:1.一种基于深度学习和化学语言的中西药药味预测方法,其特征在于,包括下列步骤: S1:引入并初始化基于RoBERTa架构的化学语言预训练模型ChemBERTa,所述化学语言预训练模型ChemBERTa经PubChem77M分子语料预训练获得,用作化学分子SMILES结构式的基础语义编码器; S2:获取虚拟味道数据库、分子味道数据库、有机小分子生物活性数据库Pubchem、苦味数据库、辛味数据库、植物分子味道数据库中药物分子的味道和结构式数据,进行去重和PubchemID的匹配,并进行数据合并,构建包括酸味、苦味、甘味、辛味、咸味、淡味六类子数据集的药物味道数据集,并将所得数据集随机划分为训练集、验证集和测试集; S3:在S1获得的初始化的ChemBERTa基础模型的最终输出层之后,构建并叠加一层线性全连接分类层,所述线性全连接分类层的输入维度与预训练模型的隐藏层维度一致,输出维度为药味类别数,获得基于RoBERTa架构的药味预测基础模型,其中,S3中所述线性全连接分类层中,设置有softmax激活函数用于输出药味概率分布值、设定交叉熵损失函数用于评估药味预测准确度,设置有AdamW优化器算法解耦权重衰减和自适应学习率调整,其中,所述softmax激活函数为: , 其中,为模型对第类药味的线性输出;为输入分子属于第类药味的预测概率, 所述交叉熵损失函数为: , 其中,为第类药味的真实标签;用于衡量分类预测与真实标签之间的差异; 所述AdamW优化器中自适应学习率为5×10-4,权重衰减率为1×10-4,同时更新添加的分类层和预训练模型所有层的参数,其参数更新规则为: , 其中,为次迭代的参数,为学习率,为权重衰减系数,和分别为一阶与二阶矩估计,设置为1×10-8用于避免分母为零; S4:将S2获得的药物味道数据集对S3获得的药味预测基础模型进行迁移学习,通过反向传播算法计算损失并微调模型参数,使模型由通用化学语言理解能力适配为特定的药味分类任务,其输出由预测被掩码的token转变为预测药味类别概率,从而获得基于深度学习和化学语言的中西药药味预测模型; S5:通过S4获得的基于深度学习和化学语言的中西药药味预测模型对目标药物分子的药味进行预测,对一个输入分子输出一个六维概率向量,分别对应酸、苦、甘、辛、咸、淡六种味道的预测概率,最终分类结果为概率值最高的药味类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中医药广东省实验室,其通讯地址为:519000 广东省珠海市横琴新区豆蔻路1号粤澳合作中医药科技产业园总部研发办公大楼7-11层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励