深圳百昱达科技有限公司沈三贵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳百昱达科技有限公司申请的专利基于语音识别的智能老人语音助手系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121096321B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511175023.0,技术领域涉及:G10L15/06;该发明授权基于语音识别的智能老人语音助手系统及方法是由沈三贵;陈亮中;帅衡良设计研发完成,并于2025-08-21向国家知识产权局提交的专利申请。
本基于语音识别的智能老人语音助手系统及方法在说明书摘要公布了:本发明公开了基于语音识别的智能老人语音助手系统及方法,涉及智能语音识别技术领域,用于解决当前现有系统缺乏动态适应机制,传统语音识别系统采用统一模型训练,往往无法考虑不同老年人的语音生理特征,如声带老化、发音模糊等问题;采用了基于MFCC梅尔频率倒谱系数的k均值聚类方法,将老人语音数据划分为具有相似特征的多个簇;采用了数据分布形态和噪声比例综合监控的动态聚类分析方法,确定更新聚类的触发条件;将每个簇分别进行语音识别模型的训练,确定每个簇的最佳模型参数;该技术综合了特征提取、聚类分析和评分函数等数据分析方法,使得语音识别系统能够通过语音生理特征动态建模,实现高龄人群语音识别准确率提升。
本发明授权基于语音识别的智能老人语音助手系统及方法在权利要求书中公布了:1.一种基于语音识别的智能老人语音助手系统,其特征在于,包括: 特征提取模块,用于对输入的老年用户语音信号进行MFCC特征提取,包括预加重、分帧、加窗、快速傅里叶变换、梅尔滤波器组能量计算、对数运算、离散余弦变换及一阶与二阶差分处理,生成包含MFCC系数统计量的数据集; 动态聚类模块,采用k均值聚类算法将语音数据划分为多个簇,并根据预设触发条件启动重新聚类;所述预设触发条件通过评分函数综合评估噪声比例与数据分布形态的统计差异,所述动态聚类模块的触发条件包括所述评分函数的计算结果超过历史评分值的预设分位数 所述评分函数定义为:;式中,为当前批次数据的噪声比例,为历史噪声比例的均值,为历史噪声比例的标准差,D为KS统计量;α和β分别是噪声比例标准化值以及KS统计量的权重, 模型训练模块,用于在触发重新聚类后,对每个新簇进行等比例抽样生成训练数据,并基于抽样数据训练多个语音识别模型,每个模型对应不同簇的最优参数; 语音识别模块,根据用户语音所属的簇调用对应的语音识别模型进行识别,所述模型基于ONNX格式实现推理加速; 所述噪声比例的计算方法为: 对于当前批次数据,若数据点到所属簇质心的距离超过3倍簇内距离标准差,则判定为噪声点,噪声比例η=噪声点数N,其中,N为当前批次数据总量; 所述α和β通过以下步骤确定: 构建包含噪声比例标准化值Z与KS统计量D的数据矩阵; 计算数据矩阵的协方差矩阵并提取最大特征值对应的特征向量; 对特征向量归一化后得到α和β。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳百昱达科技有限公司,其通讯地址为:518000 广东省深圳市宝安区西乡街道南昌社区南昌工业区6号3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励