Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及利用声学模型补偿的用于音素建模和发音建模的HMM解码。描述了用于使用不需要任何WW或命令匹配语音数据进行训练的语音识别系统识别人机接口的说出的唤醒词(WW)或命令的技术。系统在部署前使用WW或命令的文本或图形表示进行训练。该技术包...
  • 本说明书实施例提供讲稿生成模型训练方法、讲题视频的讲稿生成方法及装置,该方法包括:获取样本讲题视频,并基于样本讲题视频确定样本讲稿文本;确定样本讲题视频对应的样本题目信息,基于样本题目信息获取对应的样本解题思路,样本解题思路为样本题目信息的...
  • 本公开涉及人工智能技术领域,提供了一种关键词检测方法、关键词检测装置、计算机可读存储介质、电子设备,其中,关键词检测方法包括:对目标关键词进行文本扰动处理,生成与所述目标关键词易混淆的干扰关键词;构建训练文本集;所述训练文本集包括含有所述目...
  • 本发明涉及语音识别技术领域,具体为一种基于大模型的声学识别精度优化方法,获取信号频谱与波形,对比能量峰值与噪声以完成频段阈值筛取,并依据边界点修整差异超限的相邻幅度曲线,比较高低频噪声强度以抑制较强者,融合能量与幅度曲线并剔除低于能量基准的...
  • 本申请公开了一种音频识别系统及其音频分类装置及分类方法,该分类方法包含:自区分为多个音频类型的多个训练音频档案中,选择任一音频类型作为对应音频类型并撷取区分为对应音频类型的训练音频档案,以对训练音频档案进行音频取样以及特征撷取,并产生多个训...
  • 本发明公开了一种音频重点确定方法、智能笔及存储介质,涉及人工智能技术领域。该方法包括:获取音频流,并获取在所述音频流录制过程中生成的第一时间戳对;根据所述音频流的语义生成语义链,所述语义链中由相互关联的语音语义片段组成,并利用所述第一时间戳...
  • 本发明属于人工智能的技术领域,涉及了多任务学习框架下的语音降噪与语音识别联合优化方法,包括以下步骤:获取包含环境噪声的原始语音信号流;整合两个通道的分析结果,以生成联合上下文情报;依据该联合上下文情报为每一个时间‑频率单元生成包含多个控制维...
  • 本发明提供一种语音识别方法、装置、电子设备及存储介质,在语音助手应用检测到目标唤醒词的情况下,调用AudioRecord采集移动终端原始音频,存储在第一目标缓存区中,从第一目标缓存区中读取原始音频发送至预设降噪算法库对原始音频进行降噪处理,...
  • 本发明公开了一种面向机器学习的压缩率可伸缩语义通信,主要考虑实际面向机器学习任务的语义通信技术,解决信道质量和带宽对通信系统语义传输质量的影响。首先,对图像源进行预处理,用残差卷积神经网络提取出语义特征。其次,通过注意力机制根据信道信噪比调...
  • 本发明涉及人工智能与人机交互技术领域,公开了一种基于知识图谱的数字人语音交互控制方法,包括以下步骤:S1、获取并解析用户语音,得到包含用户意图、实体及属性的结构化语义信息;S2、依据前述语义信息,动态演化一个用于表征当前会话上下文的瞬态情境...
  • 本发明提供一种基于耳机的智能交互方法及系统,方法包括:获取初始语音信号,基于初始语音信号获取加窗帧信号,进而获取去噪语音信号;将去噪语音信号转换为询问文本信息,基于询问文本信息生成候选回复信息,基于知识图谱获取及两者获取聚合询问向量及聚合回...
  • 本申请适用于人工智能技术领域,提供了一种基于对话分析的智能玩具控制方法,该方法包括:接收目标儿童用户的输入数据;通过预设的声学‑文本联合模型对输入数据进行声学预处理,得到声学情绪特征;对声学情绪特征进行模糊匹配与特征映射处理,输出性格特征向...
  • 本申请涉及一种吸奶器的离线语音控制方法、装置、存储介质、计算机程序产品及吸奶器。该方法通过获取用户语音指令,对用户语音指令进行模数转换得到待处理音频数据;提取待处理音频数据的语音特征序列;根据语音特征序列与预先存储在吸奶器中的预设语音识别模...
  • 本申请提供了一种语音识别方法、装置、存储介质及电子设备,该方法应用于语音识别领域,该方法包括:响应于用户输入的语音指令,获取参考文本的文本特征以及所述参考文本对应的参考语音中提取得到与所述参考文本相关的用户声纹特征;从所述语音指令中获取语音...
  • 本发明涉及语音控制技术领域,具体涉及基于云端大模型与声纹识别的跑步机语音控制系统及方法,本发明通过“One‑Shot”机制,在用户开口的第一句话就完成了身份绑定。就像给跑步机装了一把“声纹锁”,只有拿到钥匙(声纹)的人才能控制钥匙孔(执行命...
  • 本发明涉及检测数据处理技术领域,公开了一种结构化检测数据语音录入系统及方法,包括语音采集模块、语音处理模块、规则配置模块、数据匹配模块和数据输出模块;所述语音处理模块内置通用AI语音大模型,用于将语音信息转换为文本信息,并通过过滤工厂环境噪...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音驱动的应用生成方法、装置、设备及介质,包括:接收语音输入并解析生成解析结果,识别用户意图并抽取实体形成意图实体集合,基于意图实体集合生成结构化指令并匹配组件库...
  • 本发明涉及人工智能技术领域,提供一种多模态交互方法、装置、设备及介质,应用于医疗、金融等领域,其方法包括:响应于多模态交互指令,实时获取客户的语音数据;基于提取策略对语音数据进行提取得到意图数据;对意图数据进行整合得到可视化界面数据;基于生...
  • 本发明公开了一种语音个性化定制方法、装置、电子设备及存储介质,涉及车联网大数据技术领域,所述方法包括:执行用户输入的语音指令时,采集用户的面部图像;通过对面部图像的表情分析,判断用户对语音指令的执行结果是否满意;如果用户对执行结果不满意,采...
  • 本申请提供了一种基于车身控制器的新能源车辆辅助控制方法及系统,属于车辆控制领域,解决现有控制架构在感知能力及功能扩展性方面的局限逐渐凸显的问题,上述方法包括:获取车辆的车速信息以及至少一扇车窗的当前开度信息,在车辆处于通风状态且所述车窗处于...
技术分类