Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例公开了一种音频处理方法、装置以及电子设备。在该方法中,在获取输入音频的第一音频特征后,可以通过时长规整器以及目标风格编码,对第一音频特征进行时长处理,以得到时长调整后的音频特征,然后通过风格变换器以及目标风格编码,对时长调整后的...
  • 本发明涉及语音生成技术领域,具体为一种用于随身AI伴侣的拟人化语音生成方法及系统,包括以下步骤:通过随身设备麦克风阵列采集外部环境声音模拟信号,获取环境声学谐波特征集,存储所述环境声学谐波特征集,得到环境频谱特征数据。本发明中,声道规整卷曲...
  • 本发明公开了一种具有声纹隐私保护功能的麦克风设计方法,属于语音隐私保护技术领域,包括:S1:训练语义特征提取模型;S2:根据语义特征提取模型,确定指定说话人语义特征的频谱分布,得到语义特征对应的频带;S3:根据语义特征对应的频带,设计麦克风...
  • 本发明公开了一种基于黄唇鱼合唱行为的产卵场被动声学调查方法,步骤S1通过构建包含定点和拖曳考察模式的双模式联合声学调查体系,结合了定点监测模式监测时间长和拖曳考察模式覆盖范围广的优点,利用定点监测模式采集的定点水下声学数据来弥补拖曳考察模式...
  • 本发明提供了一种音频数据处理方法、系统、电子设备及存储介质,该方法为:调用音频采集设备进行生物声音频的采集,以得到待处理音频数据;将待处理音频数据切分为多个音频片段;计算音频片段的累积百分数声级;利用累积百分数声级,计算音频片段的信噪比;根...
  • 本发明公开了用于白噪音设备的婴儿啼哭声识别方法,涉及音频处理与智能声学识别领域,包括:采集纯净参考信号、第一路信号及第二路信号进行同步与预处理,基于第一路信号得到混合音频信号;通过自适应回声消除算法计算得到残差信号;基于残差信号、纯净参考信...
  • 本申请涉及一种说话人识别方法、计算机设备、存储介质和计算机程序产品,涉及语音识别技术领域。所述方法包括:基于聚类模型对待识别音频对应的音频声纹进行聚类,得到聚类结果,并确定聚类结果对应的第一识别结果;音频声纹包含多个原始子声纹;基于重识别模...
  • 本发明涉及数字人对话处理技术领域,具体涉及一种基于WASM、WebGPU和WebAV的数字人系统,该系统包括:用户交互模块,用于接收用户的语音输入,并将视频帧展示于用户;语音识别模块,用于将用户的所述语音输入转换为语音文本;文本理解模块,用...
  • 本申请公开一种语音唤醒识别方法、系统、设备和介质,涉及人工智能技术领域,所述方法包括:获取车内的音频信号;对所述音频信号进行识别,若确定所述音频信号为对车机进行唤醒的触发信号,则获取用户脸部的视频流,基于所述音频信号的时间段对所述视频流进行...
  • 本发明提供一种语音数据标注系统以及方法。该语音数据标注系统包括:GPU计算模块和CPU控制模块,其中GPU计算模块用于获取并将待标注语音数据依次输入至少一种语音处理模型,以得到初始语音处理结果,并在得到初始语音处理结果之后生成初始语音处理结...
  • 本申请提供了一种智能音箱的唤醒方法和智能音箱,智能音箱设置有振动传感器,方法包括:响应于振动传感器采集到的振动信号,唤醒智能音箱。该方法中,通过在智能音箱中增设振动传感器来采集物理叩击产生的振动信号,可以在不依赖声学语音识别的情况下精准感知...
  • 本申请提供了一种基于车身控制器的新能源车辆辅助控制方法及系统,属于车辆控制领域,解决现有控制架构在感知能力及功能扩展性方面的局限逐渐凸显的问题,上述方法包括:获取车辆的车速信息以及至少一扇车窗的当前开度信息,在车辆处于通风状态且所述车窗处于...
  • 本发明公开了一种语音个性化定制方法、装置、电子设备及存储介质,涉及车联网大数据技术领域,所述方法包括:执行用户输入的语音指令时,采集用户的面部图像;通过对面部图像的表情分析,判断用户对语音指令的执行结果是否满意;如果用户对执行结果不满意,采...
  • 本发明涉及人工智能技术领域,提供一种多模态交互方法、装置、设备及介质,应用于医疗、金融等领域,其方法包括:响应于多模态交互指令,实时获取客户的语音数据;基于提取策略对语音数据进行提取得到意图数据;对意图数据进行整合得到可视化界面数据;基于生...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音驱动的应用生成方法、装置、设备及介质,包括:接收语音输入并解析生成解析结果,识别用户意图并抽取实体形成意图实体集合,基于意图实体集合生成结构化指令并匹配组件库...
  • 本发明涉及检测数据处理技术领域,公开了一种结构化检测数据语音录入系统及方法,包括语音采集模块、语音处理模块、规则配置模块、数据匹配模块和数据输出模块;所述语音处理模块内置通用AI语音大模型,用于将语音信息转换为文本信息,并通过过滤工厂环境噪...
  • 本发明涉及语音控制技术领域,具体涉及基于云端大模型与声纹识别的跑步机语音控制系统及方法,本发明通过“One‑Shot”机制,在用户开口的第一句话就完成了身份绑定。就像给跑步机装了一把“声纹锁”,只有拿到钥匙(声纹)的人才能控制钥匙孔(执行命...
  • 本申请提供了一种语音识别方法、装置、存储介质及电子设备,该方法应用于语音识别领域,该方法包括:响应于用户输入的语音指令,获取参考文本的文本特征以及所述参考文本对应的参考语音中提取得到与所述参考文本相关的用户声纹特征;从所述语音指令中获取语音...
  • 本申请涉及一种吸奶器的离线语音控制方法、装置、存储介质、计算机程序产品及吸奶器。该方法通过获取用户语音指令,对用户语音指令进行模数转换得到待处理音频数据;提取待处理音频数据的语音特征序列;根据语音特征序列与预先存储在吸奶器中的预设语音识别模...
  • 本申请适用于人工智能技术领域,提供了一种基于对话分析的智能玩具控制方法,该方法包括:接收目标儿童用户的输入数据;通过预设的声学‑文本联合模型对输入数据进行声学预处理,得到声学情绪特征;对声学情绪特征进行模糊匹配与特征映射处理,输出性格特征向...
技术分类