Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及人工智能与人机交互技术领域,公开了一种基于知识图谱的数字人语音交互控制方法,包括以下步骤:S1、获取并解析用户语音,得到包含用户意图、实体及属性的结构化语义信息;S2、依据前述语义信息,动态演化一个用于表征当前会话上下文的瞬态情境...
  • 本发明公开了一种面向机器学习的压缩率可伸缩语义通信,主要考虑实际面向机器学习任务的语义通信技术,解决信道质量和带宽对通信系统语义传输质量的影响。首先,对图像源进行预处理,用残差卷积神经网络提取出语义特征。其次,通过注意力机制根据信道信噪比调...
  • 本发明提供一种语音识别方法、装置、电子设备及存储介质,在语音助手应用检测到目标唤醒词的情况下,调用AudioRecord采集移动终端原始音频,存储在第一目标缓存区中,从第一目标缓存区中读取原始音频发送至预设降噪算法库对原始音频进行降噪处理,...
  • 本发明属于人工智能的技术领域,涉及了多任务学习框架下的语音降噪与语音识别联合优化方法,包括以下步骤:获取包含环境噪声的原始语音信号流;整合两个通道的分析结果,以生成联合上下文情报;依据该联合上下文情报为每一个时间‑频率单元生成包含多个控制维...
  • 本发明公开了一种音频重点确定方法、智能笔及存储介质,涉及人工智能技术领域。该方法包括:获取音频流,并获取在所述音频流录制过程中生成的第一时间戳对;根据所述音频流的语义生成语义链,所述语义链中由相互关联的语音语义片段组成,并利用所述第一时间戳...
  • 本申请公开了一种音频识别系统及其音频分类装置及分类方法,该分类方法包含:自区分为多个音频类型的多个训练音频档案中,选择任一音频类型作为对应音频类型并撷取区分为对应音频类型的训练音频档案,以对训练音频档案进行音频取样以及特征撷取,并产生多个训...
  • 本发明涉及语音识别技术领域,具体为一种基于大模型的声学识别精度优化方法,获取信号频谱与波形,对比能量峰值与噪声以完成频段阈值筛取,并依据边界点修整差异超限的相邻幅度曲线,比较高低频噪声强度以抑制较强者,融合能量与幅度曲线并剔除低于能量基准的...
  • 本公开涉及人工智能技术领域,提供了一种关键词检测方法、关键词检测装置、计算机可读存储介质、电子设备,其中,关键词检测方法包括:对目标关键词进行文本扰动处理,生成与所述目标关键词易混淆的干扰关键词;构建训练文本集;所述训练文本集包括含有所述目...
  • 本说明书实施例提供讲稿生成模型训练方法、讲题视频的讲稿生成方法及装置,该方法包括:获取样本讲题视频,并基于样本讲题视频确定样本讲稿文本;确定样本讲题视频对应的样本题目信息,基于样本题目信息获取对应的样本解题思路,样本解题思路为样本题目信息的...
  • 本发明涉及利用声学模型补偿的用于音素建模和发音建模的HMM解码。描述了用于使用不需要任何WW或命令匹配语音数据进行训练的语音识别系统识别人机接口的说出的唤醒词(WW)或命令的技术。系统在部署前使用WW或命令的文本或图形表示进行训练。该技术包...
  • 本申请实施例提供一种唤醒功能测试方法、装置、系统、电子设备及存储介质,涉及声学测试领域。该方法包括:获取拾音器的测试参数,通过该拾音器采集测试环境中的声音,并将该拾音器的测试参数和采集到的声音输入测试设备,再控制该测试设备根据测试参数调整算...
  • 本申请涉及一种语种识别方法、内容显示方法、装置、设备、介质和产品。所述方法包括:获取语种识别音频,对所述语种识别音频进行语种识别获得目标语种标识,所述目标语种标识代表多个语种中的一个;基于所述目标语种标识对所述语种识别音频进行子语种识别,获...
  • 本申请提供了基于迁移学习的方言语音识别转写方法、装置及存储介质,涉及语音识别技术领域,该方法包括:通过用户端,接收若干区域方言数据集,分别执行共性音频特征提取,获得若干共性音频特征;基于若干共性音频特征,进行音频特征相似度聚类,获得多簇区域...
  • 本申请涉及语音生成技术领域,具体提供了一种基于大模型的语音生成方法、装置、存储介质、电子设备及产品,该方法可以包括:获取与用户相关的多模态记忆包;多模态记忆包包括语义记忆、声学记忆和情感记忆;语义记忆包括所述用户的个人偏好信息、历史对话关键...
  • 本申请公开了智能播客生成方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及自然语言处理、语音技术、大模型、智能体等人工智能领域。具体实现方案为:对原始文本进行多维度语义特征分析,得到分析结果;根据分析结果对原始文本进行分段处理,得...
  • 本申请提供一种基于大模型的数据处理系统,本申请中的数据处理方法包括以下步骤:获取待处理文本信息;对所述待处理文本信息进行处理,得到目标语音信息;基于所述目标语音信息,确定出目标处理结果信息。
  • 本发明公开了一种基于声音克隆与情感迁移的多语言智能配音生成系统,包括:声音克隆模块、跨语言合成模块、情感迁移模块、唇形同步模块。本发明通过构建少样本说话人编码器、跨语言韵律迁移模块、细粒度情感控制模块和视频唇形同步模块,实现从原始配音音频到...
  • 本文提供了一种媒体数据生成方法、装置、设备、介质及产品,该方法包括:接收第一文本和第一描述信息,其中,所述第一文本包括至少一个会话参与方的会话内容,所述第一描述信息至少用于反映所述至少一个会话参与方的第一会话状态信息;基于第一模型对所述第一...
  • 本发明公开了一种方言情感语音合成方法,包括:获取输入的方言文本和目标情感类型;对方言文本进行文本分析,提取出方言文本对应的音素序列、文本情感特征、方言词汇特征及文本语义特征,并基于所提取的特征生成融合了方言词汇信息的综合文本表征;将综合文本...
  • 本发明公开了一种汽车上的声场分区控制方法、系统及设备,该方法包括:根据乘员位置在汽车座舱内部构建多个独立声音分区;获取各个独立声音分区处的声音信号,根据声音信号确定每个独立声音分区当前的声音模式,确定每个独立声音分区当前声音模式对应的人声明...
技术分类