Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的任务处理方法,包括:对获取的任务类型与历史微调数据进行分析以确定初始微调配置方案;基于初始微调配置方案对大语言模型进行微调并收集表现数据;基于表现数据生成多个候选微调配置方案;对候选微调配置...
  • 本发明公开了一种基于信息瓶颈和冗余约束的奖励模型训练方法及系统,该方法包括:构建一个包含M个成员的奖励模型集成系统;通过一个包含相关性损失项、压缩损失项和冗余度损失项的联合损失函数,在人类偏好数据集上联合训练所有成员奖励模型;相关性损失项旨...
  • 本发明公开了一种基于语言模型的训练数据生成方法及装置,涉及自然语言处理技术领域,该方法包括:将文本集合输入至目标语言模型,识别所有文本的实体集合、概念集合和关系集合,将识别出的领域实体、文本概念以及各领域实体之间的关联关系映射至数据关系描述...
  • 本发明提供了一种可编程全光学衍射神经网络装置及方法,包括:光学衍射计算模块,由多层平行排列的衍射层构成,每层衍射面由多个光学神经元单元以阵列形式排列构成,所述光学神经元单元由电光材料构成;集成化电学寻址与控制模块,用于对每个光学神经元单元的...
  • 本发明提供一种基于神经网络权重矩阵缩放控制的存算一体芯片和方法,包括:输入信号转换电路模块、存算单元阵列模块、缩放控制电路模块以及输出信号转换电路模块;存算单元阵列模块中预存的神经网络权重矩阵为原始神经网络权重矩阵对部分列进行整体缩放后得到...
  • 本公开涉及卷积算子执行方法、装置和计算机可读存储介质。该方法包括:将卷积任务按输出张量空间维度划分为多个大小相同的分块子任务;为每个输出分块预分配固定大小的填充缓冲区;根据输出分块位置计算需从输入张量加载的有效输入数据块的全局起始坐标及其在...
  • 本申请涉及神经网络技术领域,公开一种脉冲神经网络加速方法、装置、设备、存储介质和产品,其中方法包括:将突触前神经元按照权重进行降序排序;依据排序顺序将其中被激活的突触前神经元的权重,逐步累积至突触后神经元的膜电位中;在逐步累积过程中,当所述...
  • 本申请公开了一种存算电路、芯片及相关方法,该存算电路包括:存储阵列,包括N个存储区域,N≥2;N个线性运算模块,一个线性运算模块配置用于接收来自对应的存储区域的数据,以及执行来自对应的存储区域的数据与外部输入数据的线性运算;以及输入输出模块...
  • 本申请公开了一种存算电路、芯片及相关方法,该存算电路包括:存储阵列,包括N对空间相邻的第一存储区域和第二存储区域,其中N≥1;N个线性运算模块,一个线性运算模块配置用于接收来自对应的一对存储区域的数据,以及执行来自第一存储区域的第一数据与来...
  • 本发明公开了一种基于自适应稀疏门控的序列处理与优化方法、系统、电子设备及存储介质,涉及人工智能与深度学习技术领域。该方法包括:执行惯性演化,利用惯性处理单元以线性复杂度常驻运行并更新隐状态;进行熵判决,计算反映预测不确定性的信息熵并生成门控...
  • 本公开实施例公开了一种模型量化方法、装置、电子设备、存储介质和程序产品,通过预设的可逆线性变换算子对全精度的第一模型的目标网络层进行数学等价重构变换,得到全精度的第二模型,从而使得变换得到的第二模型的第一权重矩阵的分布趋于各向同性以适配向量...
  • 一种用于生成向量量化深度神经网络的方法,包括针对查询向量和键向量创建二进制掩码,其中创建二进制掩码包括用值1替换每个非零元素,计算查询和键向量的二进制掩码的逻辑与运算符,利用来自查询和键向量的二进制掩码的逻辑与运算符的结果来识别非零位的位置...
  • 本公开涉及稀疏矢量量化DEPP神经网络的系统和方法。一种用于生成矢量量化的深度神经网络的方法包括接收包括一个或多个图像、文本信息、声音信息的训练数据集,用该训练数据集训练神经模型以调整与一个或多个深度神经网络层相关联的一个或多个参数,基于一...
  • 本发明公开一种基于人工智能的问答交互方法、装置、设备及介质,涉及金融、保险、医疗以及银行等专业服务领域中的人工智能技术领域,包括:将历史对话分割为主题连贯的片段并构建为记忆单元;为每个单元生成语义嵌入向量与时间衰减权重以构成记忆库;基于用户...
  • 本发明涉及模型训练加速技术领域,具体为一种基于GPU的深度神经网络加速推理方法,包括:获取训练数据集,对所述训练数据集进行划分,以得到多个子训练数据集,将所述多个子训练数据集均分至GPU训练集群的训练节点中;在所述训练节点中部署局部深度神经...
  • 本发明公开了压缩机健康状态预测及预测模型训练方法、相关装置。该方法包括:获取压缩机在不同负载状态下的基础数据,将基础数据分成训练集和验证集;将训练集输入到已构建的神经网络模型,对神经网络模型进行训练,若神经网络模型损失函数的损失值大于预期损...
  • 本申请提供一种指令增强方法、装置、电子设备和存储介质,涉及人工智能技术领域,包括:对原始指令序列进行语义分析与正交解耦;对原始输入文本进行逻辑特征提取;基于大语言模型处理文本数据时在不同上下文位置的注意力保持率,将逻辑上下文划分为记忆区和遗...
  • 本公开提供了一种用于大语言模型的稀疏预测器训练方法、装置和计算机设备,涉及人工智能领域,实现方案为:获得输入特征,输入特征包括从图像、语音或文本中提取的词元特征;将输入特征输入大语言模型的门控层,得到真实激活值;将输入特征输入稀疏预测器,得...
  • 本公开提出一种数据处理方法、装置、存储介质和程序产品,涉及人工智能技术领域。本公开的一种数据处理方法,包括:根据输入数据获取第一编码;初始化预定数量的历史输出数据,预定数量大于1;根据历史输出数据和第一编码,并行输出预定数量的预测结果,包括...
  • 本发明提供一种大模型低资源高效微调方法及系统,构建训练集,对预训练模型权重进行量化,并为部分权重矩阵配置低阶适应模块,基于层索引和范数为每个模块计算缩放因子;估计各变换器模块内存消耗,将内存消耗高且缩放因子均值低的模块设为梯度检查点,前向传...
技术分类