Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明属于计算机视觉与人工智能领域,涉及整图汉字分割识别方法及系统,旨在解决复杂书法图像分割识别准确率低、鲁棒性差的问题。方法包括:构建并标注包含多书体、多拍摄场景与多质量图像的数据集;通过cWCT模块进行风格化数据增广;基于目标检测网络训...
  • 本发明属于数字化智能管理技术领域,本发明提供了一种投标人员资质证件的数字化智能管理方法及系统,包括:构建辅助采集单元,通过边缘检测、TTS语音引导规范采集,结合清晰度、亮度均匀度、非必要遮挡占比完成质量评估,对达标图像检测泛黄、褶皱等缺陷,...
  • 本发明涉及数据分析技术领域,是基于场景感知的自适应标注模板生成方法及系统,具体包括:构建高热工业场景下待标注目标所属的感知节点的动态网格可视化框架;获取高热工业场景下待标注目标的历史多模态感知信息数据,以及所述待标注目标的实时多模态感知信息...
  • 本发明涉及计算机视觉技术领域,公开了一种基于多模态大模型的免训练图像视觉关系检测方法和系统;方法包括:计算图像与所述候选视觉关系的视觉语义匹配度;对由主语物体、宾语物体与各候选视觉关系组成的文本三元组进行常识合理性校验;融合预排序结果和合理...
  • 一种基于信道自适应的多无人机协同3D感知方法,涉及通信领域,包括建立基于信道自适应的多无人机协同3D感知框架、BEV语义编码模块和BEV语义解码模块。无人机将获取的图像编码融合为语义特征并通过复杂信道环境向其他无人机共享,接收无人机解码语义...
  • 本发明公开了一种基于混合单秩专家的多任务密集预测方法,包括收集并整理多任务密集型数据集;将数据集划分为训练集、验证集和测试集,并进行预处理;构建多任务密集预测模型;使用训练集对所述模型进行训练,并利用验证集在训练过程中定期评估模型性能;训练...
  • 本发明涉及遥感图像处理技术领域,具体涉及基于边缘优化的云雪层图像分割方法、系统及存储介质,包括:利用ResNet网络在遥感图像上分割出包含云层和雪层的前景区域,以及背景区域;在所述前景区域中利用边缘检测算子对云层和雪层的边缘信息进行提取,得...
  • 本发明属于视频描述技术领域,具体涉及一种基于提示问句不确定性分配的双可控视频描述方法及系统,方法先构建并训练问答双可控视频字幕模型;该模型先利用多层次特征提取器将输入的视频序列转换为多层次语义特征,设计多条自然语言问题提示模板并将其转化为标...
  • 本发明公开了一种基于视觉语言大模型的工程缺陷图像自动标注方法及系统,包括:步骤1,采集目标域原始图像数据集,并进行标准化处理,将原始图像数据转化为统一的语义表示;步骤2,基于标准化处理后的原始图像数据集和语义表示,生成候选标签及对应文本描述...
  • 本发明公开了基于AI视觉判断的手术技能培训系统,涉及手术技能培训与评估技术领域,包括高精度视觉感知模块,采用基于深度学习的实例分割算法,支持15类常见手术器械的毫秒级识别,输出参数包括三维空间坐标、器械开合角度和组织的接触状态;通过多光谱成...
  • 本发明提供一种能够促进影像内的物体间的时空关系的理解的影像解析系统、影像解析程序产品以及学习系统。影像解析系统具备大语言模型(LLM:Large Language Model)。时空场景图是以空间和时间的方式表示影像内的物体间的关系的场景图...
  • 本发明公开了基于高光谱成像的羊肉新鲜度多指标快速检测方法及系统,属于食品品质检测技术领域,其包括获取羊肉表面的高光谱图像并进行反射率标定;识别图像纹理与光强分布,提取区域平均光谱;校正光谱的散射与基线偏移,并进行空间归一化,得到空间一致光谱...
  • 本发明提供一种果实图像的处理方法和装置、电子设备及存储介质。该处理方法包括:通过训练后的目标检测模型,确定多个目标果实分支各自对应的第一分支关注区域。基于第一位置信息、以及第二位置信息,确定图像采集装置的世界移动距离。基于图像采集装置的世界...
  • 本发明提供了一种食品中微生物的风险评估预警方法及系统,涉及微生物监测领域,包括:获取多个时间节点的实时图像和实时图像在每个像素点位置的标准像素值,基于每个实时图像的所有标准像素值获得每个时间节点的食品菌落图像;对食品菌落图像的杂质区域进行剔...
  • 本申请涉及一种3D占据栅格感知方法、装置、车辆和可读存储介质。所述方法包括:获取对目标空间采集的空间图像的空间图像特征和图像估计深度;对目标空间生成预设数量的锚框,融合各锚框的初始化锚框信息和图像估计深度,得到各锚框的锚框预处理特征;根据空...
  • 基于点云多流形的多模态大模型场景感知方法,涉及机器人视觉与3D场景理解。接收RGB图像、点云与自然语言指令三类异构输入,通过并行语义‑几何双分支架构一次性完成场景级多模态对齐、物体‑关系联合推断等。语义分支利用大型视觉‑语言预训练模型将文本...
  • 本发明公开一种融合拆解拓扑关系的电池包异型件精确定位方法与系统,属于动力电池拆解定位技术领域。方法包括:利用全局相机获取电池包全局点云,与预设CAD模型配准得到变换矩阵;基于该矩阵和CAD模型解析结果构建图神经网络装配关系场景图,实现零部件...
  • 本发明公开了一种融合复用Transformer的基于Mamba框架的场景文字识别方法,包括:构建多样化训练样本,与原始样本一起生成增广样本图像;特征编码后送入分层特征编码器进行特征提取;所述分层特征编码器包括多个级联的特征编码阶段,通过下采...
  • 本发明涉及公共标识评测技术领域,公开了一种公共标识智能化评测系统及方法,其技术方案包括:通过对公共标识进行图像采集、特征提取、语义解析、合规性校验、评测结果生成及数据存储的全流程智能化处理,替代传统人工评测模式,通过快速获取各类场景下的公共...
  • 本发明公开一种水泥板及其构件检测方法、装置、设备及存储介质,所述方法包括以下步骤:通过工业相机获取水泥板及其构件图像,并标注水泥板及其构件的检测框以获得水泥板及其构件数据集;构建适用于水泥板及其构件的改进RT‑DETR模型; 通过所述水泥板...
技术分类