Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海壁仞科技股份有限公司请求不公布姓名获国家专利权

上海壁仞科技股份有限公司请求不公布姓名获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海壁仞科技股份有限公司申请的专利一种任务分配方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121210150B

龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511768538.1,技术领域涉及:G06F9/50;该发明授权一种任务分配方法、装置、设备及介质是由请求不公布姓名;请求不公布姓名;请求不公布姓名;请求不公布姓名设计研发完成,并于2025-11-27向国家知识产权局提交的专利申请。

一种任务分配方法、装置、设备及介质在说明书摘要公布了:本申请实施例提供的一种任务分配方法、装置、设备及介质,用以提高任务执行效率。由于在本申请实施例中,根据输入数据的批量数和每个输入数据的深度数,精确计算出待处理的任务总数,依据每个计算核所能支持的最大并发任务数,将总任务划分为多个处理批次的任务集,并分配给不同计算核执行,而多个任务集中存在包含的任务对应的字符的数量与最大承载任务数相同的任务集,从而可以尽量使得每个计算核可以满载执行任务,提高资源利用效率。

本发明授权一种任务分配方法、装置、设备及介质在权利要求书中公布了:1.一种任务分配方法,其特征在于,所述方法包括: 根据输入数据的批量数和每个输入数据的深度数,确定待执行的任务的任务总数;其中,所述批量数为输入至大语言模型的问题总数,所述深度数为对应每个输入问题所包含的字符数;其中,对一个字符进行处理的过程为执行一个任务; 根据每个计算核的最大承载任务数,对所述任务总数个任务进行划分,得到每个计算核不同处理批次的任务集;其中,任一计算核对应的多个任务集中存在包含的任务对应的字符的数量,与该计算核的最大承载任务数相同的任务集,且,任一计算核对应的任一批次的任务集中包含的任务对应的字符的数量,不超过该计算核的最大承载任务数; 控制不同计算核分别对对应处理批次的任务集内的字符进行处理; 其中,所述根据每个计算核的最大承载任务数,对所述任务总数个任务进行划分,得到每个计算核不同处理批次的任务集,包括: 按照预设的计算核顺序依次遍历每个计算核,确定每个计算核当前处理批次的任务集;预设的计算核顺序为基于每个计算核与显存之间的数据访问延迟或通信路径长度确定的顺序; 对于当前遍历的计算核,判断任务总数中尚未分配的任务数量是否大于等于该计算核的最大承载任务数; 若是,则将所述最大承载任务数个任务划入该计算核当前处理批次的任务集中; 若否,则将所有剩余未分配任务划入该计算核当前处理批次的任务集中; 在完成对最后一个计算核的任务分配后,若仍存在未分配任务,则返回第一个计算核,启动新的处理批次,继续执行任务划分,直至所有任务分配完毕; 所述控制不同计算核分别对对应处理批次的任务集内的字符进行处理,包括: 选择一个适合在单个线程束内部按序展开的计算轴,并让线程束在此轴向上以分段循环的方式连续执行;其中,线程束执行的任务为均方根归一化RmsNorm、加法后均方根归一化AddRmsNorm或其他Vector类算子。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海壁仞科技股份有限公司,其通讯地址为:201114 上海市闵行区陈行公路2388号16幢13层1302室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。