广州趣丸网络科技有限公司;西北工业大学谢川获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州趣丸网络科技有限公司;西北工业大学申请的专利影视剧台本提取方法、装置、存储介质及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121121616B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511658012.8,技术领域涉及:G06V20/40;该发明授权影视剧台本提取方法、装置、存储介质及计算机设备是由谢川;熊佳;谢鹏源;冯智毅;陈观潮;张强;龙玲;李国健;林振楠;谢磊设计研发完成,并于2025-11-13向国家知识产权局提交的专利申请。
本影视剧台本提取方法、装置、存储介质及计算机设备在说明书摘要公布了:本申请提供的影视剧台本提取方法、装置、存储介质及计算机设备,在将影视剧的音视频文件后拆分为视频文件和音频文件后,对视频文件进行特征识别得到字幕文本、说话人人脸信息及其视频理解文本;以及对音频文件进行语音理解得到语音转录文本和语音理解文本;其中,通过字幕文本可以将语音转录文本矫正为准确性较高的标准转录文本。因此,基于说话人人脸信息将标准转录文本和音视频文件中每一说话人的台词片段进行对齐,可以得到分割精确且语义连贯的说话人信息,然后结合基于视频、语音理解文本和说话人信息对说话人进行侧写分析生成的人物侧写文本构建台本信息,能够在包含台词内容的基础上涵盖人物的相关特征描述,从而丰富台本的内容和深度。
本发明授权影视剧台本提取方法、装置、存储介质及计算机设备在权利要求书中公布了:1.一种影视剧台本提取方法,其特征在于,所述方法包括: 获取影视剧的音视频文件,并将所述音视频文件拆分为视频文件和音频文件,以及,分离得到所述音频文件中的人声音轨; 对所述视频文件进行特征识别,得到携带时间戳信息的字幕文本和说话人人脸信息,并根据所述说话人人脸信息对说话人进行状态理解,生成视频理解文本; 对所述音频文件进行语音理解,得到携带时间戳信息的语音转录文本和语音理解文本,并根据所述字幕文本对所述语音转录文本进行文本矫正,得到标准转录文本;其中,所述语音理解文本是对音频内容进行语义分析、语调识别、情感识别和上下文理解后生成的文本内容,用于表达当前时刻说话人的语气、情感、意图中的至少一项隐含信息; 基于所述人声音轨和所述说话人人脸信息,对所述音视频文件进行台词片段分割,得到携带时间戳信息的台词片段序列,并基于所述时间戳信息将所述标准转录文本和所述台词片段序列进行对齐,得到说话人信息; 基于所述视频理解文本、所述语音理解文本和所述说话人信息对所述说话人进行侧写分析,生成人物侧写文本,并根据所述说话人信息和所述人物侧写文本生成所述影视剧的台本信息; 其中,所述基于所述人声音轨和所述说话人人脸信息,对所述音视频文件进行台词片段分割,得到携带时间戳信息的台词片段序列,包括: 根据所述说话人人脸信息从所述音视频文件确定所述说话人人脸信息未缺省的音视频片段,以及,根据所述人声音轨和所述音视频片段从所述音频文件中确定所述说话人人脸信息缺省的音频片段; 基于所述人声音轨和所述说话人人脸信息,采用多模态分割模型对所述音视频片段进行说话人分割,得到携带时间戳信息的第一台词片段; 基于所述人声音轨,采用语音分割模型对所述音频片段进行说话人分割,得到携带时间戳信息的第二台词片段; 根据所述时间戳信息对所述第一台词片段和所述第二台词片段进行合并,生成台词片段序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州趣丸网络科技有限公司;西北工业大学,其通讯地址为:510630 广东省广州市天河区平云路163号之二1601室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励