专题库详情

您的位置：专题库 > 专题库详情

基本信息

发明名称：【发明专利】基于人工智能的跨语种语音转录方法、设备及可读介质
申请日： 1970-08-22
申请号/专利号： CN201710351933.9
专利权人：李先刚;邹伟;黄斌
申请人：百度在线网络技术(北京)有限公司
分类号： G06F40/58,G10L15/02,G10L15/06,G10L15/26
发明人/设计人：李先刚;邹伟;黄斌
公开日/公告日： 1970.08.23
优先权号： G06F40/58,G10L15/02,G10L15/06,G10L15/26
代理机构：
代理人：
PCT申请号：无
PCT申请日期：无
PCT进入国家阶段日：无
生物宝藏信息：无
审查员：无

摘要：本发明提供一种基于人工智能的跨语种语音转录方法、设备及可读介质。其所述方法包括：将待转录的语音数据进行预处理，获取多个声学特征；待转录的语音数据采用第一语种表示；根据多个声学特征以及预先训练的跨语种转录模型，预测语音数据对应的转录后的翻译文本；其中，翻译文本采用第二语种表示，第二语种不同于第一语种。采用本发明的技术方案，跨语种语音转录时不用先进行语音识别，再进行机器翻译，而是直接根据预先训练的跨语种转录模型便可以进行跨语种转录，能够克服现有技术中的两步走的跨语种转录方式中的错误累积的问题，与现有技术相比，能够有效地提高跨语种语音转录的准确性和转录效率。

摘要附图：