基本信息
摘要:本发明提供一种基于人工智能的跨语种语音转录方法、设备及可读介质。其所述方法包括:将待转录的语音数据进行预处理,获取多个声学特征;待转录的语音数据采用第一语种表示;根据多个声学特征以及预先训练的跨语种转录模型,预测语音数据对应的转录后的翻译文本;其中,翻译文本采用第二语种表示,第二语种不同于第一语种。采用本发明的技术方案,跨语种语音转录时不用先进行语音识别,再进行机器翻译,而是直接根据预先训练的跨语种转录模型便可以进行跨语种转录,能够克服现有技术中的两步走的跨语种转录方式中的错误累积的问题,与现有技术相比,能够有效地提高跨语种语音转录的准确性和转录效率。
摘要附图: