专题库详情
您的位置:专题库 > 专题库详情

基本信息

摘要:The present application relates to the field of artificial intelligence, and discloses a method employing artificial intelligence for dynamic generation of television closed captions, and a related apparatus. The method comprises: acquiring an image frame of current viewers, and inputting the image frame into a face identification model to acquire race information of the current viewers and a proportion corresponding to each race of the current viewers; acquiring current positioning information, and acquiring a current official language according to the current positioning information, the race information of the current viewers, and the proportion corresponding to each race of the current viewers; and acquiring sound data, converting the sound data into text by means of a sound recognition model, translating the text according to the current official language, and displaying the translated text on a television screen. The present application determines a closed caption language by identifying the race of viewers, helps the disabled to understand television content, and improves the experience of watching television. La présente invention se rapporte au domaine de l'intelligence artificielle, et concerne un procédé utilisant une intelligence artificielle pour la génération dynamique de sous-titres codés de télévision, et un appareil associé. Le procédé comprend les étapes suivantes : acquérir une trame d'image de spectateurs courants, et entrer la trame d'image dans un modèle d'identification de visage afin d'acquérir des informations de race des spectateurs courants et une proportion correspondant à chaque race des spectateurs courants ; acquérir des informations de positionnement courantes, et acquérir une langue officielle courante selon les informations de positionnement courantes, les informations de race des spectateurs courants, et la proportion correspondant à chaque race des spectateurs courants ; et acquérir des données sonores, convertir les données sonores en texte au moyen d'un modèle de reconnaissance sonore, traduire le texte selon la langue officielle courante, et afficher le texte traduit sur un écran de télévision. La présente invention détermine une langue de sous-titre codé en identifiant la race de spectateurs, aide les personnes handicapées à comprendre un contenu de télévision, et améliore l'expérience de visualisation de télévision. 本申请涉及人工智能领域,本申请公开了一种基于人工智能的电视字幕动态生成方法及相关设备,所述方法包括:获取当前观众的画面图像,将所述画面图像输入人脸识别模型,以获取当前观众的人种信息及与所述当前观众的人种对应的人数占比;获取当前定位信息,根据所述当前定位信息、当前观众的人种信息及与所述当前观众的人种对应的人数占比获得当前官方语言;获取语音数据,将所述语音数据通过语音识别模型转换成文字,根据所述当前官方语言将所述文字进行翻译,并在电视屏幕上将所述翻译后的文字进行字幕播放。本申请通过对观众人种的识别,确定字幕语言,帮助障碍人士对电视内容的理解,提高电视收听效率。

摘要附图: