基本信息
摘要:The present application relates to the technical field of artificial intelligence, and relates to an artificial intelligence-based text data enhancement method and device, equipment and a storage medium. The method comprises: providing a first input text in a text database to a text generation model, and the text generation model converting the first input text into at least one first output text; calculating the word order fluency of the first output text; comparing the word order fluency of the first output text to the word order fluency of a correct text; and when the word order fluency of the first output text is greater than or equal to the word order fluency of the correct text, providing the first output text as a second input text to the text generation model, so that the text generation model converts the second input text into at least one second output text, the word order fluency of the second output text being less than that of the correct text. Thus, the data size of text generation model training is increased. La présente invention se rapporte au domaine technique de l'intelligence artificielle et concerne un procédé d'amélioration de données de texte reposant sur l'intelligence artificielle et un dispositif, un équipement et un support d'informations. Le procédé consiste : à fournir un premier texte d'entrée dans une base de données de texte à un modèle de génération de texte, et le modèle de génération de texte convertit le premier texte d'entrée en au moins un premier texte de sortie ; à calculer la fluidité d'ordre de mots du premier texte de sortie ; à comparer la fluidité d'ordre de mots du premier texte de sortie à la fluidité d'ordre de mots d'un texte correct ; et lorsque la fluidité d'ordre de mots du premier texte de sortie est supérieure ou égale à la fluidité d'ordre de mots du texte correct, à fournir le premier texte de sortie en tant que second texte d'entrée au modèle de génération de texte, de sorte que le modèle de génération de texte convertisse le second texte d'entrée en au moins un second texte de sortie, la fluidité d'ordre de mots du second texte de sortie étant inférieure à celle du texte correct. Ainsi, la taille de données de l'apprentissage du modèle de génération de texte est augmentée. 本申请属于人工智能技术领域,涉及基于人工智能的文本数据增强方法、装置、设备及存储介质。该方法包括:将文本数据库中的第一输入文本提供给文本生成模型,并由所述文本生成模型将所述第一输入文本转化成至少一条第一输出文本;计算所述第一输出文本的语序流畅度;将所述第一输出文本的语序流畅度与正确文本的语序流畅度比较;当所述第一输出文本的语序流畅度大于或者等于所述正确文本的语序流畅度时,将所述第一输出文本作为第二输入文本提供给所述文本生成模型,以使得所述文本生成模型将所述第二输入文本转化成至少一条第二输出文本,所述第二输出文本的语序流畅度小于所述正确文本的语序流畅度。其增加了文本生成模型训练的数据量。
摘要附图: