基本信息
摘要:本发明实施例提供一种人工智能模型评测方法、装置、电子设备及存储介质,本发明实施例将各待评测人工智能模型输出的第一模型输出数据结果映射为与当前业务场景的统一评测指标对应的第二模型输出数据结果,并根据第二模型输出数据结果与评测标注信息的对比结果,确定各待评测人工智能模型的评测结果。本发明实施例提供的人工智能模型评测方法、装置、电子设备及存储介质,能够为不同厂商的相同业务场景对应的人工智能模型提供统一的评测标准,让平台用户在未使用之前就对各厂商模型有了准确的期望,方便用户选取,方便厂商及时反馈,能够提高平台的整体水平。
摘要附图: