Artificial intelligence—Large-scale model—Part 2:Testing and evaluation for metrics and methods
本文件确立了人工智能大模型的评测指标,描述了人工智能大模型的评测方法。
本文件适用于模型提供者、应用服务者和应用消费者等对大模型能力进行评估与测试,也适用于指导大模型的设计、开发、应用。
全国信息技术标准化技术委员会(SAC/TC 28)
国家市场监督管理总局、国家标准化管理委员会
纸质版标准加购成功
电子版标准加购成功
标准收藏成功