检索详情页-中国标网

人工智能　大模型　第2部分：评测指标与方法

Artificial intelligence—Large-scale model—Part 2:Testing and evaluation for metrics and methods
标准编号：GB/T 45288.2-2025 现行发布日期： 2025-02-28 实施日期： 2025-02-28 标准ICS号：35.240 中标分类号：L70
标准介绍

本文件确立了人工智能大模型的评测指标，描述了人工智能大模型的评测方法。
本文件适用于模型提供者、应用服务者和应用消费者等对大模型能力进行评估与测试，也适用于指导大模型的设计、开发、应用。
提出部门

全国信息技术标准化技术委员会(SAC/TC 28)
发布部门

国家市场监督管理总局、国家标准化管理委员会