国内首个官方大模型评测结果出炉！阿里云通义千问首批通过评测

快科技12月22日消息，国内首个官方大模型标准符合性评测”结果公布。

阿里云通义千问成为首批通过评测的四款国产大模型之一，在通用性、智能性等维度均达到国家相关标准要求。

据悉，本次通过评测的首批大模型中，通义千问是唯一的开源模型，在全球拥有广泛的开发者用户和企业客户，其性能表现及安全性得到了大范围的公开检验。

12月1日开源后，通义千问72B在10个权威基准评测中创下开源模型最优成绩，并力压Llama2登顶海外最具权威性的HuggingFace排行榜。

此后又登上国内上海人工智能实验室OpenCompass榜首，成为业界公认的性能最强开源大模型。

目前，通义千问APP可在苹果和安卓各大应用商店中下载体验，提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。

据了解，大模型标准符合性评测”由中国电子技术标准化研究院发起，旨在建立中国大模型标准符合性名录，引领人工智能产业健康有序发展。

该评测对外征集了学术界、产业界几十家头部单位意见，覆盖评估语言大模型通用性、智能性的38项具体评测维度，是基于官方大模型测试基准的权威评测。