最好看的新闻,最实用的信息
11月18日 °C-°C
纽币 : 人民币=4.2297

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过

2024-06-12 来源: 新浪科技 原文链接 评论0条

IT之家 6 月 11 日消息,中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱 codegeex 等国产 AI 大模型均入选并首批通过。

此次大模型评估以《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准为依据,围绕通用能力、专用场景能力、应用成熟度,为模型能力提升和企业选型提供规范性参考。

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过 - 1

IT之家注:《智能化软件工程技术和应用要求 第 1 部分:代码大模型》(标准编号 AIIA / PG 0110-2023)标准于 2024 年 1 月 25 日正式发布,该标准由中国信通院与中国工商银行联合牵头发起,涵盖通用能力、专用场景能力和应用成熟度三大部分,包括 100 多个能力要求。

此次验证,依据标准开展,评价指标覆盖 6 大通用能力场景、7 大专用能力场景、3 大服务成熟度,多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度,重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度,全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过 - 2

目前,华为云盘古大模型、智谱 CodeGeeX 代码大模型、阿里云 AI 编程助手通义灵码、中国电信星辰政务大模型等首批通过评估,并在全部 100 多个能力评估中表现优秀,获得 4 + 评级。

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过 - 3

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过 - 4

以阿里云通义灵码为例,信通院评测结果显示:

在通用能力方面,通义灵码在代码转换、代码检查及修复、代码优化等方面表现突出;

在专用场景方面,通义灵码提供网站开发、数据库开发、大数据开发、嵌入式开发等多个场景支持能力;

在应用成熟度方面,通义灵码具备较完善的数据合规及数据分类分级机制,且模型稳定性及可维护性表现优异,在模型推理性能、模型服务风险可控性等方面均表现优秀。

公开资料显示,AI 代码大模型首轮评估于今年 3 月启动,主要面向适用于金融、科技、互联网、电信、软件等各行业,生产、使用或计划使用代码大模型的企业,评估结果旨在为模型厂商提供代码大模型能力的评价和指导标准,以及为模型应用方提供有效衡量其能力水平的标准依据。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

分享新闻电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]