移动版

智源研究院推出FlagEval“天秤”大模型评测体系,颠覆AI评估方式!

2023-06-10 10:17 爆米花 0
编辑有话说:智源研究院的FlagEval“天秤”大模型评测体系的推出让模型评估更加全面和准确。这一举措为推动人工智能的发展提供了有力支持。

在近日的2023北京智源大会上,智源研究院宣布推出FlagEval(天秤)大语言模型评测体系。该体系从“能力、任务、指标”三维评测角度出发,结合超过600个维度对大模型进行全面测评。

据悉,天秤大模型的任务维度目前包含22个主观和客观评测数据集,共计超过84433道评测题目。

智源研究院推出FlagEval“天秤”大模型评测体系

智源研究院院长黄铁军指出,大模型至少需要具备三个特点。第一,规模要大,需要达到百亿参数级别;第二,涌现性,能够产生预料之外的新能力;第三,通用性,不限于专门问题或者领域。

0
免责声明:本文转载互联网,不代表本网站的观点和立场。如果你觉得好欢迎分享此网址给你的朋友。
文章标签

本文统计

  • 发布时间:2023-06-10 10:17
  • 修改次数:1
  • 修改时间:2023-09-15 10:27
  • 浏览热度:101
  • 评论数量:0
  • 点赞次数:0
评论
举报
验证码
发表

暂无评论,期待你的妙语连珠

举报文章问题
验证码
举报文章问题

已收到!

我们将尽快处理。