智源研究院推出FlagEval“天秤”大模型评测体系，颠覆AI评估方式！

2023-06-10 10:17 爆米花 0

编辑有话说：智源研究院的FlagEval“天秤”大模型评测体系的推出让模型评估更加全面和准确。这一举措为推动人工智能的发展提供了有力支持。

在近日的2023北京智源大会上，智源研究院宣布推出FlagEval（天秤）大语言模型评测体系。该体系从“能力、任务、指标”三维评测角度出发，结合超过600个维度对大模型进行全面测评。

据悉，天秤大模型的任务维度目前包含22个主观和客观评测数据集，共计超过84433道评测题目。

智源研究院推出FlagEval“天秤”大模型评测体系

智源研究院院长黄铁军指出，大模型至少需要具备三个特点。第一，规模要大，需要达到百亿参数级别;第二，涌现性，能够产生预料之外的新能力;第三，通用性，不限于专门问题或者领域。

免责声明：本文转载互联网，不代表本网站的观点和立场。如果你觉得好欢迎分享此网址给你的朋友。

文章标签

智源研究院

本文统计

发表

暂无评论，期待你的妙语连珠