第一财经:上海人工智能实验室旗 下司南评测体系 OpenCompass发 布首个大模型高考全卷评测结果。 语数外三科加起来的满分为420 分,此次高考测试结果显示,阿里 通义千问2-72B排名第一,为303 分,OpenAl的GPT-40排名第二, 得分296分,上海人工智能实验室 的书生·浦语2.0排名第三,三个大 模型的得分率均超过70%。从结果 来看,大模型的语文、英语考试水 平普遍不错,但数学都不及格,最 高分也只有75分。 此篇相同回報者之文章列表

Order By:

17 articles