訊息原文

1 人回報3 個月前
第一财经:上海人工智能实验室旗
下司南评测体系 OpenCompass发
布首个大模型高考全卷评测结果。
语数外三科加起来的满分为420
分,此次高考测试结果显示,阿里
通义千问2-72B排名第一,为303
分,OpenAl的GPT-40排名第二,
得分296分,上海人工智能实验室
的书生·浦语2.0排名第三,三个大
模型的得分率均超过70%。从结果
来看,大模型的语文、英语考试水
平普遍不错,但数学都不及格,最
高分也只有75分。

現有回應

目前尚無回應

增加新回應

  • 撰寫回應
  • 無相關回應
  • 搜尋