新闻中心
新闻中心

nternLM2-20B-WQX得分75(满分150)最高

2025-04-05 02:52

  昨日,大部门模子都正在语文、英语两个科目上表示优良,可是数学科目全员不合格,该测试拔取了 6 个开源模子以及 GPT-4o 进行,开源时间均早于高考,InternLM2-20B-WQX 得分 75(满分 150)最高,成就由具有高考评卷经验的教师人工评判。参取评测的所有开源模子,上海人工智能尝试室和司南评测系统发布了 AI 模子加入高考「语数外」全卷能力测试的成果。