首個AI高考全卷評測結果發佈：最高分303 數學全不及格

日期：2024年6月19日下午4:19

6月19日，據《科創板日報》訊，上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分，此次高考測試結果顯示，阿里通義千問2-72B排名第一，為303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能實驗室的書生·浦語2.0排名第三，三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看，大模型的語文、英語考試水平普遍不錯，但數學都不及格，最高分也只有75分。

更多精彩內容，請登陸
財華香港網 (https://www.finethk.com/)
現代電視 (http://www.fintv.com)