6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。
更多精彩內容,請登陸
財華香港網 (https://www.finethk.com/)
財華智庫網(https://www.finet.com.cn)
現代電視 (https://www.fintv.hk)