請輸入關鍵字:

熱門搜尋:

首個AI高考全卷評測結果發佈:最高分303 數學全不及格

日期:2024年6月19日 下午4:19

6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩內容,請登陸
財華香港網 (https://www.finethk.com/)
財華智庫網(https://www.finet.com.cn)

現代電視 (https://www.fintv.hk)

相關文章

6月19日
夏季出行高峰疊加國内產能縮量 MTBE價格止跌回彈
6月18日
霧凇資本在香港設立地區總部
6月18日
北汽集團、寧德時代將達成戰略合作 涉CIIC一體化智能底盤、換電、V2G技術等
6月18日
李彥宏:智能體是AI時代的網站 將形成數百萬量級的龐大生態
6月17日
中國車企已成為「香饽饽」 關稅之下歐洲各國抛出招商橄榄枝!
6月14日
中汽協:5月新能源汽車銷量95.5萬輛 同比增長33.3%
6月14日
中汽協:5月汽車銷量241.7萬輛 同比增長1.5%
6月14日
華為:「華為是國内最大的牛肉進口商」純屬造謠
6月14日
新能源車出口 中國交付吉爾吉斯斯坦最大客車訂單
6月13日
正泰新能:與巴西發電商Atlas簽署700MW框架合作協議

視頻

即時快訊

09:16
世界銀行上調今年中國GDP增長預期
09:13
增值稅法:銷售不動產稅率為百分之九
09:01
國内期貨主力合約跌多漲少 BR橡膠跌超2%
08:51
增值稅法通過 自2026年1月1日起施行
08:48
滬深兩市融資餘額減少10.0億元
08:42
在岸人民幣兌美元較周二夜盤收盤漲6點
08:41
針對恒大集團幾項「1元起拍」債權拍賣 12月25日下午被撤回
17:35
新易盛:目前1.6T相關產品進展順利
17:34
信維通信:公司在墨西哥的佈局一切正常
17:32
泸天化:股東泸州發展集團擬增持1.5億元-2.6億元公司股份