OpenAI又祭出「王炸」，新模型更似「真人」？
原創

日期：2024年5月14日下午1:42作者：飛魚編輯：Annie

北京時間周二（5月14日）淩晨，全球人工智能的執牛耳者OpenAI公司在線上舉辦了「春季更新」活動。

本次活動中，OpenAI發佈了新旗艦模型「GPT-4o」，可以實時對音頻、視覺和文本進行推理。據悉，新模型使ChatGPT能夠處理50種不同的語言，同時提高了速度和質量。

在此前，用戶使用語音模式與ChatGPT對話時，平均延遲達到數秒鍾，音頻在輸入時還會由於處理方式丢失大量信息，讓GPT-4無法直接觀察音調、說話的人和背景噪音，也無法輸出笑聲、歌唱聲和表達情感。

而最新的GPT-4o延遲很低，與人類在對話中的反應時間相近，講述故事宛如真人。與現有模型相比，其在圖像和音頻處理方面很出色，甚至可以從急促的喘氣聲中理解「緊張」的含義，並且指導對方進行深呼吸等等。

可以說，GPT-4o使得AI表達有了「感情」，是邁向更自然人機交互的關鍵一步。OpenAI首席執行官奧特曼表示，GPT-4o的語音功能讓人想起了電影《她》，「感覺就像是電影中的人工智能，我仍然對其感到驚訝。」

目前，GPT-4o已對所有用戶免費開放，付費訂閱的ChatGPT Plus用戶的消息數量上限是免費用戶的5倍。

OpenAI的首席技術官Mira Murati表示,未來做產品要免費優先，讓更多的人使用。業内人士稱，技術叠代優化和費用下降將加速大模型走向行業應用。

不過也有觀點認為，OpenAI之所以「祭出」一些免費功能，在於行業的競爭異常激烈。無論OpenAI做出怎樣的創新，在Meta，谷歌，亞馬遜，xAi等強敵環伺的背景下，都容易被模仿甚至被趕超。此次發佈會，也宣告新一輪技術戰和價格戰的開始，其他科技巨頭也將在未來一個月内公佈AI最新進展。

值得一提的是，目前AI技術的快速發展也引起一些擔憂。圍繞版權問題的爭議持續困擾著AI企業，許多創作者也擔心，AI大模型的訓練涉及侵權問題。

此外，當地時間5月14日，在瑞士日内瓦舉行中美人工智能（AI）政府間對話首次會議，就AI科技風險、全球治理等問題進行交流。

更多精彩內容，請登陸
財華香港網 (https://www.finethk.com/)
現代電視 (http://www.fintv.com)

OpenAI又祭出「王炸」，新模型更似「真人」？原創