北京時間周二(5月14日)淩晨,全球人工智能的執牛耳者OpenAI公司在線上舉辦了「春季更新」活動。
本次活動中,OpenAI發佈了新旗艦模型「GPT-4o」,可以實時對音頻、視覺和文本進行推理。據悉,新模型使ChatGPT能夠處理50種不同的語言,同時提高了速度和質量。
在此前,用戶使用語音模式與ChatGPT對話時,平均延遲達到數秒鍾,音頻在輸入時還會由於處理方式丢失大量信息,讓GPT-4無法直接觀察音調、說話的人和背景噪音,也無法輸出笑聲、歌唱聲和表達情感。
而最新的GPT-4o延遲很低,與人類在對話中的反應時間相近,講述故事宛如真人。與現有模型相比,其在圖像和音頻處理方面很出色,甚至可以從急促的喘氣聲中理解「緊張」的含義,並且指導對方進行深呼吸等等。
可以說,GPT-4o使得AI表達有了「感情」,是邁向更自然人機交互的關鍵一步。OpenAI首席執行官奧特曼表示,GPT-4o的語音功能讓人想起了電影《她》,「感覺就像是電影中的人工智能,我仍然對其感到驚訝。」
目前,GPT-4o已對所有用戶免費開放,付費訂閱的ChatGPT Plus用戶的消息數量上限是免費用戶的5倍。
OpenAI的首席技術官Mira Murati表示,未來做產品要免費優先,讓更多的人使用。業内人士稱,技術叠代優化和費用下降將加速大模型走向行業應用。
不過也有觀點認為,OpenAI之所以「祭出」一些免費功能,在於行業的競爭異常激烈。無論OpenAI做出怎樣的創新,在Meta,谷歌,亞馬遜,xAi等強敵環伺的背景下,都容易被模仿甚至被趕超。此次發佈會,也宣告新一輪技術戰和價格戰的開始,其他科技巨頭也將在未來一個月内公佈AI最新進展。
值得一提的是,目前AI技術的快速發展也引起一些擔憂。圍繞版權問題的爭議持續困擾著AI企業,許多創作者也擔心,AI大模型的訓練涉及侵權問題。
此外,當地時間5月14日,在瑞士日内瓦舉行中美人工智能(AI)政府間對話首次會議,就AI科技風險、全球治理等問題進行交流。
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。
更多精彩內容,請登陸
財華香港網 (https://www.finethk.com/)
財華智庫網(https://www.finet.com.cn)
現代電視 (https://www.fintv.hk)