北京時間周二(5月14日)淩晨,全球人工智能的執牛耳者OpenAI公司在線上舉辦了「春季更新」活動。
本次活動中,OpenAI發佈了新旗艦模型「GPT-4o」,可以實時對音頻、視覺和文本進行推理。據悉,新模型使ChatGPT能夠處理50種不同的語言,同時提高了速度和質量。
在此前,用戶使用語音模式與ChatGPT對話時,平均延遲達到數秒鍾,音頻在輸入時還會由於處理方式丢失大量信息,讓GPT-4無法直接觀察音調、說話的人和背景噪音,也無法輸出笑聲、歌唱聲和表達情感。
而最新的GPT-4o延遲很低,與人類在對話中的反應時間相近,講述故事宛如真人。與現有模型相比,其在圖像和音頻處理方面很出色,甚至可以從急促的喘氣聲中理解「緊張」的含義,並且指導對方進行深呼吸等等。
可以說,GPT-4o使得AI表達有了「感情」,是邁向更自然人機交互的關鍵一步。OpenAI首席執行官奧特曼表示,GPT-4o的語音功能讓人想起了電影《她》,「感覺就像是電影中的人工智能,我仍然對其感到驚訝。」
目前,GPT-4o已對所有用戶免費開放,付費訂閱的ChatGPT Plus用戶的消息數量上限是免費用戶的5倍。
OpenAI的首席技術官Mira Murati表示,未來做產品要免費優先,讓更多的人使用。業内人士稱,技術叠代優化和費用下降將加速大模型走向行業應用。
不過也有觀點認為,OpenAI之所以「祭出」一些免費功能,在於行業的競爭異常激烈。無論OpenAI做出怎樣的創新,在Meta,谷歌,亞馬遜,xAi等強敵環伺的背景下,都容易被模仿甚至被趕超。此次發佈會,也宣告新一輪技術戰和價格戰的開始,其他科技巨頭也將在未來一個月内公佈AI最新進展。
值得一提的是,目前AI技術的快速發展也引起一些擔憂。圍繞版權問題的爭議持續困擾著AI企業,許多創作者也擔心,AI大模型的訓練涉及侵權問題。
此外,當地時間5月14日,在瑞士日内瓦舉行中美人工智能(AI)政府間對話首次會議,就AI科技風險、全球治理等問題進行交流。
更多精彩內容,請登陸
財華香港網 (https://www.finethk.com/)
現代電視 (http://www.fintv.com)