日前,首部AI生成長篇電影《Our T2 Remake》在洛杉矶正式舉行線下首映禮。
該片翻拍自卡梅隆執導的經典科幻片《終結者2》(1991年),呈現了一個人類對抗ChatGPT統治的世界,探討當代AI發展的影響。
由50位AI領域的藝術家分段創作,他們借助ChatGPT、Midjourney、Pika、Kaiber等人工智能技術,影片創作全程都由AI完成。
雖然由AI生成的場景相對粗糙,很多細節經不起推敲,但不可否認的是,「這將成為AI在電影制作應用中的一個重要里程碑,他們向世界展示了,通過AI創作自己喜歡的史詩級故事的能力」,正如該片制作團隊在首映禮上所說。
如果說2023年是生成式人工智能技術「狂奔的一年」,那麽2024年則有望成為人工智能應用大發展的「元年」。隨著AI生成視頻技術的迅速發展和廣泛應用,也將為各行各業帶來新機遇。
01 虛擬人生成
虛擬人是綜合運用文本、圖像、音頻等生成技術,打造綜合外觀、表情等產出全面擬人化的數字内容。其中,非交互式虛擬人的生成依賴於輸入的内容,真人驅動的虛擬人依賴於真人的實時反映,交互式虛擬人可以全自動化。
2022年内容消費型虛擬人和工具型虛擬人應用佔比分别未86.9%和13.10%。未來隨著虛擬人生成技術的成熟和成本的下滑,2030年内容消費型虛擬人佔比下滑至58.5%,工具型和内容生產型虛擬人上升至27.7%和13.8%。
工具型虛擬人商業模式以通過定制來收取定制費用或租賃費為主,由於存在技術壁壘和成本過高問題,商業變現空間有限。内容型虛擬人以IP盈利為主,商業模式更為成熟,目前IP商業模式市場競爭激烈。
C端虛擬人粉絲群體較為年輕化,15-34歲的用戶群體佔比在60%,虛擬人外觀、内容質量和性格是影響用戶成為虛擬人粉絲群體和脫離虛擬人粉絲群體的前三大因素。
02 音視頻生成
AI生成音頻是指以語言模型為中介,對音樂數據進行雙向轉化,進而實現合成模擬人的音調的語音、音樂作曲等。以谷歌的AudioLM模型為例,該模型有51.2%的成功率能夠讓人類分辨不出是AI生成的。
AI生成音頻的應用場景包括TTS場景和樂曲/歌曲生成場景,TTS應用成熟度高於樂曲生成。國内短視頻平台、音樂平台等頭部嘗試均開始研發和實踐AI作曲,均未實商業化應用。
AI生成視頻指基於文本、圖像和視頻數據庫,通過模型訓練後,達到文本轉圖像後轉視頻或文本轉視頻的效果。目前市面上主流的AI視頻生成工具以海外工具為主,包括Make-A-Video、Phenaki等,均未實現商業化。
AI深度合成視頻自2021年始進入爆發性增長階段,數量達到24,317條,其視頻的内容數量最多的為影視娛樂。從AI視頻生成的落地場景來看,視頻屬性編輯落地最廣和技術最淺,視頻部分生成落地較少,技術難度最高。
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。
更多精彩內容,請登陸
財華香港網 (https://www.finethk.com/)
財華智庫網(https://www.finet.com.cn)
現代電視 (https://www.fintv.hk)