中新網上海新聞7月7日電(李佳佳)在剛剛結束的2024世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——超級模型、超級應用、超級機遇”上,啟明創(chuàng)投在上一屆論壇的基礎上,圍繞大語言模型、多模態(tài)模型、商業(yè)機會等發(fā)布2024生成式AI十大展望。
作為中國在AI領域最早投資且布局最豐富的投資機構,這是啟明創(chuàng)投連續(xù)第二年主辦該論壇,也是本屆世界人工智能大會唯一一場由創(chuàng)業(yè)投資機構發(fā)起的、旨在從創(chuàng)新視角展示和探討生成式AI的分論壇。
啟明創(chuàng)投從2013年開始系統(tǒng)性布局人工智能領域,從AI 1.0到AI 2.0,經過十余年的深耕與前沿洞察,啟明創(chuàng)投在AI領域投資了眾多項目,多家上市或成長為獨角獸企業(yè)。
啟明創(chuàng)投主管合伙人周志峰在論壇開幕環(huán)節(jié)發(fā)表了題為“技術突破到應用變革 - AI發(fā)展的新篇章”的演講。他指出,生成式人工智能已成為全球創(chuàng)業(yè)與投資的熱點。僅2023年,一級市場中AI投資金額就達224億美元,超過了前10年投資累計總和。其中,超過三分之二的資金投向從事基礎設施或模型開發(fā)的企業(yè)。
在說到中國在人工智能領域的表現(xiàn)時,周志峰說,中國AI發(fā)展?jié)摿薮,不僅技術強、人才多,而且應用經驗豐富。在為生成式AI創(chuàng)業(yè)企業(yè)創(chuàng)始人進行畫像時可以看到,迄今為止,AI領域科學家和科技巨頭AI研究負責人作為創(chuàng)始人的占比仍在三分之一左右,這表明AI技術的發(fā)展仍處于早期階段。在技術底座仍在高速動態(tài)發(fā)展的時期,科學家類型的團隊更容易理解技術的邊界和可用性,保持高敏感度!拔覀冋J為,通常在一個技術引爆點出現(xiàn)后的6至12個月內,行業(yè)專家類型的創(chuàng)始人會陸續(xù)下場創(chuàng)業(yè),反映出AI正朝著‘深應用’方向發(fā)展!
他同時提到當前生成式AI應用落地仍待解決的三個問題,即面對高昂的成本,生成式AI如何實現(xiàn)廣泛普及;減少幻覺、應對誤導性問題及在不同場景下提供相應的準備和合適的問題,是大模型能否賦能千行百業(yè)的關鍵;生成式AI應用留存率低,如何讓用戶真正去使用,而非僅僅是嘗鮮。
最后,他圍繞大語言模型、多模態(tài)模型、商業(yè)機會等做出2024生成式AI十大展望:
—— 當前生成式AI的兩大核心技術GPT和擴散模型將逐步融合,激發(fā)全新模型能力;
——高質量數據的獲取和組織將顯著影響新一代模型,合成數據在預訓練中的占比將大幅提升;
——Multi-Agent技術將飛躍,通過優(yōu)化協(xié)作和分工顯著提升生成式AI效率和效果;
——將出現(xiàn)圖像和文本的統(tǒng)一連續(xù)表示,并且基于此的圖文聯(lián)合擴散模型將達到GPT-4o級別能力;
——圖像和視頻隱空間表示的壓縮率提升五倍以上,從而使生成速度提升五倍以上;
——3年內視頻生成將全面爆發(fā),結合3D能力,可控的視頻生成將對影視、動畫、短片的生產模式帶來變革;
——我們將見證壓縮更多模態(tài)信息的超級多模態(tài)大模型,如文本、圖像、語音、音樂、3D、傳感器數據(控制信號、眼動信號、手勢信息、雷達信號等);
——生成式AI打通了人類語言與機器語言的轉換通道,命令機器完成復雜任務的成本將顯著降低,帶來巨大的生產力變革;
——端側推理會有巨大增長,來自三個因素的疊加:推理優(yōu)化算法+端側推理芯片+端側大模型;
——AI將在多個數字化水平較高的行業(yè)中占據主導地位,并將重塑絕大部分企業(yè)軟件。
注:請在轉載文章內容時務必注明出處!
編輯:李佳佳