123,123

　　中新網上海新聞7月7日電(李佳佳)在剛剛結束的2024世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——超級模型、超級應用、超級機遇”上，啟明創(chuàng)投在上一屆論壇的基礎上，圍繞大語言模型、多模態(tài)模型、商業(yè)機會等發(fā)布2024生成式AI十大展望。

　　作為中國在AI領域最早投資且布局最豐富的投資機構，這是啟明創(chuàng)投連續(xù)第二年主辦該論壇，也是本屆世界人工智能大會唯一一場由創(chuàng)業(yè)投資機構發(fā)起的、旨在從創(chuàng)新視角展示和探討生成式AI的分論壇。

　　啟明創(chuàng)投從2013年開始系統(tǒng)性布局人工智能領域，從AI 1.0到AI 2.0，經過十余年的深耕與前沿洞察，啟明創(chuàng)投在AI領域投資了眾多項目，多家上市或成長為獨角獸企業(yè)。

　　啟明創(chuàng)投主管合伙人周志峰在論壇開幕環(huán)節(jié)發(fā)表了題為“技術突破到應用變革 - AI發(fā)展的新篇章”的演講。他指出，生成式人工智能已成為全球創(chuàng)業(yè)與投資的熱點。僅2023年，一級市場中AI投資金額就達224億美元，超過了前10年投資累計總和。其中，超過三分之二的資金投向從事基礎設施或模型開發(fā)的企業(yè)。

　　在說到中國在人工智能領域的表現(xiàn)時，周志峰說，中國AI發(fā)展?jié)摿薮�，不僅技術強、人才多，而且應用經驗豐富。在為生成式AI創(chuàng)業(yè)企業(yè)創(chuàng)始人進行畫像時可以看到，迄今為止，AI領域科學家和科技巨頭AI研究負責人作為創(chuàng)始人的占比仍在三分之一左右，這表明AI技術的發(fā)展仍處于早期階段。在技術底座仍在高速動態(tài)發(fā)展的時期，科學家類型的團隊更容易理解技術的邊界和可用性，保持高敏感度�！拔覀冋J為，通常在一個技術引爆點出現(xiàn)后的6至12個月內，行業(yè)專家類型的創(chuàng)始人會陸續(xù)下場創(chuàng)業(yè)，反映出AI正朝著‘深應用’方向發(fā)展�！�

　　他同時提到當前生成式AI應用落地仍待解決的三個問題，即面對高昂的成本，生成式AI如何實現(xiàn)廣泛普及；減少幻覺、應對誤導性問題及在不同場景下提供相應的準備和合適的問題，是大模型能否賦能千行百業(yè)的關鍵；生成式AI應用留存率低，如何讓用戶真正去使用，而非僅僅是嘗鮮。

　　最后，他圍繞大語言模型、多模態(tài)模型、商業(yè)機會等做出2024生成式AI十大展望：

　　—— 當前生成式AI的兩大核心技術GPT和擴散模型將逐步融合，激發(fā)全新模型能力；

　　——高質量數據的獲取和組織將顯著影響新一代模型，合成數據在預訓練中的占比將大幅提升；

　　——Multi-Agent技術將飛躍，通過優(yōu)化協(xié)作和分工顯著提升生成式AI效率和效果；

　　——將出現(xiàn)圖像和文本的統(tǒng)一連續(xù)表示，并且基于此的圖文聯(lián)合擴散模型將達到GPT-4o級別能力；

　　——圖像和視頻隱空間表示的壓縮率提升五倍以上，從而使生成速度提升五倍以上；

　　——3年內視頻生成將全面爆發(fā)，結合3D能力，可控的視頻生成將對影視、動畫、短片的生產模式帶來變革；

　　——我們將見證壓縮更多模態(tài)信息的超級多模態(tài)大模型，如文本、圖像、語音、音樂、3D、傳感器數據(控制信號、眼動信號、手勢信息、雷達信號等)；

　　——生成式AI打通了人類語言與機器語言的轉換通道，命令機器完成復雜任務的成本將顯著降低，帶來巨大的生產力變革；

　　——端側推理會有巨大增長，來自三個因素的疊加：推理優(yōu)化算法+端側推理芯片+端側大模型；

　　——AI將在多個數字化水平較高的行業(yè)中占據主導地位，并將重塑絕大部分企業(yè)軟件。

注：請在轉載文章內容時務必注明出處!

編輯：李佳佳