中新網(wǎng)上海新聞9月2日電(李佳佳)大模型加深度學(xué)習(xí)平臺,貫通AI全產(chǎn)業(yè)鏈,是產(chǎn)業(yè)智能化的基座。百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰在上海舉辦的2022世界人工智能大會(WAIC 2022)“AI開源開放與產(chǎn)業(yè)智能化高峰論壇”上說,大模型的產(chǎn)業(yè)模式將是“類臺積電”模式。
當(dāng)前,作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,人工智能技術(shù)呈現(xiàn)出很強(qiáng)的通用性,廣泛滲透進(jìn)經(jīng)濟(jì)生產(chǎn)活動的主要環(huán)節(jié)。大模型是近幾年人工智能發(fā)展的重要方向,具有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化的特點(diǎn),進(jìn)一步增強(qiáng)了人工智能的通用性,為人工智能進(jìn)一步發(fā)展帶來了新機(jī)遇。
與此同時,大模型研發(fā)也面臨著數(shù)據(jù)規(guī)模大、數(shù)據(jù)質(zhì)量參差不齊、模型體積大、訓(xùn)練難度高、算力需求大等一系列挑戰(zhàn)。
在這樣的背景下,如何加速大模型的產(chǎn)業(yè)落地,讓大模型發(fā)揮更大價值?在王海峰看來,具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)可以將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。如此一來,大數(shù)據(jù)、大算力、大模型能力僅需少數(shù)企業(yè)操心,千行百業(yè)直接應(yīng)用AI模型即可。
王海峰以臺積電、三星等企業(yè)為例,進(jìn)一步闡釋大模型的產(chǎn)業(yè)模式,可類比芯片行業(yè)的代工廠模式。他表示,“芯片制造工藝有很高的技術(shù)壁壘,有價格高昂的產(chǎn)線,能夠根據(jù)客戶需求,標(biāo)準(zhǔn)化、自動化地大批量生產(chǎn)芯片,形成規(guī)模經(jīng)濟(jì)。同理,大模型生產(chǎn)企業(yè)在大模型能力、海量數(shù)據(jù)、大規(guī)模算力等方面具有優(yōu)勢,能夠根據(jù)AI應(yīng)用方的需求,自動化、標(biāo)準(zhǔn)化地進(jìn)行多場景多領(lǐng)域的模型生產(chǎn),當(dāng)達(dá)到一定規(guī)模時,即可形成健康、可持續(xù)發(fā)展的大模型產(chǎn)業(yè)模式!
大模型的開發(fā)、訓(xùn)練、推理部署以及產(chǎn)業(yè)落地,離不開深度學(xué)習(xí)平臺的支撐。深度學(xué)習(xí)平臺下接芯片,上承應(yīng)用,相當(dāng)于智能時代的“操作系統(tǒng)”。大模型加上深度學(xué)習(xí)平臺,可以貫通從硬件適配、模型訓(xùn)練、推理部署,到場景應(yīng)用的AI全產(chǎn)業(yè)鏈。
大模型的“類臺積電”產(chǎn)業(yè)模式,已經(jīng)在百度的大模型實踐中得到驗證。
百度研制了文心產(chǎn)業(yè)級知識增強(qiáng)大模型系列,包括以鵬城-百度·文心為代表的基礎(chǔ)通用大模型、生物計算領(lǐng)域大模型,以及能源、金融和航天行業(yè)大模型等,還包括輔助大模型適配場景應(yīng)用的工具和平臺,探索生態(tài)共建的創(chuàng)意社區(qū)旸谷等。百度文心大模型也作為今年WAIC “八大鎮(zhèn)館之寶”之一,在展區(qū)硬核亮相。
文心系列大模型的成功研制和應(yīng)用,背后是基于飛槳的有力支撐。飛槳作為我國首個自主研發(fā)、開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺,集核心框架、產(chǎn)業(yè)級模型庫、開發(fā)套件和工具組件,以及學(xué)習(xí)和實訓(xùn)社區(qū)于一體,標(biāo)準(zhǔn)化、自動化地支撐大模型生產(chǎn)和應(yīng)用。
在大模型訓(xùn)練方面,飛槳研發(fā)了端到端自適應(yīng)分布式訓(xùn)練技術(shù),根據(jù)模型特性和算力平臺特性,自動選擇并行策略,實現(xiàn)端到端極致的性能優(yōu)化。
在大模型推理方面,飛槳打造了針對大模型的壓縮、推理、服務(wù)化全流程部署方案,能廣泛支持不同種類的模型結(jié)構(gòu),實現(xiàn)高速推理。同時,飛槳還提供自動模型壓縮工具,幫助節(jié)約算力資源。
文心大模型基于飛槳平臺開源開放,共建生態(tài),累計已有超過1萬開發(fā)者,基于文心大模型,創(chuàng)建了3萬多個任務(wù)。目前,文心大模型已廣泛應(yīng)用于百度產(chǎn)品,顯著提升產(chǎn)品效果和研發(fā)效率,并應(yīng)用于金融、能源、醫(yī)療、制造、企業(yè)服務(wù)等領(lǐng)域,大模型的生態(tài)初現(xiàn)崢嶸。
“大模型的產(chǎn)業(yè)模式將是‘類臺積電’模式。大模型加上深度學(xué)習(xí)平臺,貫通AI全產(chǎn)業(yè)鏈,是產(chǎn)業(yè)智能化的基座。”王海峰最后總結(jié)。
注:請在轉(zhuǎn)載文章內(nèi)容時務(wù)必注明出處!
編輯:李佳佳