近日,中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所副所長(zhǎng)栗蔚接受科技云報(bào)道獨(dú)家專(zhuān)訪,分享了她對(duì)云計(jì)算的獨(dú)到見(jiàn)解。
ChatGPT的成功也是云計(jì)算的成功
在數(shù)字原生時(shí)代,ChatGPT是一個(gè)頗具時(shí)代特色的產(chǎn)物。作為一款現(xiàn)象級(jí)的AI工具,幾乎所有人都將目光投向了ChatGPT的算法層面。但在栗蔚看來(lái),云計(jì)算在其中扮演了非常關(guān)鍵的作用,和算法優(yōu)化同樣重要。
“OpenAI與云計(jì)算的聯(lián)姻,就像大腦找到了中樞神經(jīng),不僅僅催生出ChatGPT這樣的爆款產(chǎn)品,更是充分釋放出以云計(jì)算為中樞神經(jīng)構(gòu)建的數(shù)字生命體的競(jìng)爭(zhēng)力。”栗蔚說(shuō)。
縱觀應(yīng)用模型近十年發(fā)展史,人工智能模型不斷涌現(xiàn),卻從未出現(xiàn)一款智能應(yīng)用如ChatGPT一樣深刻、廣泛地改變?nèi)祟?lèi)社會(huì)生活,太多企業(yè)聚焦在模型算法的優(yōu)化改良,而忽略了云計(jì)算中樞神經(jīng)作用的發(fā)揮,也許是其中一個(gè)原因。
據(jù)栗蔚分析,ChatGPT作為一款“數(shù)字原生”的人工智能,云原生理念和技術(shù)是其勝出的重要因素。
一是云原生技術(shù)為ChatGPT提供超大規(guī)模并行計(jì)算的統(tǒng)一調(diào)度分發(fā)服務(wù)能力,顯著降低ChatGPT訓(xùn)練成本。
在ChatGPT的訓(xùn)練中,高達(dá)1750億個(gè)參數(shù)在底層進(jìn)行運(yùn)算,這種超大規(guī)模的模型計(jì)算需要對(duì)底層大規(guī)模算力統(tǒng)一編排和調(diào)度,但這種能力單純靠GPU提供算力是很難實(shí)現(xiàn)的,需要云計(jì)算技術(shù)來(lái)實(shí)現(xiàn)分布式計(jì)算。
這一觀點(diǎn)在ChatGPT的回復(fù)中也得到了印證。ChatGPT表示自己在模型訓(xùn)練中使用了分布式計(jì)算,底層基于云原生K8S服務(wù)根據(jù)不同的維度分布成超高量級(jí)節(jié)點(diǎn)的調(diào)度,進(jìn)行分布式的節(jié)點(diǎn)計(jì)算。當(dāng)問(wèn)到分布式計(jì)算節(jié)點(diǎn)有多少時(shí),ChatGPT表示規(guī)模太大了,無(wú)法透露。這也在一定程度上反映出大模型的訓(xùn)練消耗資源是非常大的,想要訓(xùn)練一個(gè)類(lèi)似ChatGPT的產(chǎn)品,成本非常高昂。栗蔚表示,如果沒(méi)有云計(jì)算的支撐,時(shí)間成本和經(jīng)濟(jì)成本將雙向上升。
據(jù)公開(kāi)資料顯示,過(guò)去兩年半,GPT-3等大模型的訓(xùn)練成本下降了80%以上,從首次訓(xùn)練開(kāi)銷(xiāo)1200萬(wàn)美元降至140萬(wàn)美元,其中很重要的原因就在于采用了云計(jì)算技術(shù)——多維信息部署、分布式調(diào)度計(jì)算、數(shù)據(jù)離混部技術(shù)從而大幅節(jié)約了AI模型的訓(xùn)練成本。
二是云原生技術(shù)能夠?qū)崿F(xiàn)多維應(yīng)用部署,實(shí)現(xiàn)了ChatGPT的情景學(xué)習(xí)模式以及多模態(tài)(文本、代碼、圖片等多維度信息)輸入。
ChatGPT得以突破以往人工智能只能聚焦文字、圖片、語(yǔ)音等某一維度的訓(xùn)練,轉(zhuǎn)而實(shí)現(xiàn)多維度的訓(xùn)練,迸發(fā)出驚人的自然語(yǔ)言處理能力,其重要原因正是云原生技術(shù)。
其中,云原生容器作為數(shù)字生命體的神經(jīng)元,承載著模型參數(shù)類(lèi)型以及調(diào)度連接的容器節(jié)點(diǎn),具有標(biāo)準(zhǔn)化部署多維應(yīng)用的能力,對(duì)文本、語(yǔ)音、圖像等異構(gòu)信息標(biāo)準(zhǔn)化接入部署,對(duì)“眼耳鼻舌身意”多維信息部署處理,加速數(shù)字大腦,也就是人工智能算法的進(jìn)化。
三是通過(guò)云原生離混部技術(shù)實(shí)現(xiàn)離散訓(xùn)練、在線微調(diào),實(shí)現(xiàn)了ChatGPT的人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式。
ChatGPT基于大量?jī)?yōu)質(zhì)的數(shù)據(jù)語(yǔ)料訓(xùn)練,實(shí)現(xiàn)對(duì)話(huà)意圖識(shí)別和內(nèi)容生成能力的突破,這主要由于ChatGPT具有強(qiáng)大的智能算法學(xué)習(xí)和記憶調(diào)用基礎(chǔ)。
通過(guò)云原生離線混部和極致彈性調(diào)用機(jī)制,離線訓(xùn)練千億級(jí)別的超大規(guī)模參數(shù),形成了ChatGPT的存儲(chǔ)記憶資源池,通過(guò)在線補(bǔ)充完成人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式,模擬各個(gè)腦功能區(qū)的反饋,實(shí)現(xiàn)多任務(wù)單詞、句子、圖片之間關(guān)系的小規(guī)模反饋下的自我監(jiān)督學(xué)習(xí)。
四是云原生+AI原生聯(lián)動(dòng)開(kāi)啟全新商業(yè)模式形成良性生態(tài)循環(huán)。
在開(kāi)發(fā)側(cè),ChatGPT 依賴(lài)于云計(jì)算服務(wù),多年來(lái)OpenAI共收到了上百億的投資,這些資金幫助 OpenAI 在平臺(tái)上運(yùn)行和訓(xùn)練其模型;在產(chǎn)品側(cè),OpenAI 基于Cloud Native進(jìn)行應(yīng)用開(kāi)發(fā),基于云計(jì)算提供的便捷高性能計(jì)算運(yùn)算模型和打磨算法,并對(duì)外銷(xiāo)售產(chǎn)品和 API;而投資方基于AI Native來(lái)提升搜索、繪畫(huà)等產(chǎn)品,未來(lái)會(huì)在Office、Teams甚至操作系統(tǒng)等產(chǎn)品中用到OpenAI提供的能力。
云計(jì)算: 數(shù)字生命體的中樞神經(jīng)
“傳統(tǒng)人工智能側(cè)重模型算法創(chuàng)新,卻忽略了智能是一個(gè)復(fù)雜的系統(tǒng)化工程。就像人類(lèi)的智能一樣,整體智能應(yīng)該包括腦區(qū)部分和中樞神經(jīng),只有腦區(qū)而沒(méi)有中樞神經(jīng)的智能是靜止的智能,人工智能應(yīng)該建立在完善的中樞神經(jīng)之上的”。
這個(gè)比喻也讓栗蔚找到了云計(jì)算的獨(dú)特定位——云計(jì)算是數(shù)字生命體的中樞神經(jīng)。
首先,云計(jì)算中樞神經(jīng)能夠?qū)崿F(xiàn)數(shù)字世界鏈接算力和腦區(qū)(應(yīng)用)的調(diào)度系統(tǒng)。
云計(jì)算分布式能夠調(diào)度超高量異構(gòu)高性能計(jì)算GPU和通用計(jì)算CPU資源,對(duì)于異構(gòu)的計(jì)算資源,云計(jì)算屏蔽了復(fù)雜的部署框架,給大規(guī)模參數(shù)一個(gè)標(biāo)準(zhǔn)化計(jì)算環(huán)境,可以高效得使用異構(gòu)算力,降低了大量開(kāi)發(fā)的開(kāi)銷(xiāo)和運(yùn)行的成本,提高了效率。
其次,云計(jì)算中樞神經(jīng)能夠?qū)崿F(xiàn)數(shù)字世界接入、部署和連接多維腦區(qū)(多維應(yīng)用)。
大部分傳統(tǒng)人工智能就像早期腔體動(dòng)物只有一個(gè)腦區(qū),只能學(xué)習(xí)訓(xùn)練單一維度參數(shù),而ChatGPT卻可以圍繞某個(gè)主題同時(shí)學(xué)習(xí)多維(圖像、語(yǔ)音、文本等)信息,原因就在于云計(jì)算能夠?qū)崿F(xiàn)多維模型參數(shù)的標(biāo)準(zhǔn)化部署,使得云計(jì)算可以將不同應(yīng)用參數(shù)通過(guò)云原生容器等技術(shù)標(biāo)準(zhǔn)化部署在不同節(jié)點(diǎn),并相互連接處理,通過(guò)云原生數(shù)據(jù)庫(kù)等實(shí)現(xiàn)多維數(shù)據(jù)的統(tǒng)一處理。就像人類(lèi)的大腦中樞神經(jīng)一樣,連接處理不同層級(jí)和不同維度的腦區(qū)。
再次,云計(jì)算中樞神經(jīng)能夠?qū)崿F(xiàn)數(shù)字世界存儲(chǔ)記憶(離線訓(xùn)練)和各個(gè)腦區(qū)(在線提示引導(dǎo))。
通過(guò)云原生離線混部技術(shù)支持ChatGPT離線訓(xùn)練,在線提示引導(dǎo)的算法實(shí)現(xiàn),就像人類(lèi)中樞神經(jīng)會(huì)不斷傳遞經(jīng)驗(yàn)和現(xiàn)實(shí)信息給大腦進(jìn)行大腦信息修正,在用戶(hù)看來(lái)ChatGPT可以根據(jù)交流調(diào)整答案,非常智能。
“這么多年來(lái),大家都覺(jué)得云好像很重要,但是又說(shuō)不清楚云計(jì)算到底是干嘛的,云在數(shù)字世界扮演一個(gè)什么樣的角色。這和中樞神經(jīng)很像,說(shuō)不清在哪兒,但又非常重要。其實(shí)云計(jì)算和中樞神經(jīng)一樣無(wú)處不在”,栗蔚說(shuō)。
數(shù)字原生企業(yè) 優(yōu)先打造“中樞神經(jīng)”
“云計(jì)算作為企業(yè)中樞神經(jīng)的意義應(yīng)該被更廣泛認(rèn)知”。
在栗蔚看來(lái),盡管?chē)?guó)內(nèi)云計(jì)算市場(chǎng)發(fā)展多年,但大多數(shù)企業(yè)仍沒(méi)有意識(shí)到云計(jì)算的重要性。很多企業(yè)還停留在早期云服務(wù)時(shí)代,把云計(jì)算當(dāng)做虛擬化資源使用,只看到了云計(jì)算降低成本、高效開(kāi)發(fā)的價(jià)值。但實(shí)際上,云計(jì)算是企業(yè)的中樞神經(jīng),可以實(shí)現(xiàn)企業(yè)各部門(mén)的業(yè)務(wù)軟件貫通、數(shù)據(jù)貫通處理、流程IT再造。
事實(shí)上,正因?yàn)榇蟛糠制髽I(yè)沒(méi)有認(rèn)識(shí)到云計(jì)算深層次的價(jià)值,國(guó)內(nèi)上云率一直停滯不前。據(jù)中國(guó)信通院統(tǒng)計(jì)去數(shù)據(jù)顯示,2021年我國(guó)企業(yè)的上云率僅有30%,工業(yè)、交通、能源等傳統(tǒng)行業(yè)上云率更低,僅為20%左右。這一數(shù)據(jù)在近兩年內(nèi)并未明顯變化。
隨著全球數(shù)字化進(jìn)程越來(lái)越深入,數(shù)字原生將成為企業(yè)的核心競(jìng)爭(zhēng)力。栗蔚表示,由于建立在中樞神經(jīng)的發(fā)育上,數(shù)字原生企業(yè)天生適配數(shù)字世界規(guī)則,擁有數(shù)字世界的強(qiáng)大競(jìng)爭(zhēng)力,將傳統(tǒng)模式的企業(yè)遠(yuǎn)遠(yuǎn)甩在身后。
“就像云計(jì)算實(shí)現(xiàn)了ChatGPT多維信息綜合處理,異構(gòu)算力資源一體化調(diào)度,作為企業(yè)中樞神經(jīng)的云計(jì)算,能夠打通從上游采購(gòu)到下游客戶(hù)的全流程業(yè)務(wù)鏈條,打破煙囪式流程,實(shí)現(xiàn)采購(gòu)、生產(chǎn)、銷(xiāo)售、渠道、用戶(hù)消費(fèi)、人財(cái)物等全業(yè)務(wù)流程再造和創(chuàng)新,以及各環(huán)節(jié)數(shù)據(jù)統(tǒng)一匯聚和處理”。栗蔚表示,云計(jì)算結(jié)合人工智能、大數(shù)據(jù)等技術(shù),幫助企業(yè)成為擁有“中樞神經(jīng)”和“大腦”的完整智能體,即轉(zhuǎn)型升級(jí)為“數(shù)字原生新實(shí)體”
在栗蔚看來(lái),數(shù)字原生企業(yè)具有明顯的特征:將云原生、大數(shù)據(jù)等數(shù)字思維刻劃在企業(yè)DNA里,具備中樞神經(jīng)、大腦、開(kāi)放學(xué)習(xí)能力和智慧創(chuàng)新的四位一體智慧能力。而這些企業(yè)數(shù)字原生的進(jìn)化過(guò)程,正是基于云原生這個(gè)最重要的神經(jīng)元能力支撐技術(shù)上發(fā)育而成。
所有企業(yè)都希望獲得數(shù)字化轉(zhuǎn)型的成功,但企業(yè)想要在數(shù)字原生時(shí)代勝出,云計(jì)算作為企業(yè)中樞神經(jīng)的意義就更應(yīng)該被廣泛認(rèn)知。不僅如此,栗蔚認(rèn)為還需要給予企業(yè)更多的助力。
一是,打造更加高質(zhì)量的、云原生的產(chǎn)品,全方位多層次滿(mǎn)足企業(yè)需求。
栗蔚建議云服務(wù)商針對(duì)不同行業(yè)、規(guī)模、類(lèi)型的企業(yè),提供細(xì)分的產(chǎn)品和服務(wù)方案。對(duì)于大部分的中小企業(yè),提供中樞神經(jīng)“即插即用”的能力;對(duì)于大企業(yè),建立“中樞神經(jīng)”;對(duì)于傳統(tǒng)企業(yè)等剛剛上云的企業(yè),從一開(kāi)始就要做好中樞神經(jīng)的規(guī)劃。
二是,健全標(biāo)準(zhǔn)和評(píng)估體系,引導(dǎo)企業(yè)建立“中樞神經(jīng)”,轉(zhuǎn)型為數(shù)字原生生命體。
目前,中國(guó)信通院已發(fā)布了《云原生技術(shù)架構(gòu)成熟度》標(biāo)準(zhǔn),幫助企業(yè)打造一個(gè)成熟的云原生技術(shù)架構(gòu);《企業(yè)數(shù)字化成熟度模型IOMM》則針對(duì)不同行業(yè)、不同規(guī)模企業(yè)制定面向企業(yè)整體視角和企業(yè)IT部門(mén)視角的成熟度模型,通過(guò)“六大能力+六大價(jià)值+五類(lèi)成熟度等級(jí)”對(duì)企業(yè)數(shù)字化轉(zhuǎn)型能力水平進(jìn)行評(píng)估,幫助各類(lèi)企業(yè)更好地建設(shè)自己的“中樞神經(jīng)”。
盡管?chē)?guó)內(nèi)大部分企業(yè)數(shù)字化水平離“中樞神經(jīng)”還很遠(yuǎn),但栗蔚并不氣餒。
“數(shù)字化時(shí)代,云計(jì)算正在成為數(shù)字生命體的中樞神經(jīng),成為企業(yè)數(shù)字化轉(zhuǎn)型的胎生力量,這一趨勢(shì)已經(jīng)到來(lái)。我們要做的就是探索數(shù)字原生新實(shí)體的發(fā)展路徑,推廣相關(guān)經(jīng)驗(yàn),讓更多傳統(tǒng)企業(yè)理解‘?dāng)?shù)字原生’、‘中樞神經(jīng)’理念,持續(xù)增強(qiáng)企業(yè)創(chuàng)新活力和競(jìng)爭(zhēng)力?!?/p>
在栗蔚看來(lái),云計(jì)算技術(shù)在未來(lái)還將持續(xù)演進(jìn):一是重新定義軟硬件,實(shí)現(xiàn)異構(gòu)算力的統(tǒng)一編排調(diào)度;二是打造算網(wǎng)云融合的操作系統(tǒng);三是實(shí)現(xiàn)數(shù)字世界新界面,通過(guò)標(biāo)準(zhǔn)化的API接口,打造遍布數(shù)字世界的神經(jīng)元。
到那時(shí),云計(jì)算作為“中樞神經(jīng)”價(jià)值將賦能千行百業(yè),更多企業(yè)成為長(zhǎng)在數(shù)字世界中的數(shù)字原生新實(shí)體。
資訊來(lái)源:“科技云報(bào)道”,原文鏈接:https://mp.ofweek.com/cloud/a356714618337