智算中心建設(shè)的“暗礁”與“燈塔”
是時(shí)候讓智算中心“普惠自由”了。
一家公司的辦公室有電力供應(yīng),這能給這家公司帶來區(qū)別于競爭對手的競爭優(yōu)勢嗎?
答案不言自明。
現(xiàn)在人工智能(AI)技術(shù)與公司競爭優(yōu)勢的關(guān)系正類似于電力之于公司。一百多年來,電力曾給各個(gè)產(chǎn)業(yè)賦能,AI也同樣可以給各個(gè)產(chǎn)業(yè)賦能。
從國家的層面來看,頂層設(shè)計(jì)似乎早已看到了這種趨勢,“新基建”一詞在把AI看成國之重器的同時(shí),也明確了AI和IT具有同樣的公共物品屬性:希望每個(gè)企業(yè)、個(gè)體都能用得起,并且因此而被賦能。
那么對于AI基礎(chǔ)設(shè)施而言,如何做到既要用得起又要用得好呢?——必須著眼于降低成本和大規(guī)模通用。
1.什么是AI新基建?
智算中心的一般定義是“融合架構(gòu)計(jì)算系統(tǒng)為平臺,以數(shù)據(jù)為資源,能夠以強(qiáng)大算力驅(qū)動AI模型對數(shù)據(jù)進(jìn)行深度加工,源源不斷產(chǎn)生各種智慧計(jì)算服務(wù),并通過網(wǎng)絡(luò)以云服務(wù)形式供應(yīng)給組織及個(gè)人。”
其作為人工智能產(chǎn)業(yè)發(fā)展的重要底層基礎(chǔ)設(shè)施形態(tài),已經(jīng)成為世界各國競爭角逐的戰(zhàn)略布局。在政策扶持、需求牽引下,智算中心“落地潮”在各地被快速掀起。然而在加快步伐的背后,我國人工智能算力基礎(chǔ)設(shè)施建設(shè)也同樣面臨一系列問題與挑戰(zhàn)。
正如9月11日 ,國家工業(yè)信息安全發(fā)展研究中心在《新一代人工智能算力基礎(chǔ)設(shè)施發(fā)展研究報(bào)告》中指出的兩點(diǎn):
- 市場對算力的概念混淆,導(dǎo)致建設(shè)方向和建設(shè)需求錯(cuò)位;
- 行業(yè)定價(jià)標(biāo)準(zhǔn)混亂,針對人工智能算力基礎(chǔ)設(shè)施建設(shè)的價(jià)格標(biāo)準(zhǔn)并未統(tǒng)一,各地同等規(guī)模項(xiàng)目的價(jià)格相差巨大。
在建設(shè)思路上,中國大多數(shù)計(jì)算中心采取了算力性能發(fā)展優(yōu)先,再拉動應(yīng)用發(fā)展的策略,忽視上層應(yīng)用遷移及兼容程度,導(dǎo)致算力系統(tǒng)的初期應(yīng)用效率偏低,無法完全支撐全面的智能化應(yīng)用場景需求。
另一方面,算力基礎(chǔ)設(shè)施和傳統(tǒng)基礎(chǔ)設(shè)施的特征相同,都具有高投入、高風(fēng)險(xiǎn)、高壟斷性的特點(diǎn)。實(shí)力和能力的限制,意味著智算中心不是滿大街都是,而是少量的。
而當(dāng)前智算中心的建設(shè)情況是:哪些地方和企業(yè)有能力和實(shí)力去建設(shè)智算中心,其實(shí)沒有經(jīng)過嚴(yán)格的論證,因此導(dǎo)致一些地方的建設(shè)的AI基礎(chǔ)設(shè)施與當(dāng)?shù)禺a(chǎn)業(yè)發(fā)展需求不匹配,出現(xiàn)重建輕用、重復(fù)建設(shè)等現(xiàn)象。
智算中心的建設(shè)成本主要分為三個(gè)方面:第一個(gè)是基礎(chǔ)設(shè)施的廠房建設(shè),第二個(gè)是需要的服務(wù)器、芯片等設(shè)備。第三個(gè)是后期的運(yùn)維成本、電費(fèi)等等。據(jù)知情人士透漏:“初步計(jì)算,滿足基本智算中心的也得一兩個(gè)億起步的投入規(guī)模。”
但從宏觀來看,當(dāng)前智算中心的建設(shè)情況是:目前各地都建,建設(shè)成本差距最大達(dá)6倍多。據(jù)網(wǎng)絡(luò)公開信息顯示,以國內(nèi)四個(gè)人工智能計(jì)算中心的折合單位算力建設(shè)成本投入為例,可以看到從最高的每100P16位算力投入4.6億,到最低的7500萬,差價(jià)達(dá)到了6.2倍。
“雖然一些人力成本、電力在地區(qū)間存在差異,但六倍的差距差距我還是沒有想到的。”國家工業(yè)信息安全發(fā)展研究中心副總工程師兼信息政策所所長黃鵬轉(zhuǎn)而補(bǔ)充道:“至于原因,我認(rèn)為是前期調(diào)研缺乏,尤其是智算中心的發(fā)展處于初期階段,整個(gè)行業(yè)還是在摸索、實(shí)踐過程當(dāng)中,相信后面隨著它發(fā)展的越來越好,可持續(xù)能力越來越強(qiáng),成本會降下來。”
話里話外,弦外之音,為了優(yōu)化國家資源的使用,智算中心的建設(shè)應(yīng)該參考標(biāo)準(zhǔn),規(guī)范行業(yè)價(jià)格。
2.什么樣的基建才能“賦能”?
當(dāng)前各地建設(shè)算力中心有兩個(gè)目的,第一,通過基礎(chǔ)設(shè)施投入之后,其本身能夠發(fā)展成為一個(gè)產(chǎn)業(yè);第二,基礎(chǔ)設(shè)施擁有能力之后,形成產(chǎn)業(yè)、企業(yè)集聚效應(yīng)。
前者是將新一代信息技術(shù)產(chǎn)業(yè)作為它的支撐、支柱性、引領(lǐng)性的產(chǎn)業(yè),例子是浙江,其進(jìn)行了一系列的數(shù)據(jù)改革,實(shí)現(xiàn)了一網(wǎng)通辦,政府的服務(wù)能力越來越強(qiáng);后者是滿足賦能要求,賦能需要AI技術(shù)的企業(yè)創(chuàng)造價(jià)值。
雖然是兩個(gè)目的,但卻有同一個(gè)內(nèi)涵:智算中心覆蓋很多的科學(xué)、工程實(shí)驗(yàn),還有人工智能的測試階段、推理階段。因此,智算中心一定要跟當(dāng)?shù)氐膶?shí)際應(yīng)用和場景緊密結(jié)合。
另一方面,基礎(chǔ)設(shè)施重在“基礎(chǔ)”兩個(gè)字,智算中心必須開放,首先要能夠兼容、支持絕大多數(shù)的應(yīng)用需求,至少80%以上;其次,要有打造生態(tài)的“雄心”,能夠兼容主流軟件應(yīng)用生態(tài),具備使用面廣、遷移靈活、編譯開發(fā)難度低等特點(diǎn)。
另外,普惠也是新一代智算中心所要做的。智算中心前期需要大量的資金、人力投入,這也意味著前期智算中心的服務(wù)價(jià)格可能中小企業(yè)無法承受,但這種基礎(chǔ)設(shè)施有一個(gè)規(guī)律:總成本或許很大,但邊際成本非常小,因此,隨著使用人數(shù)的增多,其平均成本遞減。
價(jià)格逐漸下降是普惠的一個(gè)標(biāo)志,但必須普惠的另一個(gè)標(biāo)志源于人工智能的特點(diǎn):越用越智能。只有越來越多的人使用智算中心,增強(qiáng)優(yōu)勢,補(bǔ)全缺點(diǎn),才能成為現(xiàn)代化強(qiáng)國基礎(chǔ)設(shè)施的內(nèi)核。
只有技術(shù)被廣泛采用,才能使得通用的標(biāo)準(zhǔn)逐漸形成,技術(shù)的使用方式也會慢慢變得標(biāo)準(zhǔn)化了,最佳實(shí)踐被廣泛理解和模仿,最后變成基礎(chǔ)設(shè)施的一部分,這也是新一代智算中心必須普惠的重要原因。
作為一種新型的公共服務(wù)平臺,《新一代人工智能算力基礎(chǔ)設(shè)施發(fā)展研究報(bào)告》也指出,新一代人工智能算力基礎(chǔ)設(shè)施應(yīng)考慮其包容性、普惠性、安全性、共享性及節(jié)能性,應(yīng)成為能夠覆蓋多元算力的創(chuàng)新融合型算力平臺、能夠兼容行業(yè)主流軟件的開放包容型算力平臺、能夠確保自主可信和持續(xù)升級的安全可信型算力平臺、能夠?qū)崿F(xiàn)資源跨區(qū)域流動的快速靈活型算力平臺,以及低能耗、高效能的綠色節(jié)能型算力平臺。
本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。