大模型時代,金山云以云為基石,差異化打法布局未來
原創(chuàng)在生成式人工智能浪潮的推動下,每個企業(yè)都面臨著如何緊跟時代潮流、創(chuàng)新業(yè)務(wù)模式的挑戰(zhàn)。而這些挑戰(zhàn)也給諸如云廠商等帶來了更多的發(fā)展新機遇。
作為一家在云計算領(lǐng)域深耕多年的企業(yè),金山云始終關(guān)注著技術(shù)發(fā)展的趨勢,并積極探索如何幫助企業(yè)將這些技術(shù)應(yīng)用于實際業(yè)務(wù)中。一方面,金山云夯實云計算基礎(chǔ),通過技術(shù)和產(chǎn)品能力的升級,助力大模型服務(wù)商更好地發(fā)展。另一方面,為了幫助特定領(lǐng)域行業(yè)用戶提升效率,金山云圍繞人工智能,探索行業(yè)大模型、模型平臺以及知識助手等,以便更好地滿足行業(yè)客戶的業(yè)務(wù)需求。
金山云副總裁錢一峰表示,金山云延續(xù)中立的優(yōu)勢,依托底層算力網(wǎng)絡(luò)優(yōu)勢以及混合云部署差異化優(yōu)勢,聚焦業(yè)務(wù)場景,更好地滿足企業(yè)的實際需求,幫助企業(yè)創(chuàng)造更多的價值。
2023 年:堅實基礎(chǔ)與創(chuàng)新前行的雙軌戰(zhàn)略
在 2023 年,金山云采取了兩步走的戰(zhàn)略。首先,注重夯實基礎(chǔ),修煉內(nèi)功;其次,勇立潮頭,緊跟大模型發(fā)展趨勢,推出 MaaS 互信推理專區(qū)方案,解決模型及數(shù)據(jù)互信問題。
為了更好地服務(wù)企業(yè)客戶,金山云推動了多款核心產(chǎn)品升級,包括云服務(wù)器、對象存儲、網(wǎng)絡(luò)等產(chǎn)品。這些產(chǎn)品的推出,不僅提升了金山云的技術(shù)實力,也為進(jìn)一步開拓大模型市場奠定了堅實的基礎(chǔ)。
在計算方面,金山云第七代云服務(wù)器 X7 進(jìn)行了全方位的升級,搭載了第四代英特爾至強可擴展處理器,并支持英特爾 AMX 原生加速能力。與上一代產(chǎn)品相比,CPU 性能提升了 60%,內(nèi)存也升級到了 DDR5,頻率較上一代提升了 50%。融合金山云自主創(chuàng)新的加速技術(shù),云服務(wù)器 X7 可有效提升模型推理性能。
對象存儲作為金山云推出的第一個公有云服務(wù),也經(jīng)歷了不斷的優(yōu)化和升級。隨著 AIGC 的崛起,對存儲性能的要求也越來越高。為了滿足這一需求,金山云已覆蓋五個品類的對象存儲產(chǎn)品,包括極速型存儲、標(biāo)準(zhǔn)存儲、低頻存儲、歸檔存儲和深度冷歸檔。其中,金山云對象存儲 KS3 極速型最高可提供 1Tbps/PB 的兌付帶寬,相較于傳統(tǒng)的機械硬盤(HDD)的對象存儲性能提升了上百倍。這些創(chuàng)新的產(chǎn)品為 AIGC、存算分離和高性能計算等場景提供了強大的存儲解決方案,確??蛻舻臄?shù)據(jù)安全可靠。
針對大模型應(yīng)用場景,金山云推出了互信虛擬私有網(wǎng)絡(luò)(互信 VPC)。相對標(biāo)準(zhǔn) VPC 而言,互信 VPC 對進(jìn)出 VPC 的通信行為進(jìn)行了更為嚴(yán)格的控制,幫助客戶解決合規(guī)和互信問題。針對 HTTP、HTTPS 等應(yīng)用層負(fù)載場景,金山云還推出了應(yīng)用型負(fù)載均衡 ALB(Application Load Balancer),單實例最大支持 100 萬 QPS,與云原生場景融合得非常好。當(dāng)客戶使用金山云容器服務(wù) KCE 產(chǎn)品或自建 K8s 集群時,ALB 可作為 Ingress 部署,為業(yè)務(wù)提供網(wǎng)絡(luò)流量調(diào)度服務(wù)。
金山云始終保持敏銳的市場洞察力,緊跟技術(shù)發(fā)展的步伐,不僅注重產(chǎn)品的性能和效率,還致力于為客戶提供全方位的服務(wù)支持。金山云將繼續(xù)加強云上能力建設(shè),拓展云上產(chǎn)品場景化能力,助力企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展。
態(tài)度:嚴(yán)守中立,做大模型服務(wù)商的堅實后盾
金山云的公有云在服務(wù)大模型服務(wù)商時,嚴(yán)守中立的立場,致力于成為大模型的助力者,為模型服務(wù)商提供云服務(wù)支撐,從訓(xùn)練到推理的全流程,通過技術(shù)可監(jiān)測的形式,在模型使用過程中,對模型的使用方式和使用日志提供可接入、可審計的能力,確保模型使用的透明度和可審計性。
為了滿足大模型運行的高性能要求,金山云在基礎(chǔ)架構(gòu)層面進(jìn)行了深入優(yōu)化。將云服務(wù)器通過 IB 或 RoCE 方式連接,提供了部署驗收、性能測試和故障報警等功能。這為模型運行提供了一個強大的基礎(chǔ)網(wǎng)絡(luò),確保了穩(wěn)定性和高效性。
在云算力網(wǎng)絡(luò)層面,金山云借助自研的 IB/RoCE 等技術(shù),結(jié)合端側(cè)和網(wǎng)側(cè)交付驗收工具,實現(xiàn)了整個鏈路的探測能力,對全網(wǎng)的性能進(jìn)行全面測試。這為大模型的流暢運行提供了堅實的后盾。
為了增強云上運行的可靠性,金山云持續(xù)豐富裸金屬產(chǎn)品形態(tài),推出了與 VPC 無縫對接的云托管管理機和進(jìn)出 VPC 流量日志審計功能。這些功能為大模型的穩(wěn)定運行提供了全方位的保障。
在 PaaS 層,金山云通過容器和 K8s 等技術(shù),提供了故障檢測、故障自動剔除等功能,滿足了大模型運營的穩(wěn)定性需求,確保了大模型的可靠運行。
值得一提的是,金山云發(fā)布了 MaaS 互信推理專區(qū) 2.0 版本。這一版本基于金山云 IaaS和 PaaS 底座,實現(xiàn)了 LangChain的一鍵部署。它支持對接多個生態(tài)合作商業(yè)大模型和開源大模型,同時支持多種 Embedding 模型,并可無縫對接金山云全托管向量數(shù)據(jù)庫 Milvus。這為企業(yè)開發(fā)者提供了一個簡單易用、安全可信的一站式推理應(yīng)用部署平臺。
為了增強云上運行的安全性,MaaS 2.0 還提供了容器服務(wù)加密鏡像解決方案。依托金山云裸金屬服務(wù),實現(xiàn)了從鏡像加密、加密鏡像上傳到解密鏡像運行的全流程模型安全運行。這一解決方案為企業(yè)提供了一個高度安全的大模型運行環(huán)境。
除了技術(shù)層面的保障,金山云還強調(diào)中立的立場和態(tài)度。金山云公有云產(chǎn)品中心負(fù)責(zé)人孫曉表示,金山云只觸及容器服務(wù)這一層面,并確保大模型運行的可信度。通過技術(shù)手段和嚴(yán)格的管理流程,確保了大模型在金山云平臺上的安全和可靠運行。
據(jù)了解,諸多頭部大模型服務(wù)商都是金山云的客戶。盡管許多大模型服務(wù)商選擇混合云部署,但金山云憑借其中立的立場和扎實的技術(shù)和服務(wù)創(chuàng)新,為大模型的發(fā)展提供了強有力的支撐。
聚焦:深入行業(yè),滿足特定領(lǐng)域的知識助手場景
面向企業(yè)級人工智能市場,金山云選擇在企業(yè)內(nèi)部比較基礎(chǔ)、但上限又很高的場景,并面向工時價值高的特定領(lǐng)域,推出金山云輕舟智問知識助手產(chǎn)品。金山云人工智能與大數(shù)據(jù)產(chǎn)品中心負(fù)責(zé)人徐寅斐解釋道,“‘基礎(chǔ)’,表達(dá)的是知識助手通過簡單的問答對話框來進(jìn)行交互,‘上限很高’指的是,當(dāng)把模型的洞察力、理解能力、推理能力深度集成到企業(yè)內(nèi)部流程后,知識助手又可以完成非常復(fù)雜的事情?!?/span>
為了實現(xiàn)這一目標(biāo),金山云圍繞企業(yè)級知識助手場景制定了“一三一四”產(chǎn)品全景規(guī)劃。一套知識問答的能力,可以以產(chǎn)品形態(tài)輸出,也可以以元素化能力輸出;三個核心模型,包括行業(yè)語言模型,文本分片,Embedding 模型;一個平臺指的是金山云瀚海平臺,圍繞大模型預(yù)訓(xùn)練和業(yè)務(wù)微調(diào)階段,提供數(shù)據(jù)-訓(xùn)練-推理-評測的全生命周期關(guān)鍵環(huán)節(jié)產(chǎn)品能力;四大功能,包括微調(diào)推理、數(shù)據(jù)加速、智能檢索和文檔智能。
值得注意的是,前文提到金山云嚴(yán)守中立,成為大模型的助力者,為何又自己做行業(yè)大模型呢?對此,錢一峰表示,“金山云不做大模型,但一定會做企業(yè)的應(yīng)用落地和平臺落地的支撐。企業(yè)級市場需求相對比較碎片化,也是看到客戶有很多業(yè)務(wù)需求,但是沒有很好地應(yīng)用來滿足他們的業(yè)務(wù)訴求,因此,金山云才依托于底層基礎(chǔ)設(shè)施的能力,探索行業(yè)模型。”
據(jù)了解,金山云正逐步完善行業(yè)模型的全棧能力,其中金山云輕舟智問知識助手計劃優(yōu)先在公共服務(wù)和法律兩大場景落地,助力政務(wù)服務(wù)和辦公,以及法律咨詢、訴訟以及非訴訟場景方面提升業(yè)務(wù)效率。
展望 2024 年,會是應(yīng)用爆發(fā)的一年,因此推理資源的降本增效尤為重要。金山云也會通過算力虛擬化構(gòu)建統(tǒng)一的算力池,加速推理速度,幫助更多行業(yè)用戶進(jìn)行業(yè)務(wù)創(chuàng)新,提升業(yè)務(wù)效率。