自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="efouj"><p id="efouj"></p></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

K8s和大模型真的搭嗎？

51CTO技術(shù)棧

發(fā)布于 2024-4-19 15:05

瀏覽

0收藏

編譯|言征

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

K8s和大模型真的搭嗎？本文拋出了一個問題，但答案仍有待驗(yàn)證。

1.K8s迎來了新的受眾群體

假設(shè)一位機(jī)器學(xué)習(xí)研究人員閱讀了一篇研究論文，并想在PyTorch環(huán)境中使用基于Python的GPU進(jìn)行測試。她要求她的工程團(tuán)隊(duì)訪問一個帶有兩個GPU的Jupyter筆記本和她的所有庫。

工程團(tuán)隊(duì)告訴她：這需要三天時間。他們必須獲取GPU的來源，創(chuàng)建一個堆棧，然后授予對JupyterHub的訪問權(quán)限。

“這正是DevOps 10年前所經(jīng)歷的，”獨(dú)立分析師Janakiram 3月在KubeCon+CloudNativeCon Europe的一次對話中表示。

“因此，現(xiàn)在的整個想法是，我們?nèi)绾渭涌爝@一進(jìn)程，并使企業(yè)IT能夠?qū)⒒A(chǔ)施帶到ML研究人員、工程師和開發(fā)人員可以隨時使用的程度，以便他們能夠快速將自己的想法轉(zhuǎn)化為代碼？”

新的人物角色反映了大型語言模型（LLM）對云原生社區(qū)的影響，并提出了關(guān)于身份和Kubernetes角色的問題。數(shù)據(jù)科學(xué)家甚至需要Kubernetes來將他們的模型投入生產(chǎn)嗎？

獨(dú)立分析師Sanjeev Mohan認(rèn)為NVIDIA推出的推理微服務(wù)Nim就是為Kubernetes精心策劃的Docker容器。

挑戰(zhàn)性就在于：Kubernetes將轉(zhuǎn)變?yōu)樯疃纫詳?shù)據(jù)為中心，這是數(shù)據(jù)的狀態(tài)性及頻繁變化的特點(diǎn)所造成的。數(shù)據(jù)在Kubernetes社區(qū)中從未發(fā)揮過如此重要的作用。Kubernetes社區(qū)從未需要以這樣的方式適應(yīng)生成人工智能、模型開發(fā)、集成、部署和管理帶來的新需求。

如果沒有在Kubernetes上部署數(shù)據(jù)模型的標(biāo)準(zhǔn)方法，未來的工作將需要社區(qū)通過新的硬件集成和項(xiàng)目來適應(yīng)新的“數(shù)據(jù)角色”。

2.AI如何讓K8s變得更強(qiáng)大？

Kubernetes服務(wù)LLMs，那LLM能為K8s做哪些？

但實(shí)際上，Kubernetes在人工智能中的作用是什么？數(shù)據(jù)角色問題把這件事帶到了最前沿。Kubernetes是一個控制平面——是的，這是有道理的。自2014年以來，它一直是DevOps的應(yīng)用程序架構(gòu)。

因此，Mohan提出的一個問題變得更加相關(guān)：究竟K8s是服務(wù)AI，還是AI服務(wù)于K8s？

在KubeCon，我們看到了很多Kubernetes如何作為人工智能的控制平面。NVIDIA在主題演講中，他們討論了分配部分GPU的動態(tài)資源分配。這樣可以節(jié)省成本。這就是人工智能的Kubernetes。所有這些發(fā)展都進(jìn)行得很順利，Mohan說，我們將看到越來越多的Kubernet成為通用人工智能的控制平面。

但令一方面，LLM怎樣才能讓K8s更加強(qiáng)大呢？Mohan提出了一個非常有想象力的問題。

他說：“我還沒有看到太多這方面的情況，也許到之后的某一屆KubeCon上，我們將開始看到更高的集成度?！?/p>

OpenAI無疑是Kubernetes的盟友，該公司正在使用Kubernete來啟動和擴(kuò)大實(shí)驗(yàn)規(guī)模。

K8s和大模型真的搭嗎？-AI.x社區(qū) 圖片

作為當(dāng)紅的人工智能研究實(shí)驗(yàn)室，OpenAI需要深度學(xué)習(xí)的基礎(chǔ)設(shè)施，使實(shí)驗(yàn)?zāi)軌蛟谠浦谢蜃约旱臄?shù)據(jù)中心中運(yùn)行，并易于擴(kuò)展。便攜性、速度和成本是主要驅(qū)動因素。

Oracle在KubeCon的高級副總裁Sudha Raghavan問道，如果沒有數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師思考如何配置它，以最有效地使用任何硬件GPU，Kubernetes將如何成為所有人工智能工作負(fù)載的默認(rèn)選項(xiàng)？

Raghavan也在KubeCon的一個小組討論會上談到了這樣一種設(shè)想，設(shè)想中，人們基于每個工作負(fù)載的工作變得更容易了，工程師可以配置開箱即用的模板，并理解這些是尚未出現(xiàn)的人工智能工作負(fù)載模式，并且有預(yù)定義的模板。

因此，任何想做實(shí)驗(yàn)的數(shù)據(jù)科學(xué)家都不必自己學(xué)習(xí)，而是可以了解云原生計(jì)算基金會在其生態(tài)系統(tǒng)中為人工智能和ML社區(qū)提供的內(nèi)容。

英特爾開放生態(tài)系統(tǒng)副總裁兼總經(jīng)理Arun Gupta在一個小組討論會上表示，云原生社區(qū)的責(zé)任是彌合這一差距?！氨仨毟蛻艄睬?，客戶就是數(shù)據(jù)科學(xué)家。他說，一篇新的云原生人工智能論文解決了這些挑戰(zhàn)。

K8s和大模型真的搭嗎？-AI.x社區(qū) 云原生AI

微軟首席產(chǎn)品經(jīng)理拉克倫?埃文森（Lachlan Evenson）與古普塔（Gupta）在同一小組中表示，Kubernetes社區(qū)中的一個新角色還包括人工智能工程師，他們位于數(shù)據(jù)科學(xué)家和基礎(chǔ)設(shè)施工程師或平臺工程師之間。

Evenson在小組討論中指出，人工智能工程師不僅需要了解人工智能世界的所有術(shù)語，還需要了解如何大規(guī)模使用這些分布式系統(tǒng)并構(gòu)建這些新平臺。

3.K8s承諾：可擴(kuò)展、安全

Kubernetes的創(chuàng)始人將Kubernete設(shè)計(jì)成了無狀態(tài)的，后來又構(gòu)建了有狀態(tài)的技術(shù)來與其分布式平臺集成。

Evenson說：“這不僅限于這個社區(qū)，也直接造就了我們通過K8s社區(qū)在該平臺上構(gòu)建的可擴(kuò)展性?！?/p>

“我們需要提供開源替代品和開源平臺，這樣那些希望開始投資并了解人工智能如何影響其業(yè)務(wù)的公司，就可以采用模型，而不必?fù)?dān)心數(shù)據(jù)治理或安全問題，并開始在本地環(huán)境中對其進(jìn)行修改和熟悉?！?/p>

參考鏈接：??https://thenewstack.io/kubernetes-and-ai-are-they-a-fit/??

本文轉(zhuǎn)載自 ??51CTO技術(shù)棧??，作者：言征

標(biāo)簽

已于2024-4-19 15:08:11修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

LLM 評估匯總：真的吊打 LLaMA-3，媲美 GPT-4 嗎？

amei2000go ? 5696瀏覽 ? 0回復(fù)
大神Aviral Kumar：價值學(xué)習(xí)真的是離線 RL 的主要瓶頸嗎？

AIGC最前線 ? 2376瀏覽 ? 0回復(fù)
預(yù)訓(xùn)練大語言模型對時間序列預(yù)測真的有用嗎？去掉預(yù)訓(xùn)練LLM效果反而提升

海因斯DK ? 4150瀏覽 ? 0回復(fù)
FP8 預(yù)訓(xùn)練真的成熟了嗎：一些實(shí)踐和分析

amei2000go ? 3991瀏覽 ? 1回復(fù)
大模型是泡沫嗎？

NLP工作站 ? 2062瀏覽 ? 0回復(fù)
大模型落地應(yīng)用指北—大模型能吃嗎？

zhcs333 ? 2100瀏覽 ? 0回復(fù)
從谷歌、微軟、百度，到Perplexity、Kimi、秘塔，大模型真的“搭”上了搜索的快車嗎？

51CTO技術(shù)棧 ? 2107瀏覽 ? 0回復(fù)
最近爆火的GraphRAG是什么，真的能用于商業(yè)應(yīng)用嗎？

AI博物院 ? 2159瀏覽 ? 0回復(fù)
RAG系統(tǒng)的檢索機(jī)制真的需要那么"完美"嗎？

sbf_2000 ? 1969瀏覽 ? 0回復(fù)
大模型技術(shù)全面解析，從大模型的概念，技術(shù)，應(yīng)用和挑戰(zhàn)多個方面介紹大模型

AI探索時代 ? 1.4w瀏覽 ? 0回復(fù)
首次實(shí)現(xiàn)8K圖像生成！FreeScale讓擴(kuò)散模型解鎖更高分辨率！

angel ? 2038瀏覽 ? 0回復(fù)
向量數(shù)據(jù)庫真的能滿足所有 AI Agent 的記憶需求嗎？

Baihai_IDP ? 1980瀏覽 ? 0回復(fù)
人臉識別，你真的了解嗎?

zhcs333 ? 2039瀏覽 ? 0回復(fù)
清華大學(xué)深度解析：RLHF 真的能規(guī)?；?em>嗎？

sbf_2000 ? 1496瀏覽 ? 0回復(fù)
HuggingFace：AI開發(fā)者的“GitHub”，你真的會用嗎？

凝固的雨_1 ? 1093瀏覽 ? 0回復(fù)
你了解大模型的生態(tài)體系嗎？大模型從技術(shù)到應(yīng)用的內(nèi)容梳理

AI探索時代 ? 1014瀏覽 ? 0回復(fù)
智能體“語言”爭霸: MCP vs A2A，再現(xiàn)K8s vs Docker？

云原生AI百寶箱 ? 737瀏覽 ? 0回復(fù)
智能體“語言”爭霸: MMP vs A2A，再現(xiàn)K8s vs Docken？

A2A講解 ? 407瀏覽 ? 0回復(fù)
大模型微調(diào)真的有技術(shù)含量嗎？

智駐未來 ? 531瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 11分鐘前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點(diǎn)贊！真實(shí)跑步水平曝光：2m/s接近天工！ 4h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：五個簡單好用的本地運(yùn)行大模型的方法

下一篇： Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開源大模型水位

社區(qū)精華內(nèi)容

目錄