自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

專訪GMI Cloud創(chuàng)始人Alex Yeh:算力即未來,不做AI時(shí)代的旁觀者

發(fā)布于 2025-4-15 08:44
瀏覽
0收藏

嘉賓 | Alex

作者 | 云昭

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

Alex Yeh回憶過去兩年半的創(chuàng)業(yè)歷程,用“一頭深海中求生的鯊魚”來形容GMI Cloud這家新創(chuàng)公司。海水中礁石隱藏在未知的角落,繞開礁石繼續(xù)前行則成為了這條鯊魚的常態(tài)。

Alex Yeh是AI Native Cloud 提供商 GMI Cloud 的創(chuàng)始人兼CEO。成立于2023年,GMI Cloud是他的第二次創(chuàng)業(yè),在創(chuàng)業(yè)之前,他是亞太知名私募和風(fēng)投公司里的董事,是加密貨幣與區(qū)塊鏈生態(tài)圈里最年輕的合伙人,投資相關(guān)的項(xiàng)目超過 100 個(gè)。

在“以天為單位演進(jìn)、充滿未知”的AI領(lǐng)域,這個(gè)比喻用來描述創(chuàng)業(yè)公司的探險(xiǎn)旅程,頗為形象。不過現(xiàn)實(shí)往往更為精彩。

兩年半前,Alex決定從美國(guó)創(chuàng)業(yè),經(jīng)過一番艱苦,終于尋得了500多公頃的場(chǎng)地和100多兆瓦電廠,開啟了一段全新的AI Infra創(chuàng)業(yè)旅程,4個(gè)月內(nèi)Alex馬不停蹄地干了4件事情:找來自谷歌 X 部門的技術(shù)大牛、建立軟件部署平臺(tái)、跨國(guó)新建數(shù)據(jù)中心、尋找錨定客戶。

而這4個(gè)月對(duì)于這次創(chuàng)業(yè)而言也僅僅只是旅途中的開始,還有很多問題需要勇敢者去探索、去解決?!皩?duì)于AI創(chuàng)業(yè)而言,你不可能一開始就能預(yù)測(cè)到它具體的未來形態(tài),也不知道具體會(huì)在何時(shí)迎來爆發(fā)。但你必須有一個(gè)保持十年的TrueNorth。它就如同航空母艦一樣,不可動(dòng)搖?!盇lex 非常認(rèn)真地說到。

2025開年,DeepSeek R1的推出后,全球的用戶為之震撼,所有人都在爭(zhēng)相測(cè)試這款出色的模型,GMI Cloud團(tuán)隊(duì)也不例外,在最短的時(shí)間內(nèi)完成了基于H200的專屬R1模型部署適配和優(yōu)化,也正因此,Alex的客戶來電甚至多到被打爆了。51CTO獲悉,GMI Cloud基于高端硬件提升AI推理效能,提高Token吞吐效率,是團(tuán)隊(duì)目前每天都在持續(xù)進(jìn)行的聚焦點(diǎn)。

Alex表示,今年Q1,GMI Cloud的營(yíng)收之高已經(jīng)達(dá)到了去年一年?duì)I收的三倍。這是一種非常迷人的信號(hào):大模型進(jìn)入推理階段后,人們都在尋求什么樣要求的AI云服務(wù),為什么GMI Cloud可以從谷歌、微軟、亞馬遜這樣的云廠商中虎口奪食?AI Infra側(cè)和AI應(yīng)用側(cè)正在發(fā)生著怎樣的演進(jìn)?

帶著這些問題,我們跟Alex聊了80分鐘。

1.從未雨綢繆到枕戈待旦

科技創(chuàng)新總是會(huì)被短期高估、長(zhǎng)期低估,押注AI更是如此。作為一家初創(chuàng)公司,如何度過起量之前的等待期是一件非??简?yàn)創(chuàng)始人判斷力的事情。

早在DeepSeek R1推出前的五六個(gè)月,Alex做出了一項(xiàng)重要的決定:GMI Cloud需要快速開發(fā)一套全面的推理引擎框架。Alex回顧當(dāng)時(shí)的決定,認(rèn)為AI從預(yù)訓(xùn)練階段進(jìn)入到推理階段是一件很清晰的、必然發(fā)生的事情?!按竽P鸵呀?jīng)訓(xùn)練得足夠好用,已經(jīng)有很多不同的產(chǎn)品,比如航空公司的呼叫中心的AI客服已經(jīng)可以幫改簽機(jī)票、出國(guó)旅行時(shí)的手機(jī)上的即時(shí)轉(zhuǎn)譯App等等。那之后會(huì)是什么樣子?肯定就會(huì)發(fā)生在edge端或local端,而且需要極低的延遲?!?/p>

彼時(shí),Alex為這個(gè)引擎定下了三個(gè)要求:Auto Scaling(自擴(kuò)容)、Global Scaling(全球擴(kuò)容)、Hotswap(熱切換)。前兩項(xiàng)擴(kuò)展很容易理解,那么為什么Alex特別要求了熱切換呢?據(jù)介紹,在推理階段,機(jī)器宕掉對(duì)于客戶的影響非常大,熱切換就是要讓客戶所運(yùn)行系統(tǒng)能夠足夠可靠,即便出現(xiàn)宕機(jī)的情況,也能持續(xù)有機(jī)器快速補(bǔ)充。據(jù)悉,GMI Cloud目前已在3月中旬正式官宣新產(chǎn)品“Inference Engine自研推理引擎云平臺(tái)”上線,該推理引擎的可用性高達(dá)99.995%。

也正是此番提前6個(gè)月的未雨綢繆,才造就了上文提到的Alex電話被打到爆的一幕?!?月DeepSeek爆發(fā),一時(shí)間我們幾乎所有客戶的訴求都變成了推理”,形勢(shì)變化如此之快,超出了Alex的預(yù)期。

當(dāng)然DeepSeek的到來,同樣也給Alex拋出了新的問題。事實(shí)上,包括AMD等很多的硬件廠商都曾來找GMI Cloud談適配的合作,不過Alex都婉拒了?!拔覀儺吘故窃茝S商,而不是硬件廠商?!弊鳛槿肆唾Y源有限的初創(chuàng)公司,首要的工作重心還是快速地scaling全球市場(chǎng),而不是硬件多樣化?!昂M馐袌?chǎng)中,現(xiàn)在流行的模型是DeepSeek R1,而目前適配DeepSeek R1最舒服的硬件就是H200。同時(shí)這也是目前大多數(shù)客戶的高性能推理的使用訴求所驅(qū)動(dòng)的?,F(xiàn)在如果選擇不同硬件廠商的話,勢(shì)必會(huì)降低Global Scaling的節(jié)奏。如果我們達(dá)到了一定的規(guī)模,比如Coreweave的體量,才會(huì)開始考慮硬件多樣化的問題?!?/p>

我們了解到,GMI Cloud現(xiàn)在的工程團(tuán)隊(duì)忙碌狀態(tài)可以用枕戈待旦來形容:“業(yè)內(nèi)技術(shù)迭代非常迅速,基本每周都會(huì)有新發(fā)布的技術(shù)需要團(tuán)隊(duì)快速跟進(jìn)。這周英偉達(dá)更新了Dynamo,下周某個(gè)社區(qū)發(fā)布了新論文,我們都需要將這些新技術(shù)、新論文以最快時(shí)間完成消化,并持續(xù)迭代我們的技術(shù)版本上線到自己的平臺(tái)?!?/p>

2.找到錨定客戶,然后拼命迭代

我們?cè)谠L談中有聊到一個(gè)假設(shè)性的問題:如果讓Alex選擇在應(yīng)用側(cè)創(chuàng)業(yè),他會(huì)選擇C端還是B端。

Alex最后選擇了B端?!癇端創(chuàng)業(yè)和C端創(chuàng)業(yè)還是有著不同的變現(xiàn)邏輯的。不管國(guó)內(nèi)還是海外,ToB創(chuàng)業(yè)通常需要一個(gè)有實(shí)力的公司來支持。而ToC則更多地要找到比較大的應(yīng)用產(chǎn)品讓用戶蜂擁而入。而且,C端產(chǎn)品爆發(fā)后的市場(chǎng)反饋處理起來也會(huì)非常有挑戰(zhàn),同時(shí)還要保證產(chǎn)品的迭代速度與最新的潮流一起向前。”

在Alex看來,每一位AI創(chuàng)業(yè)者都是超人,自己的superpower更適合在B端釋放。

談及自己創(chuàng)業(yè)的心得,Alex給出了一個(gè)“拼命三郎式”的答案:找到自己的錨定客戶,不斷去溝通、去了解客戶的需求和反饋,拼命地去打磨、迭代產(chǎn)品方案,來實(shí)現(xiàn)客戶的所想所需。

當(dāng)然,以第三者的身份去看這個(gè)問題,Alex對(duì)C端出海應(yīng)用充滿了期待。“中國(guó)出海企業(yè),在toC市場(chǎng)上有很大的優(yōu)勢(shì)。國(guó)人最厲害的地方就是新技術(shù)的落地。國(guó)人非常擅長(zhǎng)做不同的產(chǎn)品推廣營(yíng)銷以及硬件的整合,同時(shí)還有一個(gè)不容小覷的優(yōu)勢(shì),就是開源?,F(xiàn)在許多新的開源社區(qū)都是華人主導(dǎo)的,只要產(chǎn)品得到開源社區(qū)的支持,甚至網(wǎng)站都不用做,就可以賺到錢。”

整體上看,B端和C端的機(jī)會(huì)都很大。Alex舉了一個(gè)文生圖、文生視頻賽道的例子,“toC可以面向designer做一個(gè)studio,toB則可以選擇跟Adobe等大型企業(yè)去合作,或者做不同行業(yè)的定制API等等。這都取決于創(chuàng)業(yè)者自身的想法。”

3.通用Agent還有很遠(yuǎn)的路要走

目前距離Agent爆發(fā)還哪些問題有待解決?

Agent始終是一個(gè)繞不開的話題。Alex很果斷地判斷:通用Agent的爆發(fā)時(shí)機(jī)還沒有到。首先,在某些領(lǐng)域,模型本身做的不是特別好,比如模型跟物理世界的交互能力還不夠好;其次,算力成本核算下來依舊過高;此外,不同場(chǎng)景的壁壘有待打通,私有的DataSet就是一個(gè)明顯的例子,只有將這些數(shù)據(jù)整合起來有可能以Agent的形式去提供客戶所需的服務(wù)。

但就某些垂直場(chǎng)景來看,已經(jīng)有不少落地Agent的機(jī)會(huì)。比如自媒體領(lǐng)域的內(nèi)容生成、AI PPT等,再比如編程領(lǐng)域的Cursor、Windsurf等等。這些以文字為主的應(yīng)用已經(jīng)取得了較大的突破。

而算力成本方面,DeepSeek推出后,開源模型的性能甚至比閉源模型都要高。隨著AI Infra持續(xù)對(duì)內(nèi)存、硬件、模型的優(yōu)化,每個(gè)Token的成本會(huì)一直降下去,甚至還有更低精度、更便宜成本的方案。

場(chǎng)景壁壘方面,擁有不同垂類私有數(shù)據(jù)的公司可以把不同垂類領(lǐng)域的Agent開發(fā)出來,只要產(chǎn)品體驗(yàn)足夠好,相信就會(huì)有客戶愿意將資料交給你。

“所以說,就我個(gè)人的初步判斷,現(xiàn)階段Agent距離全方面爆發(fā)還有很長(zhǎng)的路要走,走的比較快的應(yīng)用更多還是在AIGC、文生圖這類賽道上。但未來幾年,隨著數(shù)據(jù)飛輪效應(yīng)越來越明顯,不斷演進(jìn)的應(yīng)用會(huì)產(chǎn)生足夠多真實(shí)的交互數(shù)據(jù),這些數(shù)據(jù)進(jìn)而會(huì)催生更強(qiáng)大的多模態(tài)大模型,而更強(qiáng)大的模型則會(huì)進(jìn)一步帶來新的一輪應(yīng)用的爆發(fā)?!?/p>

4.先求有、再求好、再求便宜

數(shù)據(jù)的問題交給應(yīng)用側(cè),而降成本的問題則落到了像GMI Cloud這樣的云供應(yīng)商的肩上。正如前文所說,現(xiàn)在市面上算力Token的價(jià)格依舊昂貴,尤其在海外。這正是GMI Cloud一直以來聚焦在做的工作,在不犧牲性能的情況,通過PD分離、EP等各種更好的技術(shù)將單個(gè)Token的成本砍下去。所以高性能與低成本是并不沖突的。

談到“API價(jià)格戰(zhàn)“”方面,Alex表示純砍價(jià)的做法是無意義的。因?yàn)閺目蛻粜枨罂?,“先求有、再求好、再求便宜”是一?xiàng)不可忽視的市場(chǎng)規(guī)律?!爸话殉杀究车阶畹停€(wěn)定性不能保證也是沒有意義的。又或者說你雖然在美國(guó)最便宜,但客戶需要在亞洲地區(qū)實(shí)施業(yè)務(wù),本土化的’性價(jià)比‘才是客戶最看重的。”因此,如果“有”和“好”都沒有做到,客戶就根本不可用,這樣把價(jià)格降再便宜也于事無補(bǔ)。

近日,GPT-4o吉卜力風(fēng)格圖片功能非?;鸨?,用戶推理的需求非常旺盛,OpenAI不得不采取了速率限制。那么,爆火的高性能推理需求到來之后,成本降低的速度又會(huì)怎樣呢?

Alex表示,事實(shí)上英偉達(dá)或其他廠商每一兩年就會(huì)提出新的硬件架構(gòu)模式,推理的成本也會(huì)以倍速的方式在降低。

可以想象,5年之內(nèi)成本基本就降到幾乎為零了。

隨著Scaling Law和摩爾定律的不斷演進(jìn),Alex認(rèn)為有兩個(gè)確信的趨勢(shì):第一,大模型廠商會(huì)互相卷,模型會(huì)變得又小又好用,又便宜;第二件,半導(dǎo)體廠商會(huì)在推理場(chǎng)景上互相角逐,成本也會(huì)越來越低。而云廠商則將模型和硬件整合到一起來繼續(xù)做調(diào)優(yōu),隨著時(shí)代的演進(jìn),Token成本的大眾化將不再是一個(gè)問題。

5.我們是 “Shopify of AI”

時(shí)鐘撥回到去年10月,GMI Cloud拿到了8200萬美元的A輪融資。接連多年的工作和創(chuàng)業(yè)經(jīng)歷,Alex找到了投資人們的理解習(xí)慣。Alex經(jīng)常會(huì)跟投資人用這樣的比喻來介紹自己的公司:Shopify of AI。

Shopify是一家全球知名的電商平臺(tái),成立之初就致力于幫助任何一位創(chuàng)業(yè)者或者網(wǎng)紅去快速建店,實(shí)現(xiàn)創(chuàng)業(yè)夢(mèng)想。而這在當(dāng)時(shí)的美國(guó),基本上已經(jīng)被Ebay、Amazon綁架了,創(chuàng)業(yè)者被捆綁其中,自由度很差。而Shopify則不同,它給了創(chuàng)業(yè)者更為自主可控的選擇。

Alex認(rèn)為,而這也是GMI Cloud所想要做的?!斑^去大部分的創(chuàng)新都已經(jīng)被美國(guó)“三朵云”綁定了,對(duì)于客戶而言很難有突破性質(zhì)的價(jià)值增量。我們想把Envrionment歸還給客戶?!?/p>

怎么實(shí)現(xiàn)這一點(diǎn)呢?GMI Cloud在產(chǎn)品設(shè)計(jì)上給客戶留足了選擇的空間。GPU Instance、Cluster Engine、Inference Engine,這三層允許用戶彼此獨(dú)立購(gòu)買,也可以一起購(gòu)買。用戶可以自由選擇、組合和擴(kuò)展,既可以使用自己本地的模型,也可以使用GMI Cloud調(diào)好的模型,甚至也可以把第三方的平臺(tái)搬過來。GPU也一樣,不存在完全綁定的情況。

我們注意到GMI Cloud 的全新推理引擎產(chǎn)品Inference Engine近期在英偉達(dá)GTC2025大會(huì)上正式發(fā)布,這被外界視為GMI Cloud涉足MaaS層的一個(gè)重要信號(hào)。Alex解釋道,Inference Engine其實(shí)面向的是有產(chǎn)品想法但缺乏機(jī)器學(xué)習(xí)背景的團(tuán)隊(duì)。通過Inference Engine,那些product genius就可以專注于做產(chǎn)品、做推薦、搞流量,而無需再在基模開發(fā)調(diào)試上浪費(fèi)精力和成本,只需要在Marketplace中選擇模型即可。

6.創(chuàng)新者在洪流中尋找新大陸

最后我們問到了GMI Cloud的未來3-5年的規(guī)劃。Alex表示特別想做好一個(gè)AI of Internet?!拔矣X得這是一個(gè)超級(jí)酷的事情,我想要做一個(gè)隱形的GPU云網(wǎng)絡(luò),當(dāng)一個(gè)隱形的support的角色,去支持那些創(chuàng)業(yè)團(tuán)隊(duì)或企業(yè)內(nèi)的創(chuàng)新者去實(shí)現(xiàn)自己心中的AI產(chǎn)品。我們提供面向不同AI應(yīng)用研發(fā)場(chǎng)景的算力支持和引擎支持,跟上AI發(fā)展的所有步伐,切身入局去做一些真正可以改變AI產(chǎn)業(yè)發(fā)展的事情,不做這個(gè)時(shí)代的旁觀者?!?/p>

言語之中,Alex對(duì)于成立28個(gè)月的公司充滿著一種“屠龍少年”的理想:現(xiàn)在的超級(jí)巨頭真的讓人又愛又恨,而GMI Cloud未來要做一個(gè)全棧式的AI云服務(wù)公司,不止是AI云服務(wù)公司,而是從存儲(chǔ)到計(jì)算,以及各種上層應(yīng)用,而每一層都是模塊化的。

“就像豪華型酒店一樣,客人可以拎包入住,住起來非常舒服,如果你喜歡房間里什么東西,你都可以拿走?!?/p>

【嘉賓介紹】

專訪GMI Cloud創(chuàng)始人Alex Yeh:算力即未來,不做AI時(shí)代的旁觀者-AI.x社區(qū)

Alex Yeh 是 GMI Cloud 的創(chuàng)始人兼 CEO,在他的卓越引領(lǐng)下,GMI Cloud 迅速成為全球 AI 云計(jì)算領(lǐng)域的領(lǐng)先品牌,助力眾多企業(yè)實(shí)現(xiàn) AI 的即時(shí)部署與高效擴(kuò)展。

作為一名極具前瞻性的連續(xù)創(chuàng)業(yè)者,Alex Yeh 的職業(yè)軌跡亮點(diǎn)頻出。他曾先后在 CDIB Capital、Globaltec Capital 擔(dān)任董事,專注于 VC/PE 以及 AI 領(lǐng)域的投資工作。在創(chuàng)辦GMI Cloud之前,他是加密貨幣創(chuàng)投機(jī)構(gòu) Headline Crypto/ IVC 的聯(lián)合創(chuàng)始人,也是加密貨幣與區(qū)塊鏈生態(tài)領(lǐng)域最年輕的合伙人,投資項(xiàng)目超過 100 個(gè),為行業(yè)發(fā)展注入了強(qiáng)大的資本活力。

憑借在云計(jì)算、AI 及 Web3 領(lǐng)域沉淀的深厚專業(yè)知識(shí)與豐富實(shí)踐經(jīng)驗(yàn),Alex Yeh 不斷推動(dòng)行業(yè)的創(chuàng)新突破。2023年,他創(chuàng)立GMI Cloud,將目光聚焦于 AI 基礎(chǔ)設(shè)施領(lǐng)域,致力于挖掘其在細(xì)分行業(yè)的潛在價(jià)值,全力推動(dòng) “AI + 全產(chǎn)業(yè)” 的算力智能化升級(jí)。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:云昭

標(biāo)簽
已于2025-4-16 09:49:02修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦