自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

專訪GMI Cloud創(chuàng)始人Alex Yeh:算力即未來,不做AI時代的旁觀者

原創(chuàng) 精選
人工智能
Agent始終是一個繞不開的話題。Alex很果斷地判斷:通用Agent的爆發(fā)時機還沒有到。首先,在某些領域,模型本身做的不是特別好,比如模型跟物理世界的交互能力還不夠好;其次,算力成本核算下來依舊過高;此外,不同場景的壁壘有待打通,私有的DataSet就是一個明顯的例子,只有將這些數(shù)據(jù)整合起來有可能以Agent的形式去提供客戶所需的服務。

嘉賓 | Alex

作者 | 云昭

Alex Yeh回憶過去兩年半的創(chuàng)業(yè)歷程,用“一頭深海中求生的鯊魚”來形容GMI Cloud這家新創(chuàng)公司。海水中礁石隱藏在未知的角落,繞開礁石繼續(xù)前行則成為了這條鯊魚的常態(tài)。

Alex Yeh是AI Native Cloud 提供商 GMI Cloud 的創(chuàng)始人兼CEO。成立于2023年,GMI Cloud是他的第二次創(chuàng)業(yè),在創(chuàng)業(yè)之前,他是亞太知名私募和風投公司里的董事,是加密貨幣與區(qū)塊鏈生態(tài)圈里最年輕的合伙人,投資相關的項目超過 100 個。

在“以天為單位演進、充滿未知”的AI領域,這個比喻用來描述創(chuàng)業(yè)公司的探險旅程,頗為形象。不過現(xiàn)實往往更為精彩。

兩年半前,Alex決定從美國創(chuàng)業(yè),經過一番艱苦,終于尋得了500多公頃的場地和100多兆瓦電廠,開啟了一段全新的AI Infra創(chuàng)業(yè)旅程,4個月內Alex馬不停蹄地干了4件事情:找來自谷歌 X 部門的技術大牛、建立軟件部署平臺、跨國新建數(shù)據(jù)中心、尋找錨定客戶。

而這4個月對于這次創(chuàng)業(yè)而言也僅僅只是旅途中的開始,還有很多問題需要勇敢者去探索、去解決?!皩τ贏I創(chuàng)業(yè)而言,你不可能一開始就能預測到它具體的未來形態(tài),也不知道具體會在何時迎來爆發(fā)。但你必須有一個保持十年的TrueNorth。它就如同航空母艦一樣,不可動搖?!盇lex 非常認真地說到。

2025開年,DeepSeek R1的推出后,全球的用戶為之震撼,所有人都在爭相測試這款出色的模型,GMI Cloud團隊也不例外,在最短的時間內完成了基于H200的專屬R1模型部署適配和優(yōu)化,也正因此,Alex的客戶來電甚至多到被打爆了。51CTO獲悉,GMI Cloud基于高端硬件提升AI推理效能,提高Token吞吐效率,是團隊目前每天都在持續(xù)進行的聚焦點。

Alex表示,今年Q1,GMI Cloud的營收之高已經達到了去年一年營收的三倍。這是一種非常迷人的信號:大模型進入推理階段后,人們都在尋求什么樣要求的AI云服務,為什么GMI Cloud可以從谷歌、微軟、亞馬遜這樣的云廠商中虎口奪食?AI Infra側和AI應用側正在發(fā)生著怎樣的演進?

帶著這些問題,我們跟Alex聊了80分鐘。

1.從未雨綢繆到枕戈待旦

科技創(chuàng)新總是會被短期高估、長期低估,押注AI更是如此。作為一家初創(chuàng)公司,如何度過起量之前的等待期是一件非??简瀯?chuàng)始人判斷力的事情。

早在DeepSeek R1推出前的五六個月,Alex做出了一項重要的決定:GMI Cloud需要快速開發(fā)一套全面的推理引擎框架。Alex回顧當時的決定,認為AI從預訓練階段進入到推理階段是一件很清晰的、必然發(fā)生的事情?!按竽P鸵呀浻柧毜米銐蚝糜?,已經有很多不同的產品,比如航空公司的呼叫中心的AI客服已經可以幫改簽機票、出國旅行時的手機上的即時轉譯App等等。那之后會是什么樣子?肯定就會發(fā)生在edge端或local端,而且需要極低的延遲?!?/p>

彼時,Alex為這個引擎定下了三個要求:Auto Scaling(自擴容)、Global Scaling(全球擴容)、Hotswap(熱切換)。前兩項擴展很容易理解,那么為什么Alex特別要求了熱切換呢?據(jù)介紹,在推理階段,機器宕掉對于客戶的影響非常大,熱切換就是要讓客戶所運行系統(tǒng)能夠足夠可靠,即便出現(xiàn)宕機的情況,也能持續(xù)有機器快速補充。據(jù)悉,GMI Cloud目前已在3月中旬正式官宣新產品“Inference Engine自研推理引擎云平臺”上線,該推理引擎的可用性高達99.995%。

也正是此番提前6個月的未雨綢繆,才造就了上文提到的Alex電話被打到爆的一幕?!?月DeepSeek爆發(fā),一時間我們幾乎所有客戶的訴求都變成了推理”,形勢變化如此之快,超出了Alex的預期。

當然DeepSeek的到來,同樣也給Alex拋出了新的問題。事實上,包括AMD等很多的硬件廠商都曾來找GMI Cloud談適配的合作,不過Alex都婉拒了。“我們畢竟是云廠商,而不是硬件廠商?!弊鳛槿肆唾Y源有限的初創(chuàng)公司,首要的工作重心還是快速地scaling全球市場,而不是硬件多樣化。“海外市場中,現(xiàn)在流行的模型是DeepSeek R1,而目前適配DeepSeek R1最舒服的硬件就是H200。同時這也是目前大多數(shù)客戶的高性能推理的使用訴求所驅動的?,F(xiàn)在如果選擇不同硬件廠商的話,勢必會降低Global Scaling的節(jié)奏。如果我們達到了一定的規(guī)模,比如Coreweave的體量,才會開始考慮硬件多樣化的問題。”

我們了解到,GMI Cloud現(xiàn)在的工程團隊忙碌狀態(tài)可以用枕戈待旦來形容:“業(yè)內技術迭代非常迅速,基本每周都會有新發(fā)布的技術需要團隊快速跟進。這周英偉達更新了Dynamo,下周某個社區(qū)發(fā)布了新論文,我們都需要將這些新技術、新論文以最快時間完成消化,并持續(xù)迭代我們的技術版本上線到自己的平臺?!?/p>

2.找到錨定客戶,然后拼命迭代

我們在訪談中有聊到一個假設性的問題:如果讓Alex選擇在應用側創(chuàng)業(yè),他會選擇C端還是B端。

Alex最后選擇了B端?!癇端創(chuàng)業(yè)和C端創(chuàng)業(yè)還是有著不同的變現(xiàn)邏輯的。不管國內還是海外,ToB創(chuàng)業(yè)通常需要一個有實力的公司來支持。而ToC則更多地要找到比較大的應用產品讓用戶蜂擁而入。而且,C端產品爆發(fā)后的市場反饋處理起來也會非常有挑戰(zhàn),同時還要保證產品的迭代速度與最新的潮流一起向前。”

在Alex看來,每一位AI創(chuàng)業(yè)者都是超人,自己的superpower更適合在B端釋放。

談及自己創(chuàng)業(yè)的心得,Alex給出了一個“拼命三郎式”的答案:找到自己的錨定客戶,不斷去溝通、去了解客戶的需求和反饋,拼命地去打磨、迭代產品方案,來實現(xiàn)客戶的所想所需。

當然,以第三者的身份去看這個問題,Alex對C端出海應用充滿了期待。“中國出海企業(yè),在toC市場上有很大的優(yōu)勢。國人最厲害的地方就是新技術的落地。國人非常擅長做不同的產品推廣營銷以及硬件的整合,同時還有一個不容小覷的優(yōu)勢,就是開源。現(xiàn)在許多新的開源社區(qū)都是華人主導的,只要產品得到開源社區(qū)的支持,甚至網站都不用做,就可以賺到錢?!?/p>

整體上看,B端和C端的機會都很大。Alex舉了一個文生圖、文生視頻賽道的例子,“toC可以面向designer做一個studio,toB則可以選擇跟Adobe等大型企業(yè)去合作,或者做不同行業(yè)的定制API等等。這都取決于創(chuàng)業(yè)者自身的想法?!?/p>

3.通用Agent還有很遠的路要走

目前距離Agent爆發(fā)還哪些問題有待解決?

Agent始終是一個繞不開的話題。Alex很果斷地判斷:通用Agent的爆發(fā)時機還沒有到。首先,在某些領域,模型本身做的不是特別好,比如模型跟物理世界的交互能力還不夠好;其次,算力成本核算下來依舊過高;此外,不同場景的壁壘有待打通,私有的DataSet就是一個明顯的例子,只有將這些數(shù)據(jù)整合起來有可能以Agent的形式去提供客戶所需的服務。

但就某些垂直場景來看,已經有不少落地Agent的機會。比如自媒體領域的內容生成、AI PPT等,再比如編程領域的Cursor、Windsurf等等。這些以文字為主的應用已經取得了較大的突破。

而算力成本方面,DeepSeek推出后,開源模型的性能甚至比閉源模型都要高。隨著AI Infra持續(xù)對內存、硬件、模型的優(yōu)化,每個Token的成本會一直降下去,甚至還有更低精度、更便宜成本的方案。

場景壁壘方面,擁有不同垂類私有數(shù)據(jù)的公司可以把不同垂類領域的Agent開發(fā)出來,只要產品體驗足夠好,相信就會有客戶愿意將資料交給你。

“所以說,就我個人的初步判斷,現(xiàn)階段Agent距離全方面爆發(fā)還有很長的路要走,走的比較快的應用更多還是在AIGC、文生圖這類賽道上。但未來幾年,隨著數(shù)據(jù)飛輪效應越來越明顯,不斷演進的應用會產生足夠多真實的交互數(shù)據(jù),這些數(shù)據(jù)進而會催生更強大的多模態(tài)大模型,而更強大的模型則會進一步帶來新的一輪應用的爆發(fā)?!?/p>

4.先求有、再求好、再求便宜

數(shù)據(jù)的問題交給應用側,而降成本的問題則落到了像GMI Cloud這樣的云供應商的肩上。正如前文所說,現(xiàn)在市面上算力Token的價格依舊昂貴,尤其在海外。這正是GMI Cloud一直以來聚焦在做的工作,在不犧牲性能的情況,通過PD分離、EP等各種更好的技術將單個Token的成本砍下去。所以高性能與低成本是并不沖突的。

談到“API價格戰(zhàn)“”方面,Alex表示純砍價的做法是無意義的。因為從客戶需求看,“先求有、再求好、再求便宜”是一項不可忽視的市場規(guī)律?!爸话殉杀究车阶畹?,但穩(wěn)定性不能保證也是沒有意義的。又或者說你雖然在美國最便宜,但客戶需要在亞洲地區(qū)實施業(yè)務,本土化的’性價比‘才是客戶最看重的?!币虼耍绻坝小焙汀昂谩倍紱]有做到,客戶就根本不可用,這樣把價格降再便宜也于事無補。

近日,GPT-4o吉卜力風格圖片功能非常火爆,用戶推理的需求非常旺盛,OpenAI不得不采取了速率限制。那么,爆火的高性能推理需求到來之后,成本降低的速度又會怎樣呢?

Alex表示,事實上英偉達或其他廠商每一兩年就會提出新的硬件架構模式,推理的成本也會以倍速的方式在降低。

可以想象,5年之內成本基本就降到幾乎為零了。

隨著Scaling Law和摩爾定律的不斷演進,Alex認為有兩個確信的趨勢:第一,大模型廠商會互相卷,模型會變得又小又好用,又便宜;第二件,半導體廠商會在推理場景上互相角逐,成本也會越來越低。而云廠商則將模型和硬件整合到一起來繼續(xù)做調優(yōu),隨著時代的演進,Token成本的大眾化將不再是一個問題。

5.我們是 “Shopify of AI”

時鐘撥回到去年10月,GMI Cloud拿到了8200萬美元的A輪融資。接連多年的工作和創(chuàng)業(yè)經歷,Alex找到了投資人們的理解習慣。Alex經常會跟投資人用這樣的比喻來介紹自己的公司:Shopify of AI。

Shopify是一家全球知名的電商平臺,成立之初就致力于幫助任何一位創(chuàng)業(yè)者或者網紅去快速建店,實現(xiàn)創(chuàng)業(yè)夢想。而這在當時的美國,基本上已經被Ebay、Amazon綁架了,創(chuàng)業(yè)者被捆綁其中,自由度很差。而Shopify則不同,它給了創(chuàng)業(yè)者更為自主可控的選擇。

Alex認為,而這也是GMI Cloud所想要做的。“過去大部分的創(chuàng)新都已經被美國“三朵云”綁定了,對于客戶而言很難有突破性質的價值增量。我們想把Envrionment歸還給客戶?!?/p>

怎么實現(xiàn)這一點呢?GMI Cloud在產品設計上給客戶留足了選擇的空間。GPU Instance、Cluster Engine、Inference Engine,這三層允許用戶彼此獨立購買,也可以一起購買。用戶可以自由選擇、組合和擴展,既可以使用自己本地的模型,也可以使用GMI Cloud調好的模型,甚至也可以把第三方的平臺搬過來。GPU也一樣,不存在完全綁定的情況。

我們注意到GMI Cloud 的全新推理引擎產品Inference Engine近期在英偉達GTC2025大會上正式發(fā)布,這被外界視為GMI Cloud涉足MaaS層的一個重要信號。Alex解釋道,Inference Engine其實面向的是有產品想法但缺乏機器學習背景的團隊。通過Inference Engine,那些product genius就可以專注于做產品、做推薦、搞流量,而無需再在基模開發(fā)調試上浪費精力和成本,只需要在Marketplace中選擇模型即可。

6.創(chuàng)新者在洪流中尋找新大陸

最后我們問到了GMI Cloud的未來3-5年的規(guī)劃。Alex表示特別想做好一個AI of Internet。“我覺得這是一個超級酷的事情,我想要做一個隱形的GPU云網絡,當一個隱形的support的角色,去支持那些創(chuàng)業(yè)團隊或企業(yè)內的創(chuàng)新者去實現(xiàn)自己心中的AI產品。我們提供面向不同AI應用研發(fā)場景的算力支持和引擎支持,跟上AI發(fā)展的所有步伐,切身入局去做一些真正可以改變AI產業(yè)發(fā)展的事情,不做這個時代的旁觀者?!?/p>

言語之中,Alex對于成立28個月的公司充滿著一種“屠龍少年”的理想:現(xiàn)在的超級巨頭真的讓人又愛又恨,而GMI Cloud未來要做一個全棧式的AI云服務公司,不止是AI云服務公司,而是從存儲到計算,以及各種上層應用,而每一層都是模塊化的。

“就像豪華型酒店一樣,客人可以拎包入住,住起來非常舒服,如果你喜歡房間里什么東西,你都可以拿走?!?/p>

【嘉賓介紹】

圖片圖片

Alex Yeh 是 GMI Cloud 的創(chuàng)始人兼 CEO,在他的卓越引領下,GMI Cloud 迅速成為全球 AI 云計算領域的領先品牌,助力眾多企業(yè)實現(xiàn) AI 的即時部署與高效擴展。

作為一名極具前瞻性的連續(xù)創(chuàng)業(yè)者,Alex Yeh 的職業(yè)軌跡亮點頻出。他曾先后在 CDIB Capital、Globaltec Capital 擔任董事,專注于 VC/PE 以及 AI 領域的投資工作。在創(chuàng)辦GMI Cloud之前,他是加密貨幣創(chuàng)投機構 Headline Crypto/ IVC 的聯(lián)合創(chuàng)始人,也是加密貨幣與區(qū)塊鏈生態(tài)領域最年輕的合伙人,投資項目超過 100 個,為行業(yè)發(fā)展注入了強大的資本活力。

憑借在云計算、AI 及 Web3 領域沉淀的深厚專業(yè)知識與豐富實踐經驗,Alex Yeh 不斷推動行業(yè)的創(chuàng)新突破。2023年,他創(chuàng)立GMI Cloud,將目光聚焦于 AI 基礎設施領域,致力于挖掘其在細分行業(yè)的潛在價值,全力推動 “AI + 全產業(yè)” 的算力智能化升級。

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2020-02-14 09:00:28

開源Cloud Found平臺

2012-04-02 19:17:37

蘋果

2020-01-30 18:05:24

人工智能技術投資

2014-06-05 15:14:14

DCIM

2010-08-03 09:48:42

PythonRuby

2010-12-20 09:23:55

Flipboard用戶體驗

2012-09-25 09:14:28

旁觀者效應負面效應代碼

2023-03-07 18:37:20

ChatGPTAI

2010-10-11 10:21:49

Flipboard移動開發(fā)

2011-04-29 14:30:05

2024-10-30 14:58:08

2024-04-26 10:44:39

云計算平臺

2015-05-18 14:39:23

MySQL開源OpenStack

2009-07-02 08:59:56

ubuntuLinux開源

2017-09-28 10:17:34

CDN

2011-10-17 09:22:24

蘋果iPhone 4S沃茲尼亞克

2009-04-18 20:18:10

海盜灣Google谷歌
點贊
收藏

51CTO技術棧公眾號