技術(shù)最牛逼的阿里,又回來了! 原創(chuàng)
編輯 | 言征 伊風(fēng)
科技界的“中秋晚會”來了!
距離ChatGPT發(fā)布22個月,國內(nèi)AI語境下的互聯(lián)網(wǎng)技術(shù)基座究竟該做哪些?支撐AI原生應(yīng)用的技術(shù)天花板有多高?AI的行業(yè)風(fēng)口會吹向哪里?
9月19日,一年一度的阿里云棲大會拉開帷幕,阿里現(xiàn)任掌舵者吳詠銘、CTO周靖人攜手大模型領(lǐng)域當(dāng)紅炸子雞月之暗面CEO楊植麟、小鵬汽車CEO何小鵬等一眾明星企業(yè)創(chuàng)始人給業(yè)界帶來了一場久違的國產(chǎn)自豪感。
不管是能實時觀看秒回答的阿里版GPT-4o、號稱性能超越 Llama 405B的新一代的開源模型旗艦版 Qwen2.5-72B,還是一系列涵蓋服務(wù)器、網(wǎng)絡(luò)、存儲、AI平臺、數(shù)據(jù)湖等硬科技的AI Infra,還是通義萬相、通義靈碼、閱讀助手、AI翻譯等辦公生活兩不誤的AI應(yīng)用,都不得不讓我們感嘆:那個10年前國內(nèi)技術(shù)最牛逼的阿里,又回來了!
一、吳泳銘:一場“AI想象力”的開幕式
大會第一天,阿里現(xiàn)任掌舵者吳泳銘在《云與AI的創(chuàng)見》主論壇上,提及AI的發(fā)展變革,心情十分澎湃,自去年發(fā)出“用戶為先、AI驅(qū)動”的重大戰(zhàn)略調(diào)整的全員信已滿一年之際,他激動地分享了3個切實的實踐感受。
首先,吳詠銘認為,過去22個月,AI發(fā)展速度超過任何歷史時期,但依然處于AGI變革的早期。在這個階段,推理成本是應(yīng)用爆發(fā)的關(guān)鍵問題,阿里未來會努力繼續(xù)推動推理成本降低。過去一年以來,通義千問API在阿里云百煉上的調(diào)用價格下降了97%,百萬tokens調(diào)用花費最低已經(jīng)降到5毛錢,阿里云會努力地把成本繼續(xù)降下去。”
第二,生成式AI最大的想象力不在手機屏幕做一兩個新的超級App,而是滲透數(shù)字世界、接管數(shù)字世界,并改變物理世界。怎么理解?
吳泳銘提出,一方面,與互聯(lián)網(wǎng)不同,生成式AI是通過給生產(chǎn)力供給增加智能,從而為世界創(chuàng)造更大的內(nèi)在價值。這種價值創(chuàng)造,可能是移動互聯(lián)網(wǎng)連接價值的十倍、幾十倍。另一方面,生成式AI將逐漸滲透數(shù)字世界,并接管數(shù)字世界,物理世界的大部分事物都會具備AI能力,形成下一代的全新產(chǎn)品,并與云端AI驅(qū)動的數(shù)字世界連接產(chǎn)生協(xié)同效應(yīng)。
例如汽車行業(yè)的自動駕駛,在使用AI模型后已經(jīng)發(fā)生了發(fā)生的巨大變化,可以預(yù)測機器人將是下一個迎來巨變的行業(yè)。他認為,未來,所有能移動的物體都會變成智能機器人,它可以是工廠里的機械臂、工地里的起重機、倉庫里的搬運工、救火現(xiàn)場的消防員、家庭里的寵物狗。現(xiàn)在每個城市家庭里有一輛車,未來每個家庭可能會有兩三個機器人。
最后一點,AI計算正在加速演進成為整個計算體系的主導(dǎo),未來幾乎所有軟硬件都會具備推理能力,驅(qū)動新算力需求滲透。未來幾乎所有軟硬件的計算內(nèi)核將會變成GPU AI算力為主,CPU傳統(tǒng)計算算力為輔助的計算模式?!拔覀兛吹皆谛略龅乃懔κ袌龊退懔π枨笊?,超過50%以上的新需求,都由AI驅(qū)動,且新需求已經(jīng)超過50%,已占據(jù)主導(dǎo)地位,這一趨勢還會持續(xù)的擴大?!?/p>
二、大模型時代的阿里,都在做什么
前不久,阿里迎來了25周年,馬云那句“阿里從來不是被保護出來的公司,阿里相信市場的力量和創(chuàng)新的價值”言猶在耳,緊接著這次云棲大會接下來的全新的AI版阿里云技術(shù)讓人看罷直呼過癮:那個讓人驕傲的阿里,又回來了!
下午一點左右,阿里云 CTO 周靖人信步上臺,從AI模型與應(yīng)用及面向AI的基礎(chǔ)設(shè)施兩個方面,詳細介紹了阿里云近兩年來面向AI所攻克的先進“黑科技”。全程一個小時,信息密度極其之高,簡直目不暇接,實在是愛了。
圖片
在AI時代,云計算發(fā)生了全棧全系列的技術(shù)革命,這場革命中,而阿里云提出的“模型即服務(wù)”已經(jīng)成為了業(yè)界的標準。
圖片
1.阿里版的AI Infra,刀刀要害
不管大家愿不愿意,GPU時代已經(jīng)來臨,對此,周靖人直接甩出一個自研的Infra大殺器:磐久服務(wù)器。
磐久的厲害之處有三點:支持多種異構(gòu)芯片,主流、國產(chǎn)一應(yīng)支持,關(guān)鍵之處還在架構(gòu)上做了CPU和GPU的分離,以更好地實現(xiàn)算力匹配,芯片適配速度提升1倍;同時,為了能夠提供更多算力,磐久的一個服務(wù)器可以承載8顆甚至16顆GPU卡,遠遠超過行業(yè)水平;此外,針對高密度的信息計算帶來的散熱問題和GPU故障問題,“磐久”服務(wù)器正如其名,非常耐造,通過優(yōu)化的散熱布局,有效滿載GPU溫度降低3度,而基于AI算法的GPU故障預(yù)測,準確率達92%。
圖片
圖片
服務(wù)器之外,網(wǎng)絡(luò)成為影響大模型訓(xùn)練和用戶體驗的一大難題。周靖人介紹阿里云高性能網(wǎng)絡(luò)架構(gòu)HPN7.0。作為新型智算集群架構(gòu),可穩(wěn)定鏈接超過10萬個GPU,數(shù)據(jù)中心就可以化身為一臺超級計算機。周靖人還介紹到,HPN7.0通過前后端網(wǎng)絡(luò)分離的方式,后端可以提供3.2T的帶寬,可以提供極致的并行計算,此外阿里還自研了一系列協(xié)議,比如Solar RDMA協(xié)議、HPCC協(xié)議等,端到端的通信性能也做了翻倍。
另外,文件存儲系統(tǒng)CPFS也是一個亮點,它把面向AI的存儲和面向?qū)ο蟮拇鎯M行打通,為AI智算提供更佳的存儲能力,這樣就可以保證多賬號多模型的同時訓(xùn)練與推理。
容器方面,對于去年推出的容器計算服務(wù)ACS,也進行了產(chǎn)品升級,將支持動態(tài)細粒度熱調(diào)整,并能處理更大的并發(fā)數(shù)。
圖片
模型訓(xùn)練方面,阿里云主推的PAI平臺將為模型提供多種能力,比如模型、硬件、并行方式的組合多樣;可以更好地優(yōu)化模型的架構(gòu),做到自動化的并行加速;同時PAI的模型推理功能,也將優(yōu)化大模型服務(wù),提高效率和優(yōu)化成本。
圖片
圖片
除了算力,在數(shù)據(jù)處理方面,阿里云也相應(yīng)推出了OpenLake湖倉一體化的平臺,將在未來兩天的講演中有更加詳細的說明。
圖片
此外,周靖人表示,在AI時代,安全有了新的含義。為此,阿里云提供了安全中心、數(shù)字水印等解決方案,解決語料安全、數(shù)據(jù)安全、模型安全評測等一系列安全問題。
圖片
不得不說,全棧AI Infra,性能、穩(wěn)定、效率、伸縮、安全,可謂面面俱到,面面嚴謹,一貫是阿里的風(fēng)格。
2.通義家族全新亮相:開源生態(tài)已經(jīng)全球第二
上一部分的AI Infra還意猶未盡,結(jié)果下一PART更是讓現(xiàn)場人掌聲不斷。
在模型與應(yīng)用部分,周靖人持續(xù)丟出大招。Qwen2.5、旗艦版模型Qwen-Max(阿里版GPT-4o)、通義萬相、Qwen-Audio、Qwen-Math等連環(huán)引燃現(xiàn)場。通義家族徹底在云棲上出圈了!
周靖人介紹,通過通義家族全球領(lǐng)先的模型能力,可以充分發(fā)揮AI能力。同時,阿里云的百煉平臺,能夠?qū)⒛P偷恼{(diào)用和企業(yè)的數(shù)據(jù)有機結(jié)合起來。
圖片
2.1 通義千問大語言模型家族
通義千問開源模型累計下載量已突破 4000 萬,成為開源生態(tài)的全球第二,僅次于Llama。
Qwen2.5首次達到了18萬億的token,模型的輸入和輸出都支持了128K,同時數(shù)學(xué)和代碼能力大幅提升。此外,鑒于千問在全球廣泛的影響力,此次Qwen2.5支持中英文在內(nèi)的29種語言。
圖片
Qwen2.5開源了7個尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們在同等參數(shù)賽道都創(chuàng)造了業(yè)界最佳成績,型號設(shè)定充分考慮下游場景的不同需求。Qwen2.5開源了一系列小模型,如14B、7B模型,方便企業(yè)將模型集成到業(yè)務(wù)當(dāng)中,降低成本。而首次推出的3B模型,將有望推動端側(cè)應(yīng)用的開發(fā),同時和云上的模型應(yīng)用形成協(xié)同??芍^全尺寸、全場景、多態(tài),一應(yīng)俱全。
周靖人透露,旗艦版模型Qwen-Max,性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺模型均已切換為Qwen-Max,繼續(xù)免費為所有用戶提供服務(wù)。
圖片
在多模態(tài)的維度,通義千問也取得了一系列進展。
視覺維度上,視覺語言模型Qwen-VL在之前的圖片理解上,新增了對視頻的理解和推理能力,甚至超越了GPT-4o的水平,支持長達20分鐘以上長視頻理解,可以調(diào)用手機和設(shè)備的視覺智能體,支持多種語言。
圖片
而音頻模型Qwen-Audio,則融合了語音識別和語音理解,無須通過ASR模塊,實現(xiàn)了端到端的大模型,大大降低延遲。
圖片
同時,在專有能力上,通義推出Qwen-Math并開源。據(jù)阿里云官方透露,該模型超過了一眾開源模型及GPT-4o的數(shù)學(xué)能力。
圖片
2.2 通義萬相
與千問模型家族不同,通義萬相專注圖像和視頻的生成。
周靖人宣布,通義萬相的文生圖的能力得到了大幅提升,框架升級到Diffusion Transformer,具備強擴展性和靈活性。
圖片
同時,通義萬相正式推出了文生視頻能力,在技術(shù)上進行升級和優(yōu)化,可生成20s原生的1080p視頻,同時支持各種各樣的視頻風(fēng)格。該功能目前已在官網(wǎng)上公開試用。
圖片
圖片
講個小插曲,今晚6點左右,阿里會推出飛天音樂節(jié)的現(xiàn)場視頻《江雪》,大家可以留意觀看。
2.3 多項模型應(yīng)用
通義靈碼
通義靈碼插件下載破500萬,在服務(wù)開發(fā)者的同時,靈碼提供企業(yè)級的支持,能有效理解本地的代碼庫,同時保障了數(shù)據(jù)安全。
在此次升級中,靈碼進一步向智能體方向進化——可以理解需求、拆解任務(wù)并嘗試進行代碼的編寫,實現(xiàn)AI程序員的能力。
通義聽悟
通億聽悟提供實時的對話記錄功能,能完成語音轉(zhuǎn)文字等任務(wù)。目前,通義聽悟已經(jīng)集成在通義APP和Web端中,旨在幫助用戶提高學(xué)習(xí)和工作的效率。
通義PPT創(chuàng)作
通義也跟進了打工人喜愛的AI PPT功能。通義的PPT創(chuàng)作支持了豐富的類型輸入,長文本、音視頻都可以,值得一提的是支持了1000萬字的文檔,是同類產(chǎn)品望塵莫及的長度了!
此外,周靖人提到,通義PPT創(chuàng)作提供了豐富的模板,使得呈現(xiàn)效果美觀且專業(yè)。
圖片
通義AI翻譯助手?
通義的翻譯助手也進行了有意思的更新。除了在基礎(chǔ)功能上,搭載的端到端模型有效降低延遲,支持多種語言翻譯之外。通義的AI翻譯助手還提供旅行模式和會議模式,面向高頻場景提供更加適合的翻譯能力,這種巧思必須給產(chǎn)品經(jīng)理加個雞腿。
圖片
VideoChat 視頻通話?
在多模態(tài)的各個方面大秀肌肉后,小編心想這不就是GPT-4o的各種能力都具備了?果不其然!周靖人宣布了,通義版GPT-4o——VideoChat視頻通話功能上線了,大模型能聽能看能說,實時的理解和交互再也不是問題。
圖片
在千問家族強大的AI基礎(chǔ)能力之上,阿里云的百煉大模型服務(wù)平臺的出現(xiàn)則為進一步豐富模型應(yīng)用生態(tài)添磚加瓦。大模型服務(wù)平臺聯(lián)通了大模型進入企業(yè)的最后五公里,讓通用模型+垂直模型矩陣的實現(xiàn)更容易了!
圖片
這里不得不提,除了市面上通??吹降墓ぷ髁?、智能體編排工具,阿里團隊還提供了精細化的運營工具,輔助觀測和優(yōu)化引用效果,不僅可以覆蓋大模型應(yīng)用各個組件的執(zhí)行過程,還能讓全部過程可觀測、可分析、可評價、可干預(yù),獨立開發(fā)者和企業(yè)都可以無后顧之憂。
圖片
在大會上,周靖人宣布兩款推薦模型 Qwen-Plus 及 Qwen-Turbo 再次降價,降價幅度超過85% ,做到了業(yè)界最低,并提供免費試用。周靖人表示,希望足夠低的價格能吸引更多開發(fā)者入局大模型,這樣才能進一步激活大模型創(chuàng)作者的活力,推動AI領(lǐng)域的創(chuàng)新。
圖片
三、云棲大會的三場圓桌:AI明星談大模型、自動駕駛、具身智能
這還沒完,三場圓桌Panel同樣精彩。三場重磅圓桌,分別圍繞著吳泳銘演講的重點領(lǐng)域:大模型、自動駕駛、機器人展開。在圓桌的討論中,楊植麟、姜大昕、何小鵬等重磅AI大咖紛紛發(fā)表自己的觀點以及對AI未來的預(yù)測,觀點的碰撞讓人直呼過癮!
1.大模型
圖片
階躍智能的創(chuàng)始人姜大昕:AI沒有涼,仍處于一個加速發(fā)展期?
姜大昕認為AI在廣泛領(lǐng)域取得了突破,正在一個加速發(fā)展的過程中。從數(shù)量的角度來看,每個月都會有新的模型、新的產(chǎn)品、新的應(yīng)用涌現(xiàn)出來。而從質(zhì)量上看,GPT-4o、特斯拉FSD V12、OpenAI o1的發(fā)布具有重要的價值和意義。
月之暗面創(chuàng)始人楊植麟:o1拉高了大模型的上限,創(chuàng)業(yè)公司迎來新機會
楊植麟表示,OpenAI o1發(fā)布確實意義很大,他提到“AI的歷史上,唯一有效的就是Scaling law”。因此,從GPT1到GPT4是確定性的提升,但o1并不是完全確定性的,它提升了AI的上限,初步解決了進一步Scaling的問題。而且這個方法在一個初期階段,因此,能對很多產(chǎn)業(yè)格局會產(chǎn)生影響,會產(chǎn)生很多新的創(chuàng)業(yè)機會。
至于對產(chǎn)品的影響,楊植麟表示,AI產(chǎn)品更多是靠技術(shù)驅(qū)動,現(xiàn)在的技術(shù)發(fā)展,帶來了探索PMF的機會。雖然o1的思維鏈會使用戶獲得相應(yīng)的速度變慢,但長期來看增量價值將大于體驗損失。
此外當(dāng)被問及哪類初創(chuàng)企業(yè)更容易被融到錢時,楊植麟坦言:這跟AI本身關(guān)系不大。首先產(chǎn)品本身滿足市場需求,數(shù)據(jù)指標比如產(chǎn)品的留存是要關(guān)注別的,此外要看市場規(guī)模一定是有增量的。他認為,prompt engineering未來可能就不需要了,是一個越來越小的市場。
生數(shù)科技首席科學(xué)家朱軍:未來一年半,AI進入L3階段完全有可能
朱軍提到,在AI的L1-L5的級別中,o1突破了L1階段,向追求進行更復(fù)雜的推理和決策制定能力的L2階段轉(zhuǎn)變。展望未來的18個月,朱軍認為L3即AI智能體的實現(xiàn)是值得期待的。
下半年,生數(shù)科技也會為用戶們提供更加可控的視頻生成功能。
2.自動駕駛
小鵬汽車董事長、CEO何小鵬:年產(chǎn)量100萬AI車,才配留在牌桌上?
何小鵬表示,大模型可分為數(shù)字世界、物理世界和仿真世界三類,這三類模型將在未來相互融合。不過,從硬件角度看,這一融合過程的速度將較為緩慢。相較于數(shù)字世界的快速變化,物理世界的變革步伐將更為穩(wěn)重。
談及特斯拉 FSD 入華對行業(yè)的影響時,何小鵬表示,“我覺得我們需要不一樣的很好的技術(shù)來沖擊市場,能夠讓我們看到市場的變化,我覺得未來在牌桌上的玩家會比較少?!敝劣谂袛鄻藴?,何小鵬認為:誰能做到年產(chǎn)量100萬臺純AI車,誰就有資格。
他指出,端到端的模型下限能力有望在明年快速提高,一旦提高后,不用2年時間,在全球范圍內(nèi)就可以做到超越L4標準的能力。據(jù)悉,何小鵬駕駛“全球首款A(yù)I汽車”P7+亮相2024云棲大會,這款車搭載了業(yè)內(nèi)領(lǐng)先的端到端大模型。
上圖:“全球首款A(yù)I汽車”P7?
3.機器人/具身智能
北大-銀河通用具身智能聯(lián)合實驗室主任王鶴:通用和零代碼是兩大方向
王鶴指出,人形機器人的技術(shù)含金量可以總結(jié)為兩個方面:第一,它的泛化性到底有多強,是不是真正能通向未來的通用。第二,它能不能跟人之間用自然語言來溝通,實現(xiàn)零代碼的部署。
逐際動力創(chuàng)始人張巍:“雙腿”對人性機器人至關(guān)重要
張巍提到,“我覺得人類機器人之所以是一個新的物種,它不是一個傳統(tǒng)機械臂公司的延續(xù),它的本質(zhì)就是要長出兩條腿來,我覺得腿是能是機器人具有通用能力的一個基礎(chǔ)。那看腿要看什么呢?主要看兩點,一個就是腿他有沒有完成他本能的一些本職的工作,就是地形的泛化能力。第二點也很重要,就是看他能不能支撐雙臂去完成全身協(xié)同的這樣一個通用的操作,這也是腿存在的一個重要的價值?!?/p>
四、寫在最后:AI加強版的阿里,已來
從通義千問的發(fā)布再到如今阿里版的國產(chǎn)AI基建、阿里版的GPT-4o、通義全家桶、中國最大的開源模型社區(qū)魔搭,“用戶為先,AI驅(qū)動”戰(zhàn)略正在重塑一個AI加強版的阿里。
此次云棲大會的各種發(fā)布就是一個最好的證明,它不負“AI硬科技盛宴”的稱號!在首日奉獻了一場讓人目不暇接的科技饕餮。
阿里在AI領(lǐng)域的持續(xù)深耕,不僅磨礪了強勁的技術(shù),更為推動AI生態(tài)的成長和完善貢獻了一份不可小覷的推動力。
在AI圈頻繁的被“泡沫即將破滅,Super APP遠未到來”的焦灼刺痛之時。
吳媽的一句“AI最大的想象力不在手機屏幕,而是改變物理世界”,不只是一劑有力的強心針,更是帶來了高屋建瓴般的震撼和暢快。
我們有理由相信,AI在未來世界扮演著重構(gòu)者的重要角色。而我們正在向著未來飛奔,見證著國產(chǎn)AI力量的崛起。一切都值得期待。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征 伊風(fēng)
