自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

全球頂級(jí)AI科學(xué)家許主洪加盟阿里!IEEE Fellow,五萬(wàn)被引論文數(shù),曾任Salesforce集團(tuán)副總裁

人工智能 新聞
AI不是移動(dòng)互聯(lián)網(wǎng),但用戶需求和產(chǎn)品體驗(yàn)的價(jià)值線,大道至簡(jiǎn),一以貫之,未曾改變。

AI的新進(jìn)展頻頻,人才動(dòng)態(tài)也愈加重磅。

新年第一則大牛人事動(dòng)向,引發(fā)業(yè)內(nèi)關(guān)注。

許主洪,IEEE Fellow,新加坡管理大學(xué)終身教授,被曝加盟阿里。

許主洪是誰(shuí)?1998級(jí)清華計(jì)算機(jī)系本科,碩博畢業(yè)于港中文,谷歌學(xué)術(shù)五萬(wàn)引大佬。

多篇關(guān)于多模態(tài)預(yù)訓(xùn)練論文,深刻影響了業(yè)內(nèi)大模型研發(fā),阿里Qwen、谷歌RT-2都曾引用過(guò)其研究成果。

產(chǎn)業(yè)界,他曾擔(dān)任全球最大企業(yè)軟件廠商Salesforce集團(tuán)副總裁、亞洲研究院創(chuàng)始院長(zhǎng),從0到1搭建了Salesforce亞洲人工智能研究體系。

現(xiàn)在,阿里方面已經(jīng)證實(shí)。他將出任阿里集團(tuán)副總裁,向阿里AI To C業(yè)務(wù)負(fù)責(zé)人吳嘉匯報(bào),專注于AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及Agents相關(guān)基礎(chǔ)研究與應(yīng)用解決方案。

誰(shuí)是許主洪?

在加盟阿里之前,他曾在工業(yè)界和學(xué)術(shù)界均擁有超20年經(jīng)驗(yàn),曾在新加坡南洋理工大學(xué)、新加坡管理大學(xué)擔(dān)任教授。

研究方向包括機(jī)器學(xué)習(xí)的基礎(chǔ)研究和人工智能多個(gè)領(lǐng)域的應(yīng)用研究,包括多媒體信息檢索、計(jì)算機(jī)視覺(jué)、大數(shù)據(jù)分析、社交媒體、智能網(wǎng)絡(luò)安全、計(jì)算金融和智慧城市等。

谷歌學(xué)術(shù)顯示,其發(fā)表300余篇人工智能頂級(jí)學(xué)術(shù)論文,被引五萬(wàn)余次,2020年至今被引近四萬(wàn)次。

2019年當(dāng)選為IEEE Fellow,同一年當(dāng)選的還有知名大佬、CMU教授邢波。

時(shí)間回到1998年,他來(lái)到清華大學(xué)計(jì)算機(jī)系讀書,本科畢業(yè)前往港中文攻讀碩博。

2007年他來(lái)到了新加坡南洋理工大學(xué)。期間他負(fù)責(zé)開源了一個(gè)機(jī)器學(xué)習(xí)庫(kù)LIBOL,里面有一大批經(jīng)典和先進(jìn)的在線學(xué)習(xí)算法,用于解決大規(guī)模機(jī)器學(xué)習(xí)任務(wù),滿足各種新興大數(shù)據(jù)挖掘應(yīng)用的需求。

能夠看到的是,從那時(shí)候開始,他就已經(jīng)在深入思考連接技術(shù)到應(yīng)用之間這一橋梁。

隨后他去到新加坡管理大學(xué),2020年獲終身教職。

轉(zhuǎn)折點(diǎn)在2019年,他正式選擇踏入工業(yè)界,將自身技術(shù)積累真正融入進(jìn)產(chǎn)業(yè)應(yīng)用當(dāng)中去。

他的實(shí)戰(zhàn)場(chǎng)是全球最大企業(yè)軟件廠商Salesforce,幫助他們補(bǔ)齊AI基礎(chǔ)研究與應(yīng)用這一板塊。

他主導(dǎo)開創(chuàng)了多個(gè)行業(yè)先河的人工智能項(xiàng)目和產(chǎn)品,包括不限于多模態(tài)系列模型BLIP、代碼生成神器CodeGen、通用CRM助手Einstein GPT。

(CRM是客戶關(guān)系管理軟件系統(tǒng)。Einstein GPT支持包括 Slack、銷售、服務(wù)、營(yíng)銷、商務(wù)和應(yīng)用程序構(gòu)建器)

另一個(gè)實(shí)戰(zhàn)場(chǎng)是2023年,乘著大模型的技術(shù)熱潮,他創(chuàng)辦了AI初創(chuàng)公司HyperGAI。

期間發(fā)布了多款多模態(tài)基礎(chǔ)模型,特點(diǎn)是在不增加計(jì)算成本的情況下,實(shí)現(xiàn)當(dāng)前世界頂尖模型的水平。

在GPT-4V和Gemini Pro等大語(yǔ)言模型都在專注于文本的當(dāng)下,他們?cè)诙嗄B(tài)理解和生成上面取得了不少突破,并且有很強(qiáng)的應(yīng)用屬性在里面。

比如像HPT 1.5 端側(cè)多模態(tài)模型,只有4B大小,性能卻優(yōu)于當(dāng)時(shí)微軟新推出的Phi-3-Vision(4B)多模態(tài)模型,并在多項(xiàng)基準(zhǔn)測(cè)試中達(dá)到了GPT-4V的性能。

除了一些評(píng)測(cè)之外,模型還展示了移動(dòng)端上的使用效果,能夠識(shí)別圖中的關(guān)鍵信息。

同時(shí)它也具備強(qiáng)大的推理能力,可以理解并解答幾何題。

學(xué)術(shù)領(lǐng)域,他憑借深厚的專業(yè)素養(yǎng)和杰出的研究能力,發(fā)表了眾多頂級(jí)學(xué)術(shù)論文,研究成果備受行業(yè)矚目。

而在產(chǎn)業(yè)界,他將前沿技術(shù)與實(shí)際應(yīng)用緊密結(jié)合,成功推動(dòng)了AI多個(gè)領(lǐng)域的突破與落地,成為連接學(xué)術(shù)與產(chǎn)業(yè)之間的橋梁。

深刻影響多模態(tài)大模型研發(fā)

問(wèn)題是有了這位頂尖AI科學(xué)家的加盟,對(duì)于阿里來(lái)說(shuō)意味著什么?

在許主洪的專業(yè)擅長(zhǎng)中,不難找到線索和答案。

在他諸多論文中,有兩篇BLIP系列論文最為矚目,累計(jì)引用過(guò)萬(wàn),其中BLIP-2始終高居引用榜首。

更早之前還有技術(shù)博主專門研讀了他的成果,表示GPT-4V現(xiàn)在還像個(gè)黑匣子,而BLIP系列研究不僅在各種視覺(jué)任務(wù)中表現(xiàn)出SOTA的性能,也可能是打破黑匣子的有效解決方案。

2023年,各種大語(yǔ)言模型剛剛興起的時(shí)候,業(yè)內(nèi)就已經(jīng)在思考LLM涌現(xiàn)的通用性和泛化能力,是否也能在視覺(jué)領(lǐng)域中實(shí)現(xiàn)。

一個(gè)統(tǒng)一的視覺(jué)與語(yǔ)言的框架,以及一個(gè)能將它們與LLM結(jié)合起來(lái)的框架,成為自然而然的技術(shù)需求。

在眾多創(chuàng)新方法中,BLIP脫穎而出,它統(tǒng)一了視覺(jué)語(yǔ)言任務(wù)的理解與生成能力,并通過(guò)引入Captioner-Filter機(jī)制減少了監(jiān)督文本的噪聲,從而提高模型的訓(xùn)練質(zhì)量。

模型核心在于獨(dú)特的編碼器-解碼器混合架構(gòu)(MED),該架構(gòu)由視覺(jué)編碼器、文本編碼器和多模態(tài)編碼器三部分組成。

每個(gè)模塊都有相關(guān)的預(yù)訓(xùn)練目標(biāo),所有三個(gè)模塊都根據(jù)這些預(yù)訓(xùn)練目標(biāo)進(jìn)行聯(lián)合訓(xùn)練。

這系列論文所在的語(yǔ)言視覺(jué)智能一站式庫(kù)LAVIS,GitHub超過(guò)萬(wàn)顆星,足以見(jiàn)其在業(yè)內(nèi)的影響力。在這個(gè)庫(kù)里還有各種BLIP的衍生,比如X-InstructBLIP、BLIP-Diffusion等等。

而將時(shí)間拉回現(xiàn)在,隨著大模型發(fā)展的深入,多模態(tài)能力作為核心屬性,正在重塑著AI的應(yīng)用范式。

總結(jié)來(lái)說(shuō),多模態(tài)讓大模型從“單一功能工具”轉(zhuǎn)變?yōu)椤叭艿腁gent”,其應(yīng)用場(chǎng)景將不斷地深入與拓寬。

核心體現(xiàn)在兩個(gè)方面:

其一,突破單模態(tài)局限,實(shí)現(xiàn)更全面的認(rèn)知與交互。多模態(tài)大模型通過(guò)融合文本、圖像、音頻、視頻等異構(gòu)數(shù)據(jù),能夠構(gòu)建更接近人類認(rèn)知、近乎人類水平的模型。

這種跨模態(tài)的語(yǔ)義對(duì)齊能力,使AI能理解復(fù)雜場(chǎng)景中的隱含關(guān)聯(lián),比如識(shí)別圖像中的隱喻或情感表達(dá)。像夸克、通義APP這種軟件,在其智能工具、ChatBot屬性之上,集成更多多模態(tài)功能之后,就能實(shí)現(xiàn)更多精細(xì)化功能,成為日常的AI全能助手。

更多樣化更復(fù)雜的任務(wù)需求也將得到滿足,多維之間的感知交互,能夠?qū)崿F(xiàn)AI在更多終端和硬件的落地,比如AI眼鏡——據(jù)稱是已經(jīng)明確的阿里AI to C業(yè)務(wù)未來(lái)探索方向。當(dāng)然這些還只是單點(diǎn)功能或產(chǎn)品形態(tài),多模態(tài)能力還在于更多應(yīng)用場(chǎng)景的賦能。

所以第二個(gè)方面就是:拓展更多應(yīng)用場(chǎng)景,釋放行業(yè)生產(chǎn)力。

比如醫(yī)療場(chǎng)景,多模態(tài)模型融合醫(yī)學(xué)影像、基因數(shù)據(jù)和臨床文本,支持個(gè)性化診療方案生成。教育場(chǎng)景,結(jié)合圖文、視頻和語(yǔ)音的多模態(tài)教學(xué)助手,可動(dòng)態(tài)適配學(xué)生學(xué)習(xí)風(fēng)格,提供沉浸式學(xué)習(xí)體驗(yàn)。

但上述場(chǎng)景對(duì)阿里來(lái)說(shuō)不是計(jì)劃,而是已經(jīng)部署落地的實(shí)踐,并且還展現(xiàn)出“干中學(xué)”的技術(shù)迭代潛力。

在夸克落地的業(yè)務(wù)中,其“靈知”學(xué)習(xí)大模型在考研數(shù)學(xué)題上的正確率和得分率已經(jīng)比肩OpenAI最新發(fā)布的o1模型,且遠(yuǎn)超國(guó)內(nèi)其他模型。

所以了解了多模態(tài)能力與阿里AI to C業(yè)務(wù)布局的關(guān)系,或許也就看懂了許主洪的加盟。

這一次他要連接的是AI多模態(tài)能力在C端產(chǎn)品、應(yīng)用上的端對(duì)端閉環(huán)能力。

做面向用戶的AI技術(shù)創(chuàng)新

大模型的發(fā)展路線,目前可以總結(jié)為兩條,一個(gè)是面向大模型更高級(jí)智能水平的技術(shù)演進(jìn),一個(gè)是面向應(yīng)用和用戶價(jià)值/體驗(yàn)的AI技術(shù)創(chuàng)新。阿里AI To C業(yè)務(wù)尤其是夸克呈現(xiàn)出后者的特點(diǎn)。

于阿里而言,許主洪是人工智能學(xué)術(shù)界的領(lǐng)路人,在產(chǎn)業(yè)界同樣擁有豐富的應(yīng)用研發(fā)和產(chǎn)品創(chuàng)新經(jīng)驗(yàn)——尤其他不僅搭建了Salesforce亞洲人工智能研究體系,還將研究成果轉(zhuǎn)化為實(shí)際應(yīng)用——主導(dǎo)的多個(gè)AI創(chuàng)新項(xiàng)目,將學(xué)術(shù)成果轉(zhuǎn)化為商業(yè)應(yīng)用,推動(dòng)了AI技術(shù)產(chǎn)業(yè)化進(jìn)程。

這種學(xué)術(shù)與產(chǎn)業(yè)的雙重背景,使得許主洪不僅具備深厚的學(xué)術(shù)研究功底,還擁有將技術(shù)轉(zhuǎn)化為實(shí)際產(chǎn)品的豐富經(jīng)驗(yàn)。這種能力就是阿里AI To C業(yè)務(wù)所需要的。

而以夸克為代表的阿里AI To C業(yè)務(wù),在大模型能力上也一直注重實(shí)用性,強(qiáng)調(diào)以應(yīng)用產(chǎn)品驅(qū)動(dòng)大模型的研發(fā)、升級(jí)方向。

產(chǎn)品追求的不是“顛覆”,而是拳拳到肉,解決用戶的核心需求。夸克大模型的典型特點(diǎn)就是不卷參數(shù)和打榜,而是依據(jù)使用場(chǎng)景提供專業(yè)技術(shù)能力,衍生出通識(shí)、醫(yī)療、教育等垂類模型。

這種對(duì)用戶價(jià)值的核心追求,也是AI驅(qū)動(dòng)之下,夸克迅猛崛起,成為國(guó)內(nèi)增長(zhǎng)最快、勢(shì)頭最猛、用戶使用最多的AI全能助手——沒(méi)有之一。

量子位智庫(kù)統(tǒng)計(jì),在APP端,前10個(gè)月國(guó)內(nèi)AI APP三日留存數(shù)據(jù)顯示,夸克是唯一突破40%的產(chǎn)品,也是唯一突破兩億累計(jì)下載量的。

△圖源:量子位智庫(kù)

如果說(shuō)一年前還相對(duì)低調(diào),高速增長(zhǎng)下的夸克現(xiàn)在也攤牌了,夸克已經(jīng)完成了品牌升級(jí)——2億人的AI全能助手。

當(dāng)然,這也是技術(shù)、產(chǎn)品、場(chǎng)景等全方位要素驅(qū)動(dòng)之下的結(jié)果,天時(shí)地利皆具備,現(xiàn)在阿里整個(gè)AI To C業(yè)務(wù)要發(fā)力,就是時(shí)候在“人和”——人才上點(diǎn)燃東風(fēng)。

許主洪的加盟可能還只是開始的開始。有消息稱,阿里AI To C業(yè)務(wù)正在組建頂級(jí)AI算法研究和工程團(tuán)隊(duì),吸引大量業(yè)內(nèi)頂級(jí)人才加盟。

而頂級(jí)科學(xué)家+頂尖團(tuán)隊(duì),再加上高速前進(jìn)的AI業(yè)務(wù)和場(chǎng)景,夸克也好,阿里AI To C業(yè)務(wù)布局也好,有機(jī)會(huì)把AI創(chuàng)新帶入中國(guó)最熟悉的范式之下——技術(shù)驅(qū)動(dòng)產(chǎn)品,產(chǎn)品反哺技術(shù),并且在規(guī)模最大的用戶市場(chǎng)迭代之下,實(shí)現(xiàn)綜合實(shí)力的超車。

AI不是移動(dòng)互聯(lián)網(wǎng),但用戶需求和產(chǎn)品體驗(yàn)的價(jià)值線,大道至簡(jiǎn),一以貫之,未曾改變。

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2022-05-20 11:10:56

AI大牛離職

2012-04-05 11:30:47

架構(gòu)

2025-01-02 10:04:48

2015-10-22 17:55:10

Hewlett Pac葉健

2013-02-27 13:34:15

Arbor博科網(wǎng)絡(luò)設(shè)備廠商

2017-04-19 14:33:48

互聯(lián)網(wǎng)

2020-11-26 09:35:00

人工智能機(jī)器學(xué)習(xí)技術(shù)

2022-11-03 14:13:24

騰訊科學(xué)家

2009-11-13 04:23:12

云計(jì)算Gartner專訪

2009-02-12 08:42:18

聯(lián)想副總裁張暉

2011-06-08 09:39:21

微軟平板電腦Skype

2014-10-16 09:49:59

希捷

2017-10-15 10:08:13

AI

2025-01-14 14:20:47

2012-12-06 15:36:55

CIO

2023-05-23 09:34:16

科學(xué)家AI

2021-11-15 12:16:12

VMware

2018-11-06 15:46:29

AI技術(shù)科技

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2014-11-03 09:15:34

阿里云IDST
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)