黃學(xué)東告別信首發(fā)!微軟30年老將出走,擔(dān)任Zoom CTO,瞄準(zhǔn)AI+AR
黃學(xué)東宣布,自己將離開(kāi)已任職30年的微軟,出任Zoom的CTO。
從昨天開(kāi)始,整個(gè)業(yè)內(nèi)被這條消息震動(dòng)了。
自從ChatGPT引爆了大模型之戰(zhàn),全球的大廠都在重新布局戰(zhàn)略版圖,AI人才的爭(zhēng)奪戰(zhàn),也進(jìn)入了白熱化。
而今,黃學(xué)東的離職,也是這場(chǎng)時(shí)代洪流中濃墨重彩的一筆。
如此重量級(jí)的技術(shù)大佬出走,江湖上勢(shì)必掀起一場(chǎng)腥風(fēng)血雨。
在微軟30年,黃學(xué)東帶領(lǐng)的團(tuán)隊(duì)在語(yǔ)音識(shí)別、機(jī)器翻譯、自然語(yǔ)言理解和計(jì)算機(jī)視覺(jué)等方面都取得了里程碑式突破,可以說(shuō)沒(méi)有短板,結(jié)合下Zoom的業(yè)務(wù)場(chǎng)景,這一定是盤大棋。
關(guān)于黃學(xué)東加入Zoom后要從事的業(yè)務(wù)方向,專家和網(wǎng)友們已經(jīng)紛紛展開(kāi)了猜測(cè)。
告別信
在新智元獨(dú)家獲得的告別信中,黃學(xué)東也透露了自己進(jìn)軍Zoom后的方向——推動(dòng)從AI到AR的新技術(shù)和產(chǎn)品。
在微軟度過(guò)了30年不可思議的時(shí)光,今天是我告別的日子。
能夠?yàn)檫@個(gè)杰出的公司做出貢獻(xiàn),并與擁有聰明才智的人們一同共事,是我的榮幸。我會(huì)永遠(yuǎn)銘記在這里的回憶和經(jīng)歷。
我將加入Zoom,擔(dān)任該公司的新任首席技術(shù)官(CTO),我將主要推動(dòng)從AI到AR等領(lǐng)域的新技術(shù)和產(chǎn)品。
Zoom承諾將投資于創(chuàng)新領(lǐng)域,這令人鼓舞,我也很興奮能夠成為這個(gè)充滿活力的「初創(chuàng)企業(yè)」的一員。
而對(duì)于微軟同事們始終如一的支持、指導(dǎo)和合作,我深深感激。
我們共同取得了非凡的里程碑,在Azure AI上取得的建樹(shù)已經(jīng)改變了整個(gè)行業(yè),包括最新的OpenAI服務(wù)。
對(duì)于所有朋友和同事們,我無(wú)比感謝我們共同擁有的珍貴回憶和知識(shí)。
我相信我們的聯(lián)系將持久存在,我們對(duì)技術(shù)和人工智能的熱情將繼續(xù)激勵(lì)所有人。
除了Zoom給出的承諾,創(chuàng)始人袁征的華裔身份或許也是一個(gè)原因。作為第一代中國(guó)移民,袁征在國(guó)內(nèi)和美國(guó)都有學(xué)習(xí)和工作的經(jīng)歷,和黃學(xué)東應(yīng)該有不少共同語(yǔ)言。
當(dāng)30年元老選擇離開(kāi)
作為第一位加入微軟研究院體系的華人科學(xué)家,黃學(xué)東一直是微軟華人AI版圖上不可或缺的一塊拼圖。
在微軟,他已經(jīng)任職了超過(guò)30年。
離職前,黃學(xué)東擔(dān)任Azure AI首席技術(shù)官,不僅是微軟首位全球華人技術(shù)院士,也是微軟最高級(jí)別的華人科學(xué)家
黃學(xué)東分別于2017年和2020年,當(dāng)選ACM和IEEE會(huì)士,并于2023年同時(shí)當(dāng)選美國(guó)國(guó)家工程院院士和美國(guó)藝術(shù)與科學(xué)院院士。共計(jì)擁有170多項(xiàng)美國(guó)專利,發(fā)表100多篇論文和2本著作。
在此之前,他于1989年獲得愛(ài)丁堡大學(xué)的博士學(xué)位,1984年獲得清華大學(xué)的碩士學(xué)位,1982年獲得湖南大學(xué)的學(xué)士學(xué)位。1989年曾在卡內(nèi)基梅隆大學(xué)進(jìn)行博士后研究,之后加入卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院的教職。
1992年,黃學(xué)東領(lǐng)導(dǎo)卡內(nèi)基梅隆大學(xué)語(yǔ)音識(shí)別項(xiàng)目Sphinx-II,實(shí)現(xiàn)了業(yè)界最低的錯(cuò)誤率,并刷新了DARPA語(yǔ)音評(píng)估史上錯(cuò)誤降低速度的最高記錄。
這個(gè)消息震動(dòng)了微軟,人事部?jī)A巢出動(dòng),想要挖來(lái)這個(gè)團(tuán)隊(duì)。最后,蓋茨親自出面,才終于請(qǐng)動(dòng)黃學(xué)東。
1993年,黃學(xué)東加入微軟研究院,成立了微軟的語(yǔ)音技術(shù)團(tuán)隊(duì)。
在他的牽線搭橋下,微軟于1996年在北京建起第一個(gè)亞洲研究院,亞研院也在日后成為中國(guó)AI屆的黃埔軍校。
隨后,微軟研究院陸續(xù)加入了李開(kāi)復(fù)、張亞勤、沈向洋、洪小文等知名華人學(xué)者。
在三十年間,微軟經(jīng)歷了多次人事變動(dòng),而黃學(xué)東始終堅(jiān)守,帶領(lǐng)微軟的人工智能團(tuán)隊(duì)取得了一項(xiàng)又一項(xiàng)里程碑式突破。
通過(guò)Windows SAPI(1995年)、Speech Server(2004年)和Azure Speech(2015年)等產(chǎn)品的推出,黃學(xué)東將語(yǔ)音技術(shù)帶入大眾市場(chǎng)。
在1995年,黃學(xué)東主導(dǎo)研發(fā)了業(yè)界首個(gè)語(yǔ)音應(yīng)用程序編程接口(SAPI),讓數(shù)百萬(wàn)客戶能在Windows應(yīng)用程序中便捷使用語(yǔ)音人工智能技術(shù)。
此后,他負(fù)責(zé)領(lǐng)導(dǎo)的微軟人工智能團(tuán)隊(duì),在語(yǔ)音識(shí)別、機(jī)器翻譯、自然語(yǔ)言理解和計(jì)算機(jī)視覺(jué)等方面,取得了多個(gè)歷史性突破。
2016年,微軟首次在對(duì)話式語(yǔ)音識(shí)別領(lǐng)域,讓計(jì)算機(jī)能夠像人類一樣識(shí)別每一個(gè)單詞。2017年,準(zhǔn)確率首次超過(guò)人類專業(yè)速記員。
2018年,微軟機(jī)器翻譯系統(tǒng),首次達(dá)到了與人類持平的水準(zhǔn)。
2019年,微軟機(jī)器閱讀理解系統(tǒng),在對(duì)話式問(wèn)答任務(wù)中首次超過(guò)人類。
2020年,微軟計(jì)算機(jī)視覺(jué)圖形傳字幕系統(tǒng),在計(jì)算機(jī)視覺(jué)看圖說(shuō)話任務(wù)中首次超過(guò)人類。
而最近的高光時(shí)刻,是黃學(xué)東領(lǐng)導(dǎo)微軟認(rèn)知服務(wù)團(tuán)隊(duì)和OpenAI合作推出的Azure OpenAI Services, 包括微軟云的ChatGPT服務(wù)。
正是OpenAI服務(wù),使得ChatGPT能在全世界進(jìn)行大規(guī)模商用。
Azure Speech、Vision、Language和OpenAI Services等Azure認(rèn)知服務(wù),使Azure成為覆蓋數(shù)百種語(yǔ)言、為全球數(shù)十億客戶提供服務(wù)的領(lǐng)先工業(yè)人工智能平臺(tái),使機(jī)器看到、聽(tīng)到、說(shuō)話和理解人類語(yǔ)言成為現(xiàn)實(shí)。
在微軟云平臺(tái)上用一個(gè)統(tǒng)一的大規(guī)?;A(chǔ)模型和多模態(tài)基礎(chǔ)模型聯(lián)合工作,實(shí)現(xiàn)了人工智能質(zhì)的飛躍,并且奠定了微軟云平臺(tái)人工智能產(chǎn)業(yè)化的全球競(jìng)爭(zhēng)力。
微軟的技術(shù)突破
通過(guò)巨量包括文本,圖片,語(yǔ)音等多模態(tài)數(shù)據(jù)的預(yù)訓(xùn)練,基礎(chǔ)模型可以被應(yīng)用到各類任務(wù)上,比如問(wèn)答、物體識(shí)別、信息抽取等。相比于處理單個(gè)任務(wù)的模型,基礎(chǔ)模型在部署速度和性能上都更占優(yōu)勢(shì)。
而微軟的人工智能技術(shù),便是建立在基礎(chǔ)模型(Foundation Models)之上。
其實(shí),我們可以從一個(gè)獨(dú)特的視角來(lái)看待人類認(rèn)知的三個(gè)屬性之間的關(guān)系:?jiǎn)握Z(yǔ)言文本(X)、音頻或視覺(jué)感官信號(hào)(Y)和多語(yǔ)言(Z)。
在這三者的交叉點(diǎn)上,有一種神奇的東西——XYZ-code。這種聯(lián)合表征可以創(chuàng)造出更強(qiáng)大的AI,從而更好地說(shuō)、聽(tīng)、看和理解。
語(yǔ)音
2017年,微軟就把基礎(chǔ)模型融合到了語(yǔ)音產(chǎn)品中。這種方式不但能減少大量的工程勞動(dòng),還提升了模型在各個(gè)任務(wù)上的性能。
根據(jù)斯坦福發(fā)布的AI Index2021報(bào)告,微軟的語(yǔ)音識(shí)別準(zhǔn)確率處于行業(yè)第一。
語(yǔ)言
2022年初,微軟發(fā)布了全新的機(jī)器翻譯模型Z-Code,可以通過(guò)遷移學(xué)習(xí)利用跨多種語(yǔ)言的共享語(yǔ)言元素,將知識(shí)從一項(xiàng)任務(wù)應(yīng)用到另一項(xiàng)相關(guān)任務(wù)。
與傳統(tǒng)的神經(jīng)機(jī)器翻譯方法不同,Z-Code不僅使用多語(yǔ)言的數(shù)據(jù)在機(jī)器翻譯任務(wù)上進(jìn)行訓(xùn)練,還使用了單語(yǔ)言數(shù)據(jù)作為補(bǔ)充,在掩碼語(yǔ)言模型(MLM)任務(wù)上訓(xùn)練。此外,還通過(guò)多任務(wù)學(xué)習(xí),同時(shí)優(yōu)化多個(gè)目標(biāo)函數(shù)。
鑒于Z-Code不俗的表現(xiàn),黃教授團(tuán)隊(duì)又進(jìn)一步將Z-Code升級(jí)拓展為Z-Code++,使其可以完成文本摘要任務(wù),并在GENIE benchmark上取得了第一名的好成績(jī)。
Z-Code++僅針對(duì)抽象式文本摘要任務(wù)進(jìn)行優(yōu)化,在5種語(yǔ)言的13個(gè)文本摘要任務(wù)中,有9個(gè)達(dá)到新sota性能,成功超越一眾大模型,參數(shù)量?jī)H為PaLM的600分之一,GPT-3的200分之一,性價(jià)比爆棚。
論文地址:https://arxiv.org/abs/2208.09770
視覺(jué)
2021年底,微軟發(fā)布了一個(gè)新的計(jì)算機(jī)視覺(jué)基礎(chǔ)模型Florence(佛羅倫薩),目的是要用一個(gè)模型一統(tǒng)多模態(tài)天下。
論文地址:https://arxiv.org/pdf/2111.11432.pdf
現(xiàn)有的視覺(jué)基礎(chǔ)模型,如CLIP、ALIGN等,主要側(cè)重于將圖像和文本映射到一種跨模態(tài)的共享表征。
Florence則將表征進(jìn)行了拓展,不僅擁有從粗略(場(chǎng)景)到精細(xì)(對(duì)象)的表征能力,還將視覺(jué)能力從靜態(tài)(圖像)擴(kuò)展到動(dòng)態(tài)(視頻),從RGB圖像擴(kuò)展到多模態(tài)(文字、深度信息)。
通過(guò)整合圖像-文本數(shù)據(jù)的通用視覺(jué)語(yǔ)言表示能力,F(xiàn)lorence可以輕松適用于各種計(jì)算機(jī)視覺(jué)任務(wù),如分類、目標(biāo)檢測(cè)、VQA、看圖說(shuō)話、視頻檢索和動(dòng)作識(shí)別,在多種類型的遷移學(xué)習(xí)中均表現(xiàn)出色。
Florence成功地表明基礎(chǔ)模型可以適應(yīng)各種下游任務(wù),最終集成到現(xiàn)代計(jì)算機(jī)視覺(jué)系統(tǒng)中,為現(xiàn)實(shí)世界的視覺(jué)和多媒體應(yīng)用提供動(dòng)力。
微軟持續(xù)裁員,或?qū)⒂瓉?lái)離職潮
除了大佬的出走,整個(gè)微軟團(tuán)隊(duì)最近都很動(dòng)蕩。
據(jù)說(shuō)無(wú)論是微軟中國(guó)還是西雅圖,很多華人都要出走。
五月下旬,有一畝三分地的網(wǎng)友透露:「微軟今年沒(méi)有merit,increase不增加,base獎(jiǎng)金和股也減少?!?/span>
另一位一畝三分地的網(wǎng)友,也吐槽稱:「CEO雖然厲害,但是個(gè)人的感覺(jué)是,對(duì)股東是好CEO,對(duì)用戶和員工來(lái)說(shuō),是非常差的CEO?!?/span>
而一位已經(jīng)從微軟離職的推特網(wǎng)友,也對(duì)CEO的表現(xiàn)頗有微詞。
根據(jù)blind知名爆料人「Rain」的消息,微軟七月份將再次裁員數(shù)千人。
初步的時(shí)間安排是在7月4日之后,但部分團(tuán)隊(duì)尤其是國(guó)際團(tuán)隊(duì),可能會(huì)在6月宣布變動(dòng)。
具體數(shù)量預(yù)計(jì)會(huì)在本月晚些時(shí)候得到更明確的消息,可能會(huì)根據(jù)一些具體的后勤情況有所調(diào)整。
大部分裁員將涉及客戶服務(wù)和支持等面向客戶的角色,但其他團(tuán)隊(duì)(包括之前已被定為目標(biāo)的團(tuán)隊(duì))也將受到影響。