其他人還在放“大模型”的衛(wèi)星 微軟已經(jīng)教會開發(fā)者怎么用它了
春夏之交,正是全球各大頂級科技公司舉辦年度活動的季節(jié)。兩周前是谷歌,而這一周終于輪到了微軟。僅用短短43分鐘的時間,微軟董事長兼 CEO 薩蒂亞·納德拉 (Satya Nadella) 就完成了今年 Build 2022 大會主題演講。有如說快板一般,他發(fā)布了微軟在開發(fā)者流程、云計算、微服務(wù)、AI大模型商用化、低代碼、工業(yè)元宇宙等十大領(lǐng)域的50多項全新產(chǎn)品、技術(shù)和項目進展。
其中最值得關(guān)注的新發(fā)布,包括:
- 采用 OpenAI 技術(shù)成功實現(xiàn)商業(yè)化的大模型服務(wù) OpenAI Services;
- 機器學(xué)習(xí)算法驅(qū)動的低代碼/無代碼開發(fā)平臺、GitHub Copilot AI 代碼助手正式面向公眾開放;
- 工業(yè)元宇宙方面的嘗試;
- 面向 Windows on ARM 開發(fā)者推出的開發(fā)原型機 Project Volterra;
- 辦公協(xié)作軟件 Teams 新推出的 Live Share 實時協(xié)作“小程序”平臺;等。
而在數(shù)量眾多的新發(fā)布當(dāng)中,絕大部分可以被歸結(jié)為以下三個關(guān)鍵角度:
- 通過 AI 以及 AI 工具協(xié)助的方式,讓開發(fā)者和商業(yè)用戶能夠不受工具的拖累,如 GitHub Copilot 代碼生成工具、跨設(shè)備同步的開發(fā)環(huán)境虛擬機 Dev Box等);
- 降低多種計算平臺(芯片架構(gòu)、操作系統(tǒng)等)之間的開發(fā)壁壘,為開發(fā)者提供全“融合 AI 應(yīng)用”開發(fā)能力,如 ARM 架構(gòu)開發(fā)測試原型機 Project Volterra、Azure 云計算機器學(xué)習(xí)服務(wù)等;
- 用 AI 驅(qū)動的自動化技術(shù),進一步提高辦公效率,如低代碼 web app 生成工具 Power Pages、客服-消費者對話摘要生成工具 Text Summarization 等。
從這些角度可以看出,聯(lián)合創(chuàng)始人兼前CEO鮑爾默高喊“開發(fā)者!開發(fā)者!開發(fā)者!”的雄心, 微軟 仍在堅守。只有開發(fā)者繼續(xù)支持和參與構(gòu)建微軟主導(dǎo)的企業(yè)級服務(wù)和云計算生態(tài),這家公司才能夠繼續(xù)站穩(wěn)腳跟,避免成為下一家 惠普 /雅虎。
來跟硅星人看看微軟今天到底發(fā)布了什么重要的開發(fā)者工具。
讓大模型實現(xiàn)商業(yè)化,變成開發(fā)者的利器
之前 OpenAI 推出 GPT-3 的時候,很多第三方開發(fā)者都獲得了測試權(quán)限,也做出了很多非常有創(chuàng)意的 demo。
不過,沒有人比微軟拿到的權(quán)限更“高級"。在 GPT-3,以及 OpenAI 在大規(guī)模/超大規(guī)模的生成語言和多模態(tài)模型所作的諸多努力上,微軟看到了巨大的商業(yè)化前景。在2019年,OpenAI 和微軟就已經(jīng)達成了戰(zhàn)略合作關(guān)系。
當(dāng)然,恐怕也只有深諳辦公和企業(yè)級市場的微軟,能夠?qū)⑦@些技術(shù)真正高效變成驅(qū)動商業(yè)增長的引擎。
在今天的 Build 大會上,我們看到了微軟和 OpenAI 的合作終于開花結(jié)果:微軟 Azure 云計算平臺正式上線 OpenAI Services(預(yù)覽版),開發(fā)者可以申請試用這一服務(wù),在大量不同的使用場景當(dāng)中,應(yīng)用 OpenAI 開發(fā)的代碼生成和語言生成大模型。
一句話概括,就是讓所有應(yīng)用都能得到AI大模型的加持。
Azure OpenAI Services
以在線二手車銷售平臺 CarMax 作為案例:
在選購二手車的時候,消費者總是面臨“信息過載”,看著成百上千條車輛技術(shù)細節(jié)和留言評價,對于非專業(yè)人士來說非常頭疼。而 CarMax 這家公司正在采用 Azure OpenAI Services ,同時利用 GPT-3 強大的“閱讀理解”能力,和 Azure 云計算平臺的企業(yè)級服務(wù)能力,來生成關(guān)于車輛的精煉信息。
現(xiàn)在,CarMax 用戶可以通過模型總結(jié)出的“一段話”,了解最接近真實的車輛情況,比如能裝下多少人、空間大小和舒適度、燃油經(jīng)濟性等。OpenAI Services 有效降低了 CarMax 用戶在購車流程中的心理壓力,降低交易摩擦,提高成交幾率。
Carmax 采用 Azure OpenAI Services 示意圖 動圖來源:微軟
還有一個值得提及的東西:Express Design,一個低/無代碼開發(fā)功能。通過這項技術(shù),只用幾秒鐘的時間,就可以直接將設(shè)計草稿轉(zhuǎn)化成可工作的應(yīng)用界面甚至完整應(yīng)用。
Express Design 是微軟低代碼開發(fā)工具 Power Apps 的功能之一。它支持的包括 Figma 文件、PDF、ppt 等文檔格式文件,甚至手繪草稿等在內(nèi)的多種類型。它的背后同樣是微軟自家以及包括 OpenAI 等在內(nèi)合作伙伴開發(fā)的語言生成及多模態(tài)模型。
Power Apps 的開發(fā)者用戶今天就可以開始使用 Express Design 功能。
Express Design 能將設(shè)計草稿直接轉(zhuǎn)化成可用的應(yīng)用原型界面,只需要幾秒鐘時間。動圖來源:微軟
誠如前面提到,過去我們的確看到了很多有意思、有潛力的 demo ,但大模型的實際場景應(yīng)用一直是研發(fā)機構(gòu)的難題。
將超大模型和 Azure 云計算平臺結(jié)合,實現(xiàn)代碼和內(nèi)容的大規(guī)模自動化創(chuàng)造——這也是微軟在今年提出的“模型即平臺”(Model as Platforms) 概念的含義。
可以說,兩年前的各種 OpenAI Demo 讓我們看到了超大參數(shù)量語言生成模型的潛力。而在今天微軟所做的,不僅是把大模型交到開發(fā)者的手上,更重要的是教會給它們?nèi)绾芜M一步解鎖大模型的潛力。大模型的商業(yè)化并不是簡單的開個 API 就完了,畢竟它還是一個嶄新的事物,授之以魚,更要授之以漁。
通過 Azure OpenAI Services、Express Design 等技術(shù)服務(wù)和功能,微軟已經(jīng)成了第一個吃下了大模型螃蟹的人。
視頻會議“分享畫面”,變得更高科技了!
疫情以來,大家應(yīng)該都已經(jīng)習(xí)慣了居家/遠程辦公和視頻會議。在開會講解幻燈片的時候,相信很多人也經(jīng)常用到分享畫面 (share screen) 的功能。
然而在微軟的辦公協(xié)同軟件 Teams 團隊看來,現(xiàn)如今很多行業(yè)公司都在遠程上班,他們需要在多種多樣的軟件上完成更加復(fù)雜的協(xié)作任務(wù),這樣的需求無法通過“被動式”的分享畫面功能滿足。
為此,Teams 在今年推出了 Live Share 功能。
Live Share 并不是對分享畫面的取代,但可以被視為一個“高級版”的分享畫面功能。具體來說,Live Share 就是在視頻會議里插入一個第三方應(yīng)用界面——有點像遠程桌面一樣,不僅可以觀看,所有參會者都可以進行交互。
以下圖中的三維建模軟件 Hexagon 為例:在 Teams 視頻會議中可以發(fā)起一個 Live Share 屏幕,其它參會者都可以從各自角度對 3D 模型編輯和觀察。這種更加直觀的協(xié)作體驗,能夠讓參會者更加直觀地參與到頭腦風(fēng)暴當(dāng)中。
Teams 新推出的 Live Share 實時協(xié)作功能,讓復(fù)雜、可交互的第三方程序可以被嵌入到會議當(dāng)中,極大擴展了視頻會議中分享屏幕的可操作性 動圖來源:微軟
舉個最簡單的場景:
一個應(yīng)用開發(fā)團隊正在演示圓形產(chǎn)品,你想要看到應(yīng)用菜單點擊和圖標(biāo)拖拽的效果,在過去你得舉手發(fā)言告訴主講人代替你去操作;
有了 Live Share,現(xiàn)在你可以在自己的屏幕上進行操作,每個參會者都可以同時進行不同的操作,不影響其他人看到的畫面。這樣不僅大家都對演示內(nèi)容有了更深的理解,還顯著縮短了會議的時間。
(用開發(fā)者的語言來說:Live Share 就好比將演示的內(nèi)容,變成虛擬化的實例,每個參會者都能得到屬于自己的實例。)
Live Share 功能基于微軟開發(fā)的前端框架 Fuild Framework,第三方應(yīng)用開發(fā)者只需要在產(chǎn)品中整合微軟新推出的 Live ShareSDK 即可讓應(yīng)用支持這一功能。
可以通過 Live Share 實現(xiàn)功能,包括基本的界面交互、音視頻內(nèi)容同步和多用戶編輯等,以及用于計劃撲克 (agile poker) 等。該功能的合作伙伴包括視頻協(xié)作服務(wù) Frame.io、設(shè)計公司 Hexagon、咨詢公司埃森哲、計劃撲克服務(wù) Parabol 等公司。
可以預(yù)期的是,有了 Live Share 功能,更多開發(fā)者以及密集協(xié)作型團隊,在挑選辦公協(xié)作和視頻會議方案的時候,會更加青睞 Teams 了。
面向新平臺/跨平臺開發(fā)者,提供開放硬件生態(tài)系統(tǒng)
十幾年前討論起開源,恐怕沒什么人會拿微軟作為正面案例。然而自從2015年之后,從開源 .NET 到 Visual Studio 支持多操作系統(tǒng)/語言開發(fā),再到對 GitHub 的戰(zhàn)略收購和技術(shù)支持,微軟已經(jīng)成為了開放技術(shù)生態(tài)領(lǐng)域,最活躍和最重要的貢獻者之一。
作為 Wintel 聯(lián)盟的既得利益者,微軟更是毫不避諱 x86 計算平臺的式微。過去幾年里,微軟在支持多平臺開發(fā)上已經(jīng)證明了自己。而在本屆 Build 大會上,這家公司在支持開放硬件生態(tài)上又邁出了關(guān)鍵一步。
今天,微軟推出了 Project Volterra,一款 ARM 架構(gòu),面向開發(fā)者的原型機 (developer kit):
“我們相信 Windows 開放硬件生態(tài)能夠給予開發(fā)者更多彈性和選擇,幫助他們開發(fā)出能夠支持多種場景的產(chǎn)品,”微軟表示,Project Volterra 就是這樣一個立足于幫助 ARM 架構(gòu)開發(fā)者的產(chǎn)品。
Project Volterra 采用了驍龍 NPU 計算平臺,內(nèi)置高通近年來力推的神經(jīng)計算單元 (NPU),能夠以較低的功耗實現(xiàn)機器學(xué)習(xí)模型方面的推理以及一些訓(xùn)練工作。這臺開發(fā)者原型機運行的是 Windows on ARM,適合將 Windows 或適用于 Linux 的 Windows 子系統(tǒng)作為主要工作環(huán)境的開發(fā)者。
Project Volterra 整合了多個I/O接口,并且微軟宣稱這臺開發(fā)機采用了可堆疊式設(shè)計,似乎意味著可以堆疊多臺機器,實現(xiàn)某種類似于并行計算的工作負載模式:
最近十年里,微軟自家的 Surface 設(shè)備在 Windows on ARM 方面的嘗試沒有獲得過值得夸耀的成績,甚至一些嘗試非常失敗,如前幾年的 Surface RT,以及近兩年的 Neo/Duo 雙屏設(shè)備。
在 x86 計算平臺式微的年代,ARM 架構(gòu)在消費級以及物聯(lián)網(wǎng)市場仍然毫無疑問是最重要的計算平臺。微軟也沒有因為自己的失利就放棄 ARM 市場。和前幾年大搞特搞開源一樣,這家公司今天正在瘋狂擁抱 ARM 架構(gòu):
除了 Project Volterra 之外,微軟還宣布將在整個 Windows 平臺端到端實現(xiàn)對 ARM 架構(gòu)支持,提供一系列 ARM 原生工具鏈,包括并不限于 Visual Studio/VSCode、Visual C++、NET 框架等。
在對 ARM/驍龍 NPU 計算平臺的大力支持基礎(chǔ)之上,微軟目前正在籌謀一個宏偉的計劃:Hybrid Loop。
Hybrid Loop 是一個跨平臺 AI 開發(fā)模式,它的最終目標(biāo)是:借助 Azure ML,以及 ONNX Runtime(多種神經(jīng)網(wǎng)絡(luò)框架兼容)的力量,讓任何神經(jīng)網(wǎng)絡(luò)模型可以使用于任何應(yīng)用,并且部署到CPU、GPU、NPU、FPGA 等多種主流計算硬件平臺上。
Project Volterra 是這個偉大計劃的一次嘗試。
以上就是今年 Build 大會我們認為特別值得展開講述的新產(chǎn)品和技術(shù)。正如文章開頭提到,今年主題演講43分鐘發(fā)布了10個大類別50多項新玩意,如果有興趣了解全部項目,可以訪問微軟官網(wǎng)。
不過最后還想補充一點:今年 Build 開發(fā)者大會的特色之一就是“不賣期貨”。本次50多項新發(fā)布當(dāng)中的絕大多數(shù),都在會后對開發(fā)者和公眾不同程度開放。
你可以在微軟官網(wǎng)收看 Build 大會主題演講和分場的視頻回放,以及了解本文沒有提到的更多技術(shù)和產(chǎn)品發(fā)布。