微軟推人人可用的機(jī)器學(xué)習(xí),打通windows應(yīng)用程序任督二脈,惠及5000萬(wàn)開發(fā)者
北京時(shí)間 5 月 19 日晚間 11 點(diǎn),微軟一年一度的「Build開發(fā)者大會(huì)」正式線上開幕。
開篇微軟CEO Satya Nadella 20分鐘的演講干貨滿滿。開發(fā)者和合作伙伴最想知道的內(nèi)容,他基本都在視頻里都提到了。
演講全程,Nadella 試圖對(duì)開發(fā)者表現(xiàn)出一種慈父般的熱情:「微軟的使命是賦能每一個(gè)人,而且最主要的就是要賦能開發(fā)者,微軟為你們打造的平臺(tái)和工具是你們構(gòu)筑這個(gè)智能時(shí)代的一磚一瓦?!?/p>
這種對(duì)開發(fā)者產(chǎn)生的濃厚興趣,在2018年微軟不惜大手筆收購(gòu)開發(fā)者之家GitHub事件上,表現(xiàn)的淋漓盡致。
Nadella 稱,擁有了GitHub后,微軟就有機(jī)會(huì)為開發(fā)者構(gòu)建最完整的工具鏈,匯集了GitHub、VisualStudio和Azure的精華。
目前GitHub的開發(fā)者數(shù)量超過(guò)了5000萬(wàn)。而兩年前推出的低代碼開發(fā)平臺(tái)Power Platform的開發(fā)者數(shù)量也超過(guò)了350萬(wàn)人。
WhiteNoise:人人可用的差分隱私機(jī)器學(xué)習(xí)工具包
今年的大會(huì),微軟著重強(qiáng)調(diào)了機(jī)器學(xué)習(xí)領(lǐng)域的進(jìn)展。
Build大會(huì)上微軟宣布將開源多個(gè)機(jī)器學(xué)習(xí)工具包,這些工具跟以往的相比,更關(guān)注機(jī)器學(xué)習(xí)的隱私和公平性。
如今,各種底層架構(gòu)的日趨成熟,開發(fā)人員構(gòu)建一個(gè)人工智能模型變的越來(lái)越容易,但是有一個(gè)問(wèn)題,這些系統(tǒng)是否「容易解釋」 ,是否「遵守了非歧視和隱私規(guī)定」?
WhiteNoise
這次機(jī)器學(xué)習(xí)領(lǐng)域的重頭戲要屬WhiteNoise 了,WhiteNoise 是一個(gè)使用差分隱私的工具包,不久就可以通過(guò) Azure 和 GitHub 上的開放源碼來(lái)使用了。它加入了新的人工智能可解釋性和公平性工具,以及新的數(shù)據(jù)、模型和訪問(wèn)控制,還新增了工作流溯源文檔等。
差分隱私旨在提供一種加密方法,當(dāng)從統(tǒng)計(jì)數(shù)據(jù)庫(kù)查詢時(shí),最大化數(shù)據(jù)查詢的準(zhǔn)確性,同時(shí)最大限度減少識(shí)別其記錄的機(jī)會(huì)。
WhiteNoise 工具包是微軟與哈佛大學(xué)定量社會(huì)科學(xué)研究所合作開發(fā)的,它利用差分隱私來(lái)加密數(shù)據(jù),可以保護(hù)數(shù)據(jù)中的個(gè)人信息,如姓名或出生日期等敏感信息。
WhiteNoise的算法會(huì)在原始數(shù)據(jù)中注入少量噪聲,然后將其輸入本地機(jī)器學(xué)習(xí)模型,從而使惡意攻擊者難以從訓(xùn)練好的模型中逆向提取出原始文件。即使攻擊者看到算法的輸出,也不能判斷它是否在計(jì)算中使用的特定個(gè)體的信息,WhiteNoise的算法就起到了隱私保護(hù)的作用。
比如醫(yī)院想建立一個(gè)癌癥治療效果預(yù)測(cè)模型,首先你要保證預(yù)測(cè)的整個(gè)流程符合醫(yī)院和其他監(jiān)管部門的規(guī)定,同時(shí)你還要保證患者和醫(yī)院的隱私信息不被泄漏,之前這個(gè)過(guò)程都要人工去審核,或者壓根沒(méi)有審核的機(jī)制。
現(xiàn)在通過(guò)WhiteNoise的私有算法庫(kù),通過(guò)簡(jiǎn)單的API就能實(shí)現(xiàn)整個(gè)流程的合規(guī)和數(shù)據(jù)隱私化處理。
除了WhiteNoise,微軟還推出了兩個(gè)旨在評(píng)估AI系統(tǒng)公平性和可解釋性的工具包,F(xiàn)airlearn 和InterpretML,將來(lái)這兩個(gè)工具包也會(huì)融入到Azure的機(jī)器學(xué)習(xí)系統(tǒng)中。
Fairlearn
Fairlearn 則為開發(fā)人員和數(shù)據(jù)科學(xué)家提供了評(píng)估機(jī)器學(xué)習(xí)模型公平性和緩解不公平的能力。針對(duì)不同的人群,F(xiàn)airlearn會(huì)在模型性能和公平性之間做一個(gè)取舍,爭(zhēng)取到最佳平衡點(diǎn)。
Fairlearn 在一個(gè)儀表板上定義了 AI 系統(tǒng)是否對(duì)人不公平,模型主要關(guān)注兩種危害: 分配危害和服務(wù)質(zhì)量危害。當(dāng)人工智能系統(tǒng)擴(kuò)展或抑制機(jī)會(huì)、資源或信息(例如招聘、入學(xué)和借貸)時(shí),分配危害就出現(xiàn)了。服務(wù)質(zhì)量危害指的是,沒(méi)有機(jī)會(huì)、資源或信息被延長(zhǎng)或保留,但是系統(tǒng)區(qū)別對(duì)待兩個(gè)人。
Fairlearn采用了一種被稱為群體公平的方法,該方法旨在揭示哪些群體的個(gè)體面臨著遭受傷害的風(fēng)險(xiǎn)。數(shù)據(jù)科學(xué)家指定工具包中的相關(guān)群體(例如性別、膚色和種族),然后通過(guò)一組正則項(xiàng)約束群體公平性,讓不同群體之間具有可比性。
比如安永會(huì)計(jì)師事務(wù)所使用 Fairlearn 來(lái)評(píng)估男女貸款的不公平性。根據(jù)安永的調(diào)查數(shù)據(jù),同樣條件下,男性和女性獲得貸款之間有15.3% 的差異。隨后,安永利用 Fairlearn開發(fā)了多個(gè)補(bǔ)救模型,讓性別差異減少到了0.43%。
InterpretML
最后出場(chǎng)的是InterpretML。這個(gè)工具包致力于幫助開發(fā)人員、數(shù)據(jù)科學(xué)家更全面地理解他們的機(jī)器學(xué)習(xí)模型?,F(xiàn)在已經(jīng)可以在Azure 機(jī)器學(xué)習(xí)中使用了。
想對(duì)比不同模型的效果,直接show!
InterpretML包含了許多機(jī)器學(xué)習(xí)的可解釋性技術(shù),通過(guò)可視化模型的行為和預(yù)測(cè)背后的推理來(lái)幫助解釋模型。也就是說(shuō)你用InterpretML不僅能選出對(duì)模型最重要的參數(shù)或變量,而且可以解釋它們?yōu)槭裁词侵匾摹?nbsp;
有了上面這些工具包,開發(fā)人員就可以真正理解自己的模型ーー不光可以看到模型的可解釋性和公平性,還能理解為什么模型做出這樣那樣的預(yù)測(cè)。
Project Reunion:做Windows應(yīng)用開發(fā)從來(lái)沒(méi)有這么容易
如果要問(wèn)一個(gè)開發(fā)者,一個(gè)平臺(tái)最讓人抓狂的是什么?混亂,絕對(duì)是個(gè)把人逼瘋的高手。
Windows應(yīng)用開發(fā)的長(zhǎng)期以來(lái)的混亂局面,微軟自己都看不下去了,在Build大會(huì)上重磅推出了巨大更新:Project Reunion。
單從這個(gè)名字你就能感受到一股「We the Windows」「Make Windows great again」的味道撲面而來(lái)。
Project Reunion利用.NET包管理器NuGet等工具,統(tǒng)一訪問(wèn)現(xiàn)有的Win32和UWP API,并將其與操作系統(tǒng)解耦,為新的應(yīng)用程序提供一個(gè)共同的平臺(tái),從而讓你現(xiàn)有的應(yīng)用能夠緊跟平臺(tái)步伐,而不在乎用的是C++、.NET、(包括WPF、Windows Forms和UWP)還是React Native。
Project Reunion包括兩個(gè)組件:WinUI 3 Preview 1和WebView2的新預(yù)覽版。
WinUI 3 Preview 1是微軟最新的Windows UI框架,允許應(yīng)用程序擁有一個(gè)可以跨設(shè)備擴(kuò)展的、統(tǒng)一化、現(xiàn)代化的UI。
WebView2可以輕松地將基于Chromium的WebView嵌入到Windows Forms、WPF和UWP/WinUI 3應(yīng)用程序中。WebView2與操作系統(tǒng)脫鉤,成為又一條微軟伸向其他平臺(tái)的觸手。
此外,微軟升級(jí)了Windows子系統(tǒng)(WSL),加入了GPU加速和對(duì)GUI圖形界面的支持,如此一來(lái),不僅提升了在Linux下的并行計(jì)算、機(jī)器學(xué)習(xí)模型及訓(xùn)練,同時(shí)也允許WSL直接運(yùn)行帶有圖形界面的Linux應(yīng)用。
當(dāng)然,少不了Windows Terminal 1.0。
Linuxer們可能始終沒(méi)想到,最終來(lái)打通Windows和Linux之間壁壘的錘子,居然來(lái)自微軟自己。
Azure量子計(jì)算平臺(tái)預(yù)覽版發(fā)布:開源量子開發(fā)工具包,人人可以從零學(xué)起
如果要問(wèn)巨頭們的下一個(gè)爭(zhēng)奪的目標(biāo)是什么?量子計(jì)算絕對(duì)在Top名單上。
未來(lái)幾年,商用量子計(jì)算機(jī)投入市場(chǎng)時(shí),對(duì)于相應(yīng)開發(fā)人員的需求也會(huì)越來(lái)越高,企業(yè)需要提早開始準(zhǔn)備。金融服務(wù)、汽車和制藥行業(yè)等已經(jīng)開始將量子計(jì)算的應(yīng)用提上了日程。
去年年底,亞馬遜就發(fā)布了量子計(jì)算服務(wù)Amazon Bracket預(yù)覽版,并成立AWS量子計(jì)算中心和亞馬遜量子解決方案實(shí)驗(yàn)室;今年三月份,谷歌開源了量子計(jì)算學(xué)習(xí)庫(kù)TensorFlow Quantum。
因此在Build大會(huì)上,微軟特意向開發(fā)者和公司客戶展示了他們的「Azure量子計(jì)算平臺(tái)預(yù)覽版」。
Azure為開發(fā)人員提供了一個(gè)在線平臺(tái),來(lái)為量子計(jì)算機(jī)開發(fā)算法和應(yīng)用程序,而不需要因?yàn)橛布退惴ǖ母露貙懘a。
Azure量子計(jì)算部門也在和產(chǎn)業(yè)界合作,其中包括日本豐田通商公司想利用云量子計(jì)算服務(wù)來(lái)嘗試解決路線規(guī)劃和交通擁堵等問(wèn)題。
Azure Quatum平臺(tái)于去年11月份推出, 發(fā)布之初就震驚四座,這是繼 IBM 和谷歌各自宣布實(shí)現(xiàn)量子優(yōu)勢(shì)/量子霸權(quán)后該領(lǐng)域的又一次重磅突破。
微軟之所以現(xiàn)在就著急拋出預(yù)覽版,意在抓緊時(shí)間挑選合作伙伴和開發(fā)者。為了爭(zhēng)奪客戶和開發(fā)者,微軟開出了非常誘人的條件:一旦被選中,合作伙伴和開發(fā)者可以從微軟、1QBit、霍尼韋爾、 IonQ 和 QCI 獲得量子硬件和軟件。
開發(fā)者是一個(gè)平臺(tái)能否堅(jiān)固的基石。為更好的吸引和培養(yǎng)量子計(jì)算領(lǐng)域的開發(fā)者,目前微軟已開源了量子開發(fā)工具包(QDK),讓任何人都可以從零開始學(xué)習(xí)量子計(jì)算。
此外,微軟還在Microsoft Learn platform上推出了兩門課程,教你用 Q# 語(yǔ)言寫程序,以及通過(guò)量子計(jì)算來(lái)解決優(yōu)化問(wèn)題。
專業(yè)研究公司 Gartner inc. 的分析師非常看好Azure Quantum,認(rèn)為它的競(jìng)爭(zhēng)優(yōu)勢(shì)在于讓開發(fā)人員為商用級(jí)量子計(jì)算機(jī)的到來(lái)提前做好準(zhǔn)備,從而讓微軟在量子計(jì)算領(lǐng)域不掉隊(duì)。
目前,微軟在世界各地有8個(gè)量子計(jì)算實(shí)驗(yàn)室,其中一個(gè)位于華盛頓州雷德蒙德的總部,網(wǎng)站上有29個(gè)空缺職位。大家加油!