云端構(gòu)建機(jī)器學(xué)習(xí)平臺(tái)的幾個(gè)優(yōu)秀實(shí)踐
譯文?譯者 | 布加迪
審校 | 孫淑娟
大多數(shù)人都熟悉iOS、Windows和AWS等主要的技術(shù)平臺(tái)。平臺(tái)本質(zhì)上是一組技術(shù),以充當(dāng)構(gòu)建、貢獻(xiàn)、試驗(yàn)和擴(kuò)展其他應(yīng)用程序的基礎(chǔ)。它們帶來了當(dāng)今許多先進(jìn)的技術(shù)能力和尖端的客戶體驗(yàn)。
為了跟上大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)帶來的技術(shù)能力具有的規(guī)模和復(fù)雜性,許多公司在自行開發(fā)復(fù)雜的內(nèi)部平臺(tái)。事實(shí)上Gartner預(yù)測,到2025年,云原生平臺(tái)將成為超過95%的新數(shù)字化計(jì)劃的基礎(chǔ),高于2021年的不到40%。
根據(jù)我的經(jīng)驗(yàn),企業(yè)技術(shù)平臺(tái)具有變革性:它們使跨職能部門的團(tuán)隊(duì)能夠快速測試、啟動(dòng)和學(xué)習(xí),減少重復(fù)、規(guī)范能力,并提供一致集成的體驗(yàn)。簡而言之,它們有助于將技術(shù)轉(zhuǎn)化為競爭優(yōu)勢。
1.企業(yè)平臺(tái)的演進(jìn)
許多組織利用Kubernetes等可以運(yùn)行人工智能和機(jī)器學(xué)習(xí)繁重任務(wù)的云原生平臺(tái),越來越善于提供一流的客戶體驗(yàn)。第一資本(Capital One)成為美國第一家全力投入到云的金融機(jī)構(gòu),能夠重新設(shè)計(jì)數(shù)據(jù)環(huán)境的架構(gòu),對(duì)于夯實(shí)其基于云的平臺(tái)能力不可或缺。有了這個(gè)堅(jiān)實(shí)的基礎(chǔ),第一資本更能夠利用大數(shù)據(jù)在其企業(yè)平臺(tái)上打造新的機(jī)器學(xué)習(xí)能力,以加速、增強(qiáng)和提供新的、更有意義的客戶體驗(yàn)。
第一資本在這方面的大部分工作已經(jīng)為公司和客戶帶來了顯著成效。比如說,其欺詐決策平臺(tái)是從頭開始構(gòu)建的,以便做出復(fù)雜的實(shí)時(shí)決策。通過利用大量數(shù)據(jù),并實(shí)現(xiàn)在幾天(而不是幾個(gè)月)內(nèi)更新模型,該平臺(tái)有助于保護(hù)數(shù)百萬客戶免受信用卡欺詐,并可供該公司的各個(gè)利益相關(guān)者使用。
根據(jù)我在領(lǐng)導(dǎo)團(tuán)隊(duì)交付企業(yè)技術(shù)平臺(tái)方面的經(jīng)驗(yàn),一路上汲取的重要的經(jīng)驗(yàn)教訓(xùn)和優(yōu)秀實(shí)踐如下:
- 一切都從團(tuán)隊(duì)開始:建立由最優(yōu)秀的人組成的跨部門團(tuán)隊(duì),即使一開始這會(huì)減慢你的工作。更大的團(tuán)隊(duì)并不總是更好!團(tuán)隊(duì)起碼要有產(chǎn)品經(jīng)理、工程師和設(shè)計(jì)師。為這些職能部門配備真正了解平臺(tái)用戶的人。比如說,如果您正構(gòu)建一個(gè)主要由數(shù)據(jù)科學(xué)家使用的平臺(tái),應(yīng)聘請(qǐng)?jiān)?jīng)是數(shù)據(jù)科學(xué)家的產(chǎn)品經(jīng)理,或者為領(lǐng)導(dǎo)團(tuán)隊(duì)添加數(shù)據(jù)科學(xué)家。如果團(tuán)隊(duì)由來自多個(gè)部門的人員組成,應(yīng)確保你們有共同的目標(biāo)。
- 先明確定義最終狀態(tài):在開始構(gòu)建之前,花時(shí)間明確最終狀態(tài)的架構(gòu)和計(jì)劃,以迭代方式實(shí)現(xiàn)目標(biāo)。確保架構(gòu)一開始就是為自助服務(wù)和貢獻(xiàn)設(shè)計(jì)的。更好的是,設(shè)計(jì)平臺(tái)時(shí)假設(shè)您將把平臺(tái)擴(kuò)展到本組織或業(yè)務(wù)部門之外的用戶。還要假設(shè)一段時(shí)間后,隨著技術(shù)的變化,您希望可以更換組件。
- 估計(jì)認(rèn)為需要多長時(shí)間,然后加倍:重要的是花時(shí)間集思廣益,想好一開始就需要打造的所有能力,然后為每部分投入相應(yīng)的精力。一旦技術(shù)團(tuán)隊(duì)將此與速度相結(jié)合,估計(jì)構(gòu)建每個(gè)功能需要多長時(shí)間,就增加50%的緩沖量。根據(jù)我的經(jīng)驗(yàn),這個(gè)估計(jì)最終非常準(zhǔn)確。
- 關(guān)注業(yè)務(wù)成果:構(gòu)建出色的平臺(tái)可能需要很長時(shí)間。確定工作的次序很重要,這樣才能不斷實(shí)現(xiàn)業(yè)務(wù)價(jià)值。這可以激勵(lì)團(tuán)隊(duì),樹立信譽(yù),并形成良性循環(huán)。
- 力求透明,加強(qiáng)溝通:與利益相關(guān)者自由地交流決策、進(jìn)展和路線圖。除了闡明手頭的工作外,還要闡明目前沒有優(yōu)先考慮的事情。編寫好文檔,以便鼓勵(lì)他人貢獻(xiàn)、輕松加入平臺(tái)。
- 從小處著手:就連最好的測試和質(zhì)量保證(QA)環(huán)境也可能遺漏一些部署到生產(chǎn)環(huán)境后才顯露的問題。對(duì)于對(duì)客戶會(huì)有明顯影響的重大變化而言,總是從一個(gè)小群體入手,看到小規(guī)模生產(chǎn)環(huán)境中切實(shí)有效后,再擴(kuò)大應(yīng)用范圍。
- 徹底透明并過度溝通:與利益相關(guān)者自由分享決策、進(jìn)展和路線圖。除了闡明您正在做的事情之外,還要闡明您目前沒有優(yōu)先考慮的事情。投資于有助于貢獻(xiàn)和輕松加入平臺(tái)的文檔。
- 從小處著手:即使是最好的測試和QA 環(huán)境也可能會(huì)遺漏一些直到投入生產(chǎn)時(shí)才發(fā)現(xiàn)的問題。對(duì)于將產(chǎn)生有意義的客戶影響的重大變化,總是從一小部分人開始,然后在你看到小規(guī)模生產(chǎn)中的事情發(fā)生后逐漸增加。如果可能,當(dāng)變更影響外部客戶時(shí),僅將員工用于初始人群。
- 重視妥善管理:平臺(tái)所有者應(yīng)關(guān)注平臺(tái)性能。所有問題都應(yīng)通過控制機(jī)制和自動(dòng)警報(bào)顯露出來。應(yīng)迅速處理異常情況。應(yīng)優(yōu)先考慮問題的根本原因分析和變化,防止問題一再發(fā)生。如果沒有問題,應(yīng)適當(dāng)?shù)貞c祝,好讓團(tuán)隊(duì)知道它受到贊賞。
- 如果看起來好得難以置信……異常監(jiān)控是確保執(zhí)行符合意圖的好方法。目標(biāo)常常是零異常。比如說,延遲不應(yīng)超過200毫秒。如果異常報(bào)告從不顯示任何異常,監(jiān)控很可能有問題。始終強(qiáng)制執(zhí)行異常,以確保它正確觸發(fā)。這一點(diǎn)我可是深有體會(huì)。
- 開心的團(tuán)隊(duì)是富有成效的團(tuán)隊(duì)。慶賀取得的成績,在團(tuán)隊(duì)成員表現(xiàn)出色時(shí)給予表揚(yáng),并創(chuàng)造內(nèi)心充盈的環(huán)境。定期衡量團(tuán)隊(duì)的幸福感,讓團(tuán)隊(duì)有機(jī)會(huì)來討論什么會(huì)讓他們更快樂,并自行嘗試,以解決不滿意的地方。
當(dāng)一個(gè)團(tuán)隊(duì)擁有合適平臺(tái)技術(shù)大力支持的強(qiáng)大文化時(shí),機(jī)會(huì)無限。通過將云原生平臺(tái)與大規(guī)模數(shù)據(jù)相結(jié)合,公司可以更好地推進(jìn),并嘗試更新穎、更具創(chuàng)新的產(chǎn)品和體驗(yàn)。當(dāng)這些體驗(yàn)使最終用戶和客戶能夠在需要時(shí)獲得所需的產(chǎn)品或服務(wù),這無疑具有重大意義。
原文鏈接:https://venturebeat.com/ai/best-practices-for-building-machine-learning-platforms-on-the-cloud/