談AT&T關于數(shù)據(jù)科學與自動化的集體探索
相信大家都有體會,如果一個組織想要通過數(shù)據(jù)和技術推動自身轉(zhuǎn)型,那么單靠技術專家并不足以達成目標。其他“業(yè)余選手”或者說非專業(yè)人員,也必須參與到應用程序開發(fā)、數(shù)據(jù)解析和自動化工作流程當中。不少企業(yè)都在這種探索中做出了自己的嘗試,而AT&T顯然更擅長發(fā)掘全員能力,借集體之力應對數(shù)據(jù)科學與自動化議題。
這樣的思路來自一個殘酷的事實——任何組織都不具備充足的專業(yè)數(shù)據(jù)科學家和自動化專家,也就無法完成成功轉(zhuǎn)型所需要的一切分析與AI工作。AT&T公司首席數(shù)據(jù)官Andy Markus表示,這家電信巨頭正努力將AI與自動化嵌入其業(yè)務核心。在2022年初剝離了WarnerMedia之后,AT&T不再擁有娛樂業(yè)務屬性、成為純電信企業(yè),并掌握著豐富的數(shù)據(jù)和有能力提取信息洞察的人才。也許集體探索并不適合每一家公司,但無疑非常適合AT&T。除了幾百名專業(yè)數(shù)據(jù)科學家和自動化專家之外,AT&T麾下還擁有更多普通開發(fā)人員。
數(shù)據(jù)科學的大眾化普及
AT&T向來有著以數(shù)據(jù)為中心的企業(yè)文化,公司一直努力促進員工使用機器學習模型開展數(shù)據(jù)分析。AT&T的數(shù)據(jù)科學、AI與自動化主管Mark Austin在采訪中表示,公司目標是支持機器學習管線中的各個方面,包括尋找合適數(shù)據(jù)、獲取數(shù)據(jù)、對數(shù)據(jù)開展工程設計以建立所需功能、創(chuàng)建模型、將模型部署至生產(chǎn)環(huán)境、隨時間推移監(jiān)控模型性能,并有效實施模型管理。與大多數(shù)企業(yè)一樣,前三項內(nèi)容基
本就要占去開發(fā)人員80%的工作時間,而AT&T正努力降低這一百分比。
為此,AT&T與AI云平臺服務商H2O.ai合作,為常用源數(shù)據(jù)與派生數(shù)據(jù)建立起特征“商店”,借此減少極為耗時的數(shù)據(jù)整理需求。數(shù)據(jù)科學專家和業(yè)余選手們都對它的效果贊不絕口。特征商店上線不到一年,已經(jīng)向?qū)I(yè)和業(yè)余數(shù)據(jù)用戶們開放了超26000種特征。此外,數(shù)據(jù)科學模型往往還匹配Pinnacle項目,即一種類似于Kaggle的內(nèi)部競賽眾包方案。Austin解釋稱,這種競賽機制往往能讓模型性能平均提升近30%。該流程不僅涉及一系列眾包autoML解決方案,同時也結(jié)合了AT&T數(shù)百名數(shù)據(jù)科學家與工程師的創(chuàng)新算法與集成。
自動化的大眾化普及
AT&T早在2015年起,就開始通過機器人流程自動化技術推動業(yè)務自動化。從那時起,公司已經(jīng)將3000多個機器人投入生產(chǎn)環(huán)境。經(jīng)過首年實驗,AT&T建立起首個自動化卓越中心(ACoE),目前在該中心內(nèi)部署了20名全職員工和多位承包商。但如果沒有普通員工的積極參與,該公司的自動化探索絕不可能迅速擴大規(guī)模。Austin悉心跟進每個項目,并驚喜地發(fā)現(xiàn)高達92%的機器人流程自動化實施出現(xiàn)在卓越中心以外。
隨著時間推移,流程自動化為AT&T創(chuàng)造了巨大價值。Austin表示,機器人實施方案間的靈活組合每年省下約1700萬分鐘的手動操作,產(chǎn)生了數(shù)億美元的年均收益,實現(xiàn)了高達20倍的投入回報比。
分析與AI也是Austin的分管項目,他也熱切期待將機器學習與AI功能整合到機器人流程自動化中的機會。他的團隊已經(jīng)建立起多個機器人流程自動化實現(xiàn),涵蓋自然語言處理、光學字符識別(OCR)和基于機器學習的決策制定等。喜歡把“智能自動化”掛在嘴邊的企業(yè)不少,但AT&T是少數(shù)能真正實現(xiàn)這個目標的公司之一。
培養(yǎng)員工技術能力
AT&T已經(jīng)意識到,數(shù)據(jù)科學與自動化開發(fā)的集體探索離不開必要的技術能力與資源支持。在數(shù)據(jù)科學方面,該公司開發(fā)出廣泛的技術基礎設施,幫助專業(yè)和業(yè)余參與者們加入自動化機器學習的研究隊伍。其中包含以下功能:
? 同時使用多達七種不同autoML工具,并在各工具間開展競賽以觀察哪個選項能創(chuàng)建出質(zhì)量最高的模型;
? 部分autoML工具能夠直接參與入選模型的生產(chǎn)部署;
? 可通過機器學習對各類可復用數(shù)據(jù)集進行分析;
? 提供一款直觀的語義搜索工具,例如返回所有“與流失相關的特征”;
? 提供機器學習與運營工具“Watchtower for MLOps+”,其不僅能監(jiān)控數(shù)據(jù)和AI(傳統(tǒng)上被稱為MLOps),同時也能跟蹤整個業(yè)務管線中的全部活動集合(應用程序、API調(diào)用等)。
在技術自動化方面,AT&T采用的是微軟Power Automate作為工具基準,大大降低了全民參與的門檻。這款工具可以同Microsoft Office工具、PowerBI甚至是Azure機器學習模型相集成。AT&T還維護有“Bot Marketplace”機器人市場,普通員工可以從中選擇已開發(fā)完成的自動化解決方案,必要時還能從自動化卓越中心處獲取配置指導。每個月,市場上都會新增約75種可復用的自動化組件。
培養(yǎng)人的能力
AT&T也在積極推動社區(qū)建設,關注數(shù)據(jù)科學與自動化集體探索的人力基礎。在數(shù)據(jù)科學方面,公司建立起“AI大眾化論壇”,每周組織一次線上演示,并就特定問題分享解決思路、向與會者公布已經(jīng)開發(fā)的功能。這項活動每周吸引到約200名員工,其中大部分并非專業(yè)數(shù)據(jù)科學家,很多人甚至根本不懂編碼。AT&T還整理出一套涵蓋數(shù)據(jù)科學各個方面的線上培訓材料,共有575門課程可供選擇,同時面向各種供應商工具提供官方認證。
自動化社區(qū)的建設工作,主要是為想要參與的員工們提供40小時的培訓課程。此外,自動化卓越中心每年舉辦一次“自動化峰會”,供公司內(nèi)部團隊展示和分享自己的自動化項目。
目前,部分企業(yè)和專業(yè)AI開發(fā)者仍對普通參與者在模型構建和自動化解決方案中的作用持懷疑態(tài)度。但AT&T用實際行動證明,只要為普通員工提供正確的工具和資源,就一定能建立起可行性、創(chuàng)造經(jīng)濟價值。面對供不應求的數(shù)據(jù)科學與自動化勞動力市場,AT&T證明精心規(guī)劃的引導策略完全可以培養(yǎng)替代人才來彌補這一缺口。