自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

現(xiàn)代化機(jī)器學(xué)習(xí)工具,助數(shù)據(jù)科學(xué)家開展更多工程或業(yè)務(wù)功能

人工智能 機(jī)器學(xué)習(xí)
數(shù)據(jù)科學(xué)的發(fā)展日新月異,機(jī)器學(xué)習(xí)的角色正從數(shù)據(jù)科學(xué)的混合角色過渡到更多的工程或面向分析的角色,主要是以下的因素促成了這種變化。

數(shù)據(jù)科學(xué)的發(fā)展日新月異,機(jī)器學(xué)習(xí)的角色正從數(shù)據(jù)科學(xué)的混合角色過渡到更多的工程或面向分析的角色,主要是以下的因素促成了這種變化:

  • 機(jī)器學(xué)習(xí)模型更多地被應(yīng)用到生產(chǎn)系統(tǒng)中,需要數(shù)據(jù)科學(xué)家具有比以前更深入的技術(shù)技能。
  • 商業(yè)產(chǎn)品和用戶行為的變化步伐加快,對自動化的需求也增加。
  • 還有出于數(shù)據(jù)合規(guī)和監(jiān)管的要求,增加了對數(shù)據(jù)的可追溯性和可解釋性的預(yù)測和決策的需求。

[[332279]]

這些變化的因素也導(dǎo)致了數(shù)據(jù)科學(xué)家使用的工具發(fā)生了變化。使得他們更多的利用云,自動化,可解釋性和可重復(fù)過程的方向去發(fā)展。

基于云的機(jī)器學(xué)習(xí)。云基礎(chǔ)架構(gòu)和Kubernetes改變了數(shù)據(jù)科學(xué)家進(jìn)行機(jī)器學(xué)習(xí)的方式。從能夠?qū)㈩A(yù)構(gòu)建的解決方案用作Saas應(yīng)用程序,到能夠在Kubernetes上運(yùn)行完整的機(jī)器學(xué)習(xí)堆棧。

AutoML和編排。AutoML簡化了訓(xùn)練模型,提供了一種自動的方法來進(jìn)行數(shù)據(jù)準(zhǔn)備,特征工程,超參數(shù)優(yōu)化或模型的選擇。

可解釋且可重復(fù)的ML。在過去幾年中,出現(xiàn)了一些庫和工具來幫助理解模型預(yù)測及其背后的權(quán)重并賦予其含義。如whatiftools,Lime,Shap或Manifold之類的工具可以幫助數(shù)據(jù)科學(xué)家來實現(xiàn)這一目標(biāo)。

基于云的機(jī)器學(xué)習(xí)

向云和Kubernetes的遷移是時下的主流方向,這推動了機(jī)器學(xué)習(xí)工程師對更多DevOps或數(shù)據(jù)操作功能的需求。

深度學(xué)習(xí)的快速發(fā)展推動了機(jī)器學(xué)習(xí)的進(jìn)步,但深度學(xué)習(xí)需要更多的計算資源,它的利用率隨工作負(fù)載變化很大,這迫使Tensorflow執(zhí)行程序在Kubernetes上運(yùn)行來支持更彈性和可擴(kuò)展的基礎(chǔ)架構(gòu)。

另一個因素是機(jī)器學(xué)習(xí)在生產(chǎn)環(huán)境中的重要性日益提高。這種轉(zhuǎn)變又增加了在原型堆棧和生產(chǎn)之間緊密結(jié)合的需求,并借助各種云的平臺,比如AWS SageMaker、Google Cloud ML Engine。這些工具提供了如模型部署和API配置之類的功能,從而簡化了流程將模型推向生產(chǎn)的過程。

AutoML和機(jī)器學(xué)習(xí)工作流程

具有生產(chǎn)型機(jī)器學(xué)習(xí)系統(tǒng)的重要性的提高反過來加速了從培訓(xùn)到部署的整個機(jī)器學(xué)習(xí)價值鏈對自動化的需求。自動化允許更快地迭代和改進(jìn)模型。

AutoML提供了圍繞模型訓(xùn)練過程的自動化層,可以處理其一些重復(fù)的任務(wù)。它可以處理如超參數(shù)優(yōu)化,功能和模型選擇之類的任務(wù)。現(xiàn)在,像Tpot或AutoKeras之類的庫,以及大多數(shù)云提供商的機(jī)器學(xué)習(xí)即服務(wù)都將AutoML作為其解決方案的一部分。

對自動化的需求也增加了對工具進(jìn)行編排的不同部分的需求。工作流工具如,Airflow,Kubeflow,MLFlow和MetaFlow是用于幫助實現(xiàn)這一目標(biāo)的一些關(guān)鍵工具。他們負(fù)責(zé)將整個機(jī)器學(xué)習(xí)過程作為一條流水線來處理,幫助協(xié)調(diào)從數(shù)據(jù)采集到模型服務(wù)的端到端流程。

可解釋且可重復(fù)的ML

合規(guī)和監(jiān)管影響了我們構(gòu)建機(jī)器學(xué)習(xí)模型的方式。他們推動了可解釋和可復(fù)制的模型。

在可解釋的方面,已經(jīng)出現(xiàn)了一系列工具,可以幫助數(shù)據(jù)科學(xué)家從其模型中獲得意義。這些工具評估不同的方案,分析變量如何互操作,并提供儀表板以幫助解釋模型預(yù)測。whatiftools,Lime,Shap或Manifold是應(yīng)對這一挑戰(zhàn)的工具。

除了提供可靠的方法來調(diào)試模型的優(yōu)點外,可復(fù)制性是受法規(guī)影響的另一個方面??傆锌赡苁褂霉ぷ髁鞴ぞ邉?chuàng)建可重復(fù)的機(jī)器學(xué)習(xí)管道,但仍出現(xiàn)了一些特定的工具來簡化這個過程。

DVC,Dolt,Weight and Biases(WANDB)和Dags Hub等是一些專門的工具,使構(gòu)建模型,可重復(fù)的方式更簡單。DVC負(fù)責(zé)模型和數(shù)據(jù)集的版本控制,而Dolt嚴(yán)格限于數(shù)據(jù)集本身。WANDB和Dags Hub則專注于跟蹤模型構(gòu)建/訓(xùn)練的權(quán)重和結(jié)果。

總結(jié)

機(jī)器學(xué)習(xí)工具,已經(jīng)不僅僅局限于利用一些預(yù)測庫和Jupyter筆記本。現(xiàn)在,進(jìn)行數(shù)據(jù)科學(xué)需要掌握更廣泛的工具集,其中包括云,工作流工具,解釋和版本控制工具。這些增加的現(xiàn)代化工具應(yīng)有助于數(shù)據(jù)科學(xué)開展更多的工程或業(yè)務(wù)功能。

 

責(zé)任編輯:趙寧寧 來源: 今日頭條
相關(guān)推薦

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2020-07-19 15:17:41

機(jī)器學(xué)習(xí)技術(shù)工程師

2020-03-13 14:13:48

機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)編程

2018-03-27 11:02:55

2018-10-18 09:00:00

機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法數(shù)據(jù)科學(xué)家

2016-08-02 17:00:12

Hadoop大數(shù)據(jù)系統(tǒng)

2019-07-03 16:10:27

數(shù)據(jù)科學(xué)家數(shù)據(jù)庫數(shù)據(jù)工程師

2020-03-20 14:40:48

數(shù)據(jù)科學(xué)Python學(xué)習(xí)

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2019-02-25 22:57:22

數(shù)據(jù)工程師數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)

2012-12-06 15:36:55

CIO

2020-12-18 07:42:30

機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2018-01-25 14:19:32

深度學(xué)習(xí)數(shù)據(jù)科學(xué)遷移學(xué)習(xí)

2024-04-25 16:01:17

機(jī)器學(xué)習(xí)人工智能

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2012-06-12 09:33:59

2020-09-19 17:40:29

編寫代碼工具技術(shù)

2019-04-26 14:27:07

大數(shù)據(jù)數(shù)據(jù)科學(xué)數(shù)據(jù)工程師
點贊
收藏

51CTO技術(shù)棧公眾號