數(shù)據(jù)驅(qū)動算法在機器學習中的應(yīng)用
機器學習的概念分析
機器學習作為一個概念,與提高計算機使用算法和神經(jīng)網(wǎng)絡(luò)模型學習的能力有關(guān),并能更快更有效地執(zhí)行各種任務(wù)。機器學習或ML通過使用數(shù)據(jù)或數(shù)據(jù)集來幫助建立模型來做出決策。它可用于精簡組織的決策和執(zhí)行績效。這個詞是1959年由美國人阿瑟·塞繆爾(ArthurSamuel)首創(chuàng)的,他精通人工智能和電腦游戲。
從概念上講,機器學習模擬了人類的腦細胞交互模式。在大腦活動中,當神經(jīng)元相互交流時,這些神經(jīng)元反過來使人類能夠輕松地執(zhí)行各種功能和任務(wù),而不需要任何其他外部形式的支持。就像人類大腦中的神經(jīng)元根據(jù)情況來解剖每個任務(wù)一樣,在ML中,數(shù)據(jù)按照各種算法來預(yù)測、分類和表示,解決一個復(fù)雜問題并提出解決方案。
機器學習中的神經(jīng)網(wǎng)絡(luò)模型也是基于DonaldHebb博士在TheOrganizationofBehavior中的理論。在制定機器學習概念方面的一些顯著貢獻是基于1950年代IBM的ArthurSamuel的進化工作的逐步實施,他開發(fā)了一個計算機程序。該計算機程序涉及alpha-beta剪枝,用于測量跳棋游戲中每一方獲勝的機會。緊隨其后的是由FrankRosenblatt于1957年開發(fā)的定制機器感知器,專為圖像識別而構(gòu)建,導(dǎo)致了MercelloPelillo于1967年開發(fā)的用于基本模式識別的最近鄰算法。
機器學習算法和模型
機器學習是基于算法和模型的校準功能。簡單地說,算法可以稱為利用結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生輸出的簡單過程。同時,機器學習模型表示程序和程序(算法)的結(jié)合,即使用程序來達到預(yù)期的結(jié)果,完成預(yù)期的任務(wù)。
算法是一個公式,通過它可以做出預(yù)測;機器學習模型是實現(xiàn)算法后產(chǎn)生的輸出的更廣泛的方面。因此,在技術(shù)層面上,可以引用機器學習算法導(dǎo)致ML模型,而不是反之。為了理解ML算法的功能,讓我們先看看機器學習中的模型。
機器學習模型分為三大類:
- 監(jiān)督學習:在監(jiān)督學習中,在不確定的情況下,通過計算證據(jù),從已知的數(shù)據(jù)集(輸入)和已知的數(shù)據(jù)響應(yīng)(輸出)做出預(yù)測,以開發(fā)新的數(shù)據(jù)或數(shù)據(jù)集作為響應(yīng)。監(jiān)督學習進一步使用分類和回歸等技術(shù)來提出其他機器學習模型。
- 無監(jiān)督學習:無監(jiān)督學習包括從輸入數(shù)據(jù)中得出推論,而不從具有內(nèi)在數(shù)據(jù)集或結(jié)構(gòu)的隱藏模式中標記出響應(yīng)。
- 強化學習:在機器學習的強化學習模型中,基于試錯法,在復(fù)雜環(huán)境下做出一系列決策。根據(jù)所做決定的結(jié)果,獎勵和懲罰有助于最終引出回應(yīng)。
現(xiàn)在為了詳細說明機器算法做了什么,讓我們以一個基于聚類的機器學習算法K-means為例??紤]了幾個聚類,以k為變量。識別每個簇的中心或質(zhì)心,并在其基礎(chǔ)上定義一個數(shù)據(jù)點。在幾次迭代中,數(shù)據(jù)點和集群被重新識別,一旦定義了所有中心,數(shù)據(jù)點將與每個集群對齊,并與集群中心相接近。該算法在訓(xùn)練數(shù)據(jù)上表現(xiàn)出色,有助于分類各種人工智能程序的音頻檢測和圖像分割等復(fù)雜任務(wù)。

使機器學習成為一個進步的領(lǐng)域,根據(jù)業(yè)務(wù)需求探索和發(fā)展的另一個方面是它對數(shù)據(jù)處理的需求。各種形式的訓(xùn)練數(shù)據(jù)是機器學習的基礎(chǔ)。從檢測用于安全目的的對象到預(yù)測業(yè)務(wù)趨勢,高效和高性能的算法本質(zhì)上是以數(shù)據(jù)為中心的;數(shù)據(jù)集越精確,算法產(chǎn)生的輸出就越準確。
機器學習中數(shù)據(jù)驅(qū)動的算法
在物理世界中,人類互動的大部分方面都是基于與各種無形數(shù)據(jù)的動態(tài)關(guān)系,人類的大腦每天都會執(zhí)行許多簡單的數(shù)據(jù)驅(qū)動計算。類似地,計算是基于機器學習中的數(shù)據(jù)或標記訓(xùn)練數(shù)據(jù),這有助于基于人工智能(AI)的程序工作來增加價值。與編寫程序代碼自動化處理過程或?qū)Υ罅繑?shù)據(jù)進行深入調(diào)查相比,算法的使用要可靠得多,速度也快得多。
機器學習算法是一種數(shù)學方法,在提供的數(shù)據(jù)的幫助下產(chǎn)生一組結(jié)果。因此,在機器學習的過程中,數(shù)據(jù)的重要性是至關(guān)重要的。由ML驅(qū)動的人工智能程序的效率取決于輸入算法代碼的訓(xùn)練數(shù)據(jù)的質(zhì)量。不準確的數(shù)據(jù)集也會降低性能。
對于一個ML算法產(chǎn)生高價值的輸出,可用性的高質(zhì)量的訓(xùn)練數(shù)據(jù)集是必須的。訓(xùn)練數(shù)據(jù)集是根據(jù)人工智能應(yīng)用程序的目標開發(fā)的注釋或說明數(shù)據(jù)。

主要是兩種類型的數(shù)據(jù)推動了機器學習算法的工作。
1.手工數(shù)據(jù)標簽
2.自動數(shù)據(jù)標簽
3.人工智能輔助的數(shù)據(jù)標注
在自動、手動和人工輔助數(shù)據(jù)標注方面有一些關(guān)鍵的區(qū)別。在手動數(shù)據(jù)標簽,人群強制標簽的原始數(shù)據(jù)按照共享的指導(dǎo)方針或技術(shù)定義附加標簽。而在自動數(shù)據(jù)標注中,訓(xùn)練數(shù)據(jù)由程序標注,并在加載執(zhí)行前檢查其準確性。而且,人工智能輔助的數(shù)據(jù)標記需要自動程序和人工努力來產(chǎn)生高質(zhì)量的訓(xùn)練數(shù)據(jù)。
基于數(shù)據(jù)的算法在現(xiàn)實世界中的應(yīng)用
算法和技術(shù)適用于各行業(yè)和經(jīng)濟部門。在數(shù)字技術(shù)和數(shù)據(jù)驅(qū)動的生態(tài)系統(tǒng)時代,復(fù)雜的需求面臨著高效數(shù)據(jù)創(chuàng)建和開發(fā)的挑戰(zhàn),在智慧城市、網(wǎng)絡(luò)安全、智能醫(yī)療、社交媒體和商業(yè)等領(lǐng)域,ML也在不斷實現(xiàn)數(shù)據(jù)結(jié)構(gòu)化和可用數(shù)據(jù)處理,以更好地做出決策。提高績效,增強業(yè)務(wù)可持續(xù)性。
在衛(wèi)生部門,人工智能程序正在執(zhí)行由高度可用的訓(xùn)練數(shù)據(jù)驅(qū)動的任務(wù)。這些數(shù)據(jù)使諸如二十億等健康應(yīng)用程序通過檢測對象、動作、屬性、視聽輸入、語音輸入、神經(jīng)網(wǎng)絡(luò)、語音輸出、身體控制等來幫助客戶跟蹤他們的健康訓(xùn)練計劃的進度。,正在幫助支持AI的應(yīng)用程序解碼復(fù)雜的任務(wù),例如:
- 了解現(xiàn)場
- 理解口語
- 理解對象和動作
- 通過聊天機器人生成口語
- 控制助理的身體
- 理解人類的姿勢
- 將視覺概念與文字等聯(lián)系起來
- 行為
在金融等領(lǐng)域,機器學習算法正在幫助企業(yè)發(fā)現(xiàn)未來的投資機會;同時,對于政府部門,ML算法通過簡單地處理來自多個來源的復(fù)雜數(shù)據(jù),幫助處理欺詐、身份盜竊和提高公共工程的效率。此外,隨著數(shù)據(jù)量越來越大,機器學習(ML)正通過使用復(fù)雜的數(shù)據(jù)集來增加價值,幫助垂直企業(yè)應(yīng)對未來的諸多挑戰(zhàn)。
尾注
理想情況下,機器學習被用于處理涉及大量數(shù)據(jù)的復(fù)雜計算任務(wù),而沒有靜態(tài)公式來得出結(jié)果。多年來,隨著機器學習領(lǐng)域的不斷研究和發(fā)展,醫(yī)療、能源生產(chǎn)、汽車、航空航天、制造業(yè)和金融等商業(yè)部門都從機器學習模式中獲益。機器學習模型和算法正在幫助解決特定行業(yè)的問題,并通過對象檢測、信用評分、交易預(yù)測、DNA測序和預(yù)測性維護提供未來的全行業(yè)解決方案。
在未來幾年,隨著數(shù)據(jù)的持續(xù)增長和對可變數(shù)據(jù)的需求進一步攀升,我們可以希望看到許多其他任務(wù)使用由機器學習算法支持的人工智能程序來執(zhí)行,這些程序的模型有助于閱讀和處理數(shù)據(jù),并為全球企業(yè)部門提供均衡的可持續(xù)性。