預(yù)測(cè)分析:重新考慮組織中的時(shí)間和數(shù)據(jù)
時(shí)間序列是一種標(biāo)準(zhǔn)的分析方法,但是較為先進(jìn)的機(jī)器學(xué)習(xí)工具引入了統(tǒng)計(jì)技術(shù),來(lái)建立更精確的預(yù)測(cè)模型。時(shí)間是無(wú)法倒流的,但是使用現(xiàn)有的工具,您有更多的機(jī)會(huì)預(yù)測(cè)時(shí)間,更準(zhǔn)確地說(shuō),是可以預(yù)測(cè)時(shí)間序列樣本中的事件是否會(huì)繼續(xù)影響決策趨勢(shì)。
Google發(fā)行的Facebook Prophet和TensorFlow是兩種旨在吸引開(kāi)發(fā)人員創(chuàng)建數(shù)據(jù)科學(xué)應(yīng)用程序的機(jī)器學(xué)習(xí)協(xié)議。技術(shù)和分析經(jīng)理應(yīng)將這些工具視為擴(kuò)展其DataOps功能并將其初始步驟擴(kuò)展到機(jī)器學(xué)習(xí)的方法。
由Facebook核心數(shù)據(jù)科學(xué)團(tuán)隊(duì)創(chuàng)建的Facebook Prophet提供了可靠的時(shí)間序列預(yù)測(cè),其中處理能力是一個(gè)問(wèn)題。先知基于加性模型,以解決非線性趨勢(shì)如何與每年、每周和每天的季節(jié)性相適應(yīng)。當(dāng)數(shù)據(jù)包含周期性趨勢(shì)(例如發(fā)現(xiàn)突發(fā)事件影響趨勢(shì))時(shí),該框架將為企業(yè)提供幫助。 R編程和Python版本是在一年前發(fā)布的,因此企業(yè)可以利用開(kāi)源資源來(lái)創(chuàng)建模型。 源代碼和示例可在GitHub上獲得。
神經(jīng)網(wǎng)絡(luò)框架還提供了一套附加的概率模型,在R中,模型被稱為一個(gè)單獨(dú)的庫(kù)。這使得更高級(jí)的統(tǒng)計(jì)模型可以更容易地構(gòu)建到模型中。在時(shí)間序列的情況下,用戶可以應(yīng)用貝葉斯結(jié)構(gòu)的時(shí)間序列。貝葉斯結(jié)構(gòu)時(shí)間序列是一組概率模型,它包含并延展了許多標(biāo)準(zhǔn)的時(shí)間序列建模概念。其目的是突出統(tǒng)計(jì)細(xì)節(jié),以便更準(zhǔn)確地比較當(dāng)前和以往各時(shí)期的時(shí)間序列數(shù)據(jù)。TensorFlow概率庫(kù)允許模型包含貝葉斯結(jié)構(gòu)時(shí)間序列。
為什么要對(duì)時(shí)間序列如此重視呢?時(shí)間序列報(bào)告和Excel電子表格一樣常見(jiàn),許多工具都顯示時(shí)間序列數(shù)據(jù),而你只需看一下web分析解決方案或社交媒體分析報(bào)告就可以得到。但是,這些解決方案中時(shí)間序列數(shù)據(jù)的可視化并沒(méi)有真正考慮到統(tǒng)計(jì)分析。
例如Google Analytics(分析)之類的網(wǎng)絡(luò)分析解決方案,可以提供引薦流量的時(shí)間序列結(jié)果,這些結(jié)果可以決定哪些源始終向網(wǎng)站發(fā)送流量。但是,假設(shè)您需要預(yù)測(cè)給定轉(zhuǎn)診源的趨勢(shì)可以持續(xù)多久,如果時(shí)間足夠長(zhǎng),趨勢(shì)線的斜率可能無(wú)法立即從平面線中分辨出來(lái)。通常確定第一個(gè)客戶的搜索流量的最高轉(zhuǎn)換來(lái)源時(shí)會(huì)耗費(fèi)較長(zhǎng)時(shí)間,因?yàn)樵L問(wèn)量增長(zhǎng)緩慢。
根據(jù)目前的數(shù)據(jù)源情況,給定時(shí)間序列的頻率模式也可能不是線性的。這意味著觀測(cè)結(jié)果將以對(duì)數(shù)或曲線的形式顯示出連續(xù)的增減。具有統(tǒng)計(jì)能力的工具能夠比標(biāo)準(zhǔn)解決方案更好地檢測(cè)這些細(xì)微差別的趨勢(shì)。進(jìn)行股票市場(chǎng)預(yù)測(cè)的金融專業(yè)人士非常了解更好的統(tǒng)計(jì)能力的價(jià)值。他們使用先進(jìn)的工具來(lái)創(chuàng)建精確的時(shí)間序列預(yù)測(cè),但因?yàn)閿?shù)據(jù)中的噪音和波動(dòng)掩蓋了這一趨勢(shì)。
最新的工具使很多統(tǒng)計(jì)功能成為可能,加快了創(chuàng)建有意義的決策分析。數(shù)據(jù)中的隨機(jī)噪聲也可以過(guò)濾掉。但高級(jí)分析也可以在其他儀表板(如Tableau)中完成,或者像Prophet提供的用Python或R編程創(chuàng)建可視化模型。
雖然時(shí)間序列是一個(gè)簡(jiǎn)單的分析,但有時(shí)也會(huì)包含復(fù)雜的統(tǒng)計(jì)細(xì)微差別。檢查這些細(xì)微差別可以快速顯示正確的細(xì)節(jié),幫助團(tuán)隊(duì)更快更好地做出數(shù)據(jù)驅(qū)動(dòng)下的正確決策。