這個(gè)ChatGPT插件可以遠(yuǎn)程運(yùn)行代碼,還生成圖表
ChatGPT的插件使數(shù)據(jù)科學(xué)成為一種簡(jiǎn)單、愉快的體驗(yàn)
我們做數(shù)據(jù)分析時(shí)一般都是使用這樣的流程來進(jìn)行:運(yùn)行jupyter notebook、安裝庫、解決依賴關(guān)系和版本控制,數(shù)據(jù)分析,生成圖表。ChatGPT的“Code Interpreter”插件可以幫助我們進(jìn)行數(shù)據(jù)分析。
作為測(cè)試,首先要ChatGPT進(jìn)入角色,讓它作為經(jīng)濟(jì)顧問。
act as an economic advisor and help me understand what is essential for calculating inflation.
1、加載和預(yù)處理數(shù)據(jù)
要求ChatGPT訪問歷史數(shù)據(jù)并開始對(duì)其進(jìn)行預(yù)測(cè)。它告訴我它將使用FRED(聯(lián)邦儲(chǔ)備經(jīng)濟(jì)數(shù)據(jù))數(shù)據(jù)庫,但不幸的是,它無法下載數(shù)據(jù)。
那么我們來幫它下載,詢問如何下載數(shù)據(jù)。
然后將它上傳給Code Interpreter,就可以進(jìn)行EDA了。
在ChatGPT的幫助下,我可視化了數(shù)據(jù),檢查了趨勢(shì),并探索了關(guān)鍵指標(biāo)。ChatGPT用簡(jiǎn)單的英語進(jìn)行了總結(jié)。
哈哈,ChatGPT什么都知道。
2、數(shù)據(jù)分析:它繪制了時(shí)間序列數(shù)據(jù),直觀地探索CPI值的趨勢(shì)和季節(jié)性。
它使用增強(qiáng)Dickey-Fuller (ADF)檢驗(yàn)平穩(wěn)性。結(jié)果表明,原始時(shí)間序列是非平穩(wěn)的。
3、數(shù)據(jù)轉(zhuǎn)換的平穩(wěn)性
為了實(shí)現(xiàn)平穩(wěn)性,它對(duì)時(shí)間序列數(shù)據(jù)應(yīng)用了一階差分,這涉及到計(jì)算連續(xù)觀測(cè)數(shù)據(jù)之間的差異。它對(duì)不同的數(shù)據(jù)使用ADF檢驗(yàn)重新檢驗(yàn)平穩(wěn)性。結(jié)果表明,差分時(shí)間序列是平穩(wěn)的。
4、模型選擇與參數(shù)估計(jì)
下一步是預(yù)測(cè)五年的CPI。ChatGPT向我介紹了ARIMA模型,它分析了這些數(shù)字,給了我一個(gè)有意義的預(yù)測(cè)!
它設(shè)置檢查了自相關(guān)函數(shù)(ACF)和部分自相關(guān)函數(shù)(PACF)圖,來確定ARIMA模型的順序(參數(shù)p, d, q)。根據(jù)ACF和PACF圖,選取參數(shù)p=1, d=1, q=1的初始ARIMA模型。
5、模型訓(xùn)練
它用所選參數(shù)(p=1, d=1, q=1)將ARIMA模型擬合到原始(無差異)時(shí)間序列數(shù)據(jù)。該模型從歷史數(shù)據(jù)模式中學(xué)習(xí)。
6、預(yù)測(cè)
使用擬合的ARIMA模型從最后一個(gè)數(shù)據(jù)點(diǎn)預(yù)測(cè)未來5年(60個(gè)月)的CPI。還生成點(diǎn)預(yù)測(cè)和置信區(qū)間,以解釋預(yù)測(cè)中的不確定性。
7、可視化和解釋
繪制歷史數(shù)據(jù)、預(yù)測(cè)CPI值和置信區(qū)間,在通貨膨脹趨勢(shì)的背景下解釋預(yù)測(cè)值,理解預(yù)測(cè)受到不確定性和外部因素的影響。
插件系統(tǒng)的確讓ChatGPT變得有趣:“Code Interpreter”不僅可以讓遠(yuǎn)程運(yùn)行代碼,而且還使數(shù)據(jù)科學(xué)簡(jiǎn)單,高效。
無論你是經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家還是剛?cè)腴T的新手,都可以嘗試一下ChatGPT。智能不智能要看后續(xù)的驗(yàn)證結(jié)果,但是省事是真省事。