yyds!用機(jī)器學(xué)習(xí)預(yù)測 bilibili 股價(jià)走勢
本文主要講解用Python分析嗶哩嗶哩股價(jià),通過對股票數(shù)據(jù)進(jìn)行基礎(chǔ)分析,結(jié)合運(yùn)用matplotlib繪圖庫進(jìn)行可視化,并用機(jī)器學(xué)習(xí)方法 — 蒙特卡洛模擬預(yù)測未來一年股價(jià)走勢。
安裝
我們需要安裝numpy、pandas、matplotlib、scipy等Python數(shù)據(jù)科學(xué)工具包。
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取下載本文完整源碼
- import numpy as np
- import pandas as pd
- from math import sqrt
- import matplotlib.pyplot as plt
- from scipy.stats import norm
- from pandas_datareader import data
選取嗶哩嗶哩(股票代碼:BILI)2018年上市到現(xiàn)在2021年的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)來自雅虎。這里使用pd.to_datetime將數(shù)據(jù)集時(shí)間轉(zhuǎn)化為時(shí)間序列,便于股票的分析。
- BILI = data.DataReader('BILI', 'yahoo',start='29/3/2018',)
- BILI.index=pd.to_datetime(BILI.index)
首先用head()方法看一下數(shù)據(jù)集的結(jié)構(gòu),數(shù)據(jù)集包含了股票的開盤價(jià)、收盤價(jià)、每日最低價(jià)與最高價(jià)、交易量等信息。掃描本文最下方二維碼獲取全部完整源碼和Jupyter Notebook 文件打包下載。
開盤價(jià)走勢
我們可以通過 matplotlib 進(jìn)行數(shù)據(jù)可視化,plt.legend用于設(shè)置圖像的圖例,loc是圖例位置,upper right代表圖例在右上角。從圖中可以看出嗶哩嗶哩股票在2020年12月到2021年2月之間有一個(gè)快速的增長,隨后股價(jià)有所回落。
- plt.figure(figsize=(16,6))
- BILI['Open'].plot()
- plt.legend(['BILI'],loc='upper right')
股票成交量
我們再來看一下股票的成交量。
- plt.figure(figsize=(16,6))
- BILI['Volume'].plot()
- plt.legend(['BILI'],loc='upper right')
- plt.xlim(BILI.index[0],BILI.index[-1])
股票交易總額
我們再分析以下股票的交易總額。從圖中可以很明顯看出2021年1月到5月間某一天交易總額創(chuàng)歷史新高。
- BILI['Total Traded']=BILI['Open']*BILI['Volume']
- plt.figure(figsize=(16,6))
- BILI['Total Traded'].plot()
- plt.legend(['BILI'],loc='upper right')
- plt.xlim(BILI.index[0],BILI.index[-1])
下面我們來通過argmax()獲取最大交易總額的日期。
- BILI['Total Traded'].argmax()
輸出結(jié)果如下:
Timestamp('2021-02-25 00:00:00')
我們搜索新聞可以發(fā)現(xiàn),2021年2月25日嗶哩嗶哩(NASDAQ: BILI)公布了截至2020年12月31日的第四季度和全年未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告。財(cái)報(bào)發(fā)布后,B站在美股的盤后股價(jià)一度漲超5%。
收盤價(jià)及其移動(dòng)平均線
下面繪制BILI這支股票的收盤價(jià)及其移動(dòng)平均線,我們可以用DataFrame的rolling()函數(shù)得到移動(dòng)平均值。
- BILI['Close'].plot(figsize=(16,6),xlim=(BILI.index[0],BILI.index[-1]))
- BILI['Close'].rolling(50).mean().plot(label='BILI MA50')
- BILI['Close'].rolling(200).mean().plot(label='BILI MA200')
- plt.legend()
股票的收益率
下面我們計(jì)算每支股票的日收益率,并用直方圖進(jìn)行展示。這里了三種方法來計(jì)算日收益率,第一種是直接使用計(jì)算公式計(jì)算;第二種是導(dǎo)入專用于金融領(lǐng)域的第三方庫ffn.to_returns函數(shù)計(jì)算;第三種是利用pandas自帶的函數(shù)pct_change(1)進(jìn)行計(jì)算。掃描本文最下方二維碼獲取全部完整源碼和Jupyter Notebook 文件打包下載。
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取完整源碼,直接使用計(jì)算公式計(jì)算
- BILI['Return']=(BILI['Close']-BILI['Close'].shift(1))/BILI['Close'].shift(1)
- BILIBILI=BILI.dropna()
- #導(dǎo)入專用于金融領(lǐng)域的第三方庫ffn.to_returns函數(shù)計(jì)算
- import ffn
- BILI['Return']=ffn.to_returns(BILI['Close'])
- #利用pandas自帶的函數(shù)pct_change(1)進(jìn)行計(jì)算
- BILI['Return']=BILI['Close'].pct_change()
- BILIBILI=BILI.dropna()
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取下載本文完整源碼
- plt.hist(BILI['Return'],bins=50)
也可以用箱圖觀察收益率
- box_df = pd.concat([BILI['Return']],axis=1)
- box_df.columns = ['BILI Returns']
- box_df.plot(kind='box',figsize=(8,11),colormap='jet')
繪制股票的累計(jì)收益率
- BILI['Cumulative Return']=(1+BILI['Return']).cumprod()
- BILI['Cumulative Return'].plot(label='BILI',figsize=(16,8),title='Cumulative Return')
- plt.legend()
股票的復(fù)合年均增長率和收益的年度波動(dòng)率
計(jì)算股票的復(fù)合年均增長率和收益的年度波動(dòng)率。
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取完整源碼,計(jì)算復(fù)合年均增長率
- days = (BILI.index[-1] - BILI.index[0]).days
- cagr = ((((BILI['Adj Close'][-1]) / BILI['Adj Close'][1])) ** (365.0/days)) - 1
- print ('CAGR =',str(round(cagr)*100)+"%")
- mu = cagr
- #計(jì)算收益的年度波動(dòng)率
- BILI['Returns'] = BILI['Adj Close'].pct_change()
- vol = BILI['Returns']*sqrt(252)
- print ("Annual Volatility =",str(round(vol,4)*100)+"%")
CAGR = 71.72%Annual Volatility = 65.14%
用蒙特卡洛模擬預(yù)測股票走勢
我們來預(yù)測未來一個(gè)交易年度(252 天)內(nèi)潛在價(jià)格序列演變的單一模擬,基于遵循正態(tài)分布的每日收益隨機(jī)的抽取。由第一個(gè)圖表中顯示的單線系列表示。第二個(gè)圖表繪制了一年期間這些隨機(jī)每日收益的直方圖。掃描本文最下方二維碼獲取全部完整源碼和Jupyter Notebook 文件打包下載。
- S = BILI['Adj Close'][-1] #起始股票價(jià)格(即最后一天的實(shí)際股票價(jià)格)
- T = 252 #交易天數(shù)
- mu = 0.7172 #復(fù)合年均增長率
- vol = 0.6514 #年度波動(dòng)率
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取完整源碼,使用隨機(jī)正態(tài)分布創(chuàng)建每日收益列表
- daily_returns=np.random.normal((mu/T),vol/math.sqrt(T))+1
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取下載本文完整源碼
- price_list = [S]
- for x in daily_returns:
- price_list.append(price_list[-1]*x)
- #生成價(jià)格序列的折線圖
- plt.plot(price_list)
- plt.show()
生成每日收益的直方圖
- plt.hist(daily_returns-1, 100)
- plt.show()
1000次模擬預(yù)測未來嗶哩嗶哩股價(jià)走勢。
- import numpy as np
- import math
- import matplotlib.pyplot as plt
- from scipy.stats import norm
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取下載本文完整源碼
- S = BILI['Adj Close'][-1] #起始股票價(jià)格(即最后一天的實(shí)際股票價(jià)格)
- T = 252 #交易天數(shù)
- mu = 0.7172 #復(fù)合年均增長率
- vol = 0.6514 #年度波動(dòng)率
- #選擇要模擬的運(yùn)行次數(shù) - 我選擇1000
- for i in range(1000):
- #使用隨機(jī)正態(tài)分布創(chuàng)建每日收益列表
- daily_returns=np.random.normal(mu/T,vol/math.sqrt(T))+1
- #設(shè)置起始價(jià)格并創(chuàng)建由上述隨機(jī)每日收益生成的價(jià)格列表
- price_list = [S]
- for x in daily_returns:
- price_list.append(price_list[-1]*x)
- #繪制來自每個(gè)單獨(dú)運(yùn)行的數(shù)據(jù),我們將在最后繪制
- plt.plot(price_list)
- #顯示上面創(chuàng)建的多個(gè)價(jià)格系列的圖
- plt.show()
10000次模擬預(yù)測未來嗶哩嗶哩股價(jià)走勢。
- import numpy as np
- import math
- import matplotlib.pyplot as plt
- from scipy.stats import norm
- #關(guān)注公眾號:寬客邦,回復(fù)“源碼”獲取下載本文完整源碼
- result = []
- #定義變量
- S = BILI['Adj Close'][-1] #起始股票價(jià)格(即最后一天的實(shí)際股票價(jià)格)
- T = 252 #交易天數(shù)
- mu = 0.7172 #復(fù)合年均增長率
- vol = 0.6514 #年度波動(dòng)率
- #選擇要模擬的運(yùn)行次數(shù) - 選擇10000
- for i in range(10000):
- #使用隨機(jī)正態(tài)分布創(chuàng)建每日收益列表
- daily_returns=np.random.normal(mu/T,vol/math.sqrt(T))+1
- #設(shè)置起始價(jià)格并創(chuàng)建由上述隨機(jī)每日收益生成的價(jià)格列表
- price_list = [S]
- for x in daily_returns:
- price_list.append(price_list[-1]*x)
- #繪制來自每個(gè)單獨(dú)運(yùn)行的數(shù)據(jù),我們將在最后繪制
- plt.plot(price_list)
- #將每次模擬運(yùn)行的結(jié)束值附加到我們在開始時(shí)創(chuàng)建的空列表中
- result.append(price_list[-1])
- #顯示上面創(chuàng)建的多個(gè)價(jià)格系列的圖
- plt.show()
為我們的多重模擬創(chuàng)建股票收盤價(jià)的直方圖。
- plt.hist(result,bins=50)
- plt.show()
用numpy mean函數(shù)計(jì)算平均值的分布,以獲得我們的“預(yù)期值”。
- print(round(np.mean(result)))
139.18
用 numpy 的“percentile”函數(shù)來計(jì)算 5% 和 95% 的分位數(shù)
- print("5% quantile =",np.percentile(result,5))
- print("95% quantile =",np.percentile(result,95))
5% quantile = 38.33550814175252
95% quantile = 326.44060907630484
在直方圖上快速繪制我們剛剛計(jì)算的兩個(gè)分位數(shù),以給我們一個(gè)直觀的表示。
- plt.hist(result,bins=100)
- plt.axvline(np.percentile(result,5), color='r', linestyle='dashed')
- plt.axvline(np.percentile(result,95), color='r', linestyle='dashed')
- plt.show()
從上面的結(jié)果我們得知:嗶哩嗶哩(BILI)的股價(jià)有5%的可能性最終會(huì)低于38.33美元,有5%的可能性會(huì)高于326.44美元。那么你是否愿意冒5%的風(fēng)險(xiǎn)獲得股價(jià)低于38.33美元的損失,來追逐股價(jià)高于326.44美元的回報(bào)收益呢?