終于有人把量化投資講明白了
本文轉(zhuǎn)載自微信公眾號「大數(shù)據(jù)DT」,作者趙志強 劉志偉。轉(zhuǎn)載本文請聯(lián)系大數(shù)據(jù)DT公眾號。
01 量化投資基本概念
量化投資并沒有一個精確的定義,廣義上可以認為,凡是借助于數(shù)學(xué)模型和計算機實現(xiàn)的投資方法都可以稱為量化投資。
目前,國內(nèi)比較常見的量化投資方法包括股票多因子策略(阿爾法)、期貨CTA策略、套利策略和高頻交易策略等。
量化投資在2010年之前還是非常小眾的領(lǐng)域,后來隨著滬深300指數(shù)期貨的出現(xiàn),量化投資的基金開始出現(xiàn)井噴現(xiàn)象。無論是中長線CTA策略,還是高頻交易策略或股票阿爾法策略,都取得了非常好的業(yè)績。
2010年到2014年是量化投資的紅利期,各類量化投資策略都賺取了足夠多利潤。利潤是最好的廣告,很多人都開始關(guān)注量化投資,量化投資基金的規(guī)模因此開始快速增長。
也正是這種“高利潤”,導(dǎo)致了大家對量化投資存在大量的誤解。比如,2015年的“股災(zāi)”,很多人認為股指上的高頻交易起到了推波助瀾的作用,是股災(zāi)的元兇。之后,中金所做出的一系列動作,如對股指限制交易頻率、提高交易手續(xù)費等,很大程度上就是為了限制高頻交易。
股指被限,導(dǎo)致量化投資行業(yè)的利潤大幅下滑,于是量化投資進入了寒冬期。然而,實際上股指是被冤枉的,清華大學(xué)五道口金融學(xué)院也撰寫了研究報告來論證股指并不是股災(zāi)的原因。
由于誤解的繼續(xù)存在,因此股指在短期內(nèi)是無法恢復(fù)到股災(zāi)以前的水平的。量化投資行業(yè)因為其非常依賴股指的特性,業(yè)績出現(xiàn)大幅的下滑,很多策略也開始相繼失效。
策略的失效,業(yè)績的下滑,讓很多人開始反思,量化并不是一切,并不能解決所有的問題。量化投資本身也是具有很大局限性的。
所以需要換一個思路,我們不一定要靠純粹的所謂“量化”來做投資,量化只是一種手段,目的還是為了提升投資業(yè)績。換句話說,我們并不一定要成為專業(yè)的量化從業(yè)人員,才能使用量化的方法。
任何投資經(jīng)理,包括大量傳統(tǒng)的基本面分析師,都可以使用量化的手段來幫忙提升投資研究效率和業(yè)績。本文的初衷就是希望傳統(tǒng)的投資從業(yè)人員也能從量化的思路中獲得助益。
量化,并不是誰的專利,人人都可以學(xué)習(xí)。
02 量化投資的特征
嚴格來說,量化投資與主觀投資并不是非黑即白的關(guān)系。傳統(tǒng)的主觀投資經(jīng)理查看財報,根據(jù)財務(wù)數(shù)據(jù)做投資決策,這算不算量化分析?既然進行了數(shù)據(jù)分析,主觀投資當(dāng)然也算是一種量化分析。那么,量化投資與主觀投資的區(qū)別究竟在哪里呢?
它們的區(qū)別并沒有那么涇渭分明。每一個投資者,或多或少都用到了主觀或者量化的方法。投資者在收集信息、擬定決策的時候,有兩種不同的傾向,一種是感知的、直覺的,另一種是邏輯的、量化的。這樣就分為了四個維度,具體如下。
- 直覺接收,直覺決策。比如,閱讀新聞,感知投資者情緒進行決策。
- 直覺接收,量化決策。比如,抓取網(wǎng)絡(luò)文本,建立模型進行投資決策。
- 量化接收,直覺決策。比如,研究財報數(shù)據(jù),根據(jù)直覺經(jīng)驗進行投資決策。
- 量化接收,量化決策。比如,通過統(tǒng)計分析,建立多因子模型,進行投資決策。
上述四個維度的劃分如圖1-1所示。
▲圖 1-1
量化投資策略的最大特點是其具有一套基于數(shù)據(jù)的完整交易規(guī)則。在投資決策的任何一個環(huán)節(jié)中,必須要有一套完全客觀的量化標(biāo)準(zhǔn),比如,A股票的橫指標(biāo)達到多少的閾值時,我們才決定開倉,每次開倉要買多少手。
這種規(guī)定必須是唯一客觀的,不允許有不同的解釋。當(dāng)然,這些規(guī)定可以通過研究和主觀判斷來進行修改,但是一旦確定,就需要嚴格遵守。
03 量化投資的優(yōu)勢
量化投資的優(yōu)勢可以總結(jié)為三個詞:客觀性、大數(shù)據(jù)、響應(yīng)快,具體說明如下。
1. 客觀性
量化投資一般通過回測來證實或者證偽策略的歷史有效性,而且在進行實盤交易的時候,很多都是通過程序化交易自動下單的,這能在很大程度上保證決策的客觀性,受人為情緒等因素的干擾較少。
2. 大數(shù)據(jù)
量化投資在研究或者決策中,通常會引入大量的數(shù)據(jù)來進行分析。比如股票,只需要一套代碼,就可以同時分析全市場3600多支股票。這種大數(shù)據(jù)的分析效率在傳統(tǒng)投研方法中是做不到的(當(dāng)然,不可否認的是,傳統(tǒng)投研對公司基本面的研究是更深入的)。
3. 響應(yīng)快
由于是用計算機進行自動分析,所以分析和響應(yīng)速度都十分迅速,一般能達到秒級,高頻交易甚至是以微秒為單位的。比如,筆者以前做高頻交易的時候,程序從接受行情到下單的優(yōu)化都是以微秒為單位的,因為你比別人更快一點就有更大的可能搶到單子,就能賺到更多的錢。
就算是非高頻交易領(lǐng)域,也有一些響應(yīng)速度較快的需求,比如,筆者曾參與一個公告解析的項目,從公告發(fā)布爬取,再到解析出公告對應(yīng)的意義,基本上在幾分鐘內(nèi)就能解決。當(dāng)然,公告的極速解析對交易的意義并不大,因為公告都是在盤后發(fā)布的,不會在交易時間發(fā)布,因此大家都有足夠的反應(yīng)時間來進行投資決策。
但是,對新聞的解析,其意義是十分巨大的,因為新聞隨時隨地都有可能發(fā)生,這也是通常所說的輿情分析,雖然目前這塊的進展不算太大,但是其未來的發(fā)展空間卻是巨大的。
雖然具有上述這些優(yōu)勢,但是量化投資本身并不是一把“金鑰匙”。實際上,很難有一種策略,在任何市場中都能持續(xù)賺錢。即使是很多夏普比率極高的高頻交易策略(比如,股災(zāi)之前的股指高頻交易策略),也會面臨政策的不確定性。如果交易所調(diào)高手續(xù)費,限制交易量,那么這些高頻策略也就不再有利可圖了。
所以不要迷信量化投資能夠解決一切問題。我們只需要想辦法利用好量化的特性,在投資競爭中不斷積累優(yōu)勢即可。
04 量化、AI并不是一切
隨著圍棋比賽中阿爾法狗完勝人類,近幾年人工智能(大數(shù)據(jù))將占領(lǐng)華爾街的新聞也是鋪天蓋地、甚囂塵上。其實筆者并不相信目前純粹的人工智能在投資上能夠超過最好的基金經(jīng)理。為什么這么說呢?因為圍棋與投資有著本質(zhì)的區(qū)別。
棋類游戲,很早的時候人類就已經(jīng)被計算機打敗了(如國際象棋)。不過圍棋的難點在于,可能的狀態(tài)數(shù)太多,無法窮舉,但這些難點終究只是一個數(shù)量上的問題,所以圍棋算法的核心要點在于,在有限算力的情況下,通過優(yōu)化算法,放棄部分搜索空間,同時保證尋找到的是較優(yōu)的解。在計算機領(lǐng)域,這其實就是個“優(yōu)化”問題。
但是投資完全不一樣,投資不是“優(yōu)化”問題,投資是“預(yù)測”問題,是要預(yù)測市場的下一步應(yīng)該怎么走。“預(yù)測”問題可以說極其困難。
Facebook人工智能掌門楊立昆(Yann LeCun)演講時曾提到過這個問題,人工智能最缺乏的是“常識”,這一缺陷導(dǎo)致了人工智能作出預(yù)測極為困難。
楊立昆列舉的例子是視頻,比如某個視頻的上半段是喬丹運球沖向籃筐,那么下半段會是什么樣子呢?這個問題對人類來說很容易,大概率就是投籃或者扣籃。因為我們的常識已經(jīng)熟知了籃球的套路。但這個問題對于人工智能來說,卻是極為困難的。
實際上,很多大公司都曾在預(yù)測問題上遭遇尷尬。很早的時候,Google就嘗試使用大數(shù)據(jù)來預(yù)測流感,最后證明預(yù)測效果并不好。
國內(nèi)也有一些互聯(lián)網(wǎng)大公司(如百度和騰訊)使用大數(shù)據(jù)發(fā)布了相應(yīng)的指數(shù)基金,業(yè)績相當(dāng)一般。據(jù)筆者所知,F(xiàn)acebook目前甚至沒有人去做股票的投資研究,他們肯定深知其中的困難——如果人工智能在投資上能有那么厲害,那么他們早就借此發(fā)家致富了。
至于國內(nèi)很多所謂的人工智能,低級一點的,將神經(jīng)網(wǎng)絡(luò)套用在行情數(shù)據(jù)上,試圖擬合出一個表現(xiàn)不錯的策略,在實盤中往往會遭受事實無情的打擊。高級一點的,扒取網(wǎng)上相關(guān)的輿情數(shù)據(jù),先進行自然語言分析再根據(jù)信息做出決策。
這些與我們“想象中”的人工智能其實都相差很遠,也不太見得會有什么上佳表現(xiàn)。即使有表現(xiàn)較好的策略,其本質(zhì)與用簡單的回歸模型做出的策略并無太大區(qū)別。實際上,國內(nèi)很多做P2P風(fēng)險分析的,用的都是Logistic回歸,易懂又好用。
由于媒體的吹捧,大家對AI在金融投資領(lǐng)域的應(yīng)用普遍存在著過高的期待,甚至有人危言聳聽地號稱將來AI會替代投資經(jīng)理的職務(wù)。
其實這都是不現(xiàn)實的,在一些簡單的數(shù)據(jù)處理問題上,AI確實有替代人工的趨勢,比如人臉識別。但對于金融投資這一復(fù)雜的領(lǐng)域,AI的應(yīng)用進展其實是非常有限的。很多號稱AI的投資基金其實是換湯不換藥,本質(zhì)上還是已經(jīng)成熟了幾十年的量化模型。
AI在金融投資領(lǐng)域最大的問題是,可用的樣本數(shù)據(jù)極其有限,也無法大量生成。股市有多少歷史數(shù)據(jù),就有多少樣本數(shù)據(jù),但也只有這么多。
極其有限的樣本數(shù)據(jù),加上極其龐大的特征維度,是AI在金融預(yù)測建模上舉步維艱的根本原因。眾所周知的是,訓(xùn)練數(shù)據(jù)是AI的基本養(yǎng)料,數(shù)據(jù)有限,就會導(dǎo)致模型很難得到大幅度的提升。就那么多有效的因子,大家反復(fù)挖掘,失效的速度也越來越快。
雖然筆者是量化投資和金融AI從業(yè)人員,但對量化投資或者AI并不存在過高的追捧和期待,我們還是要腳踏實地去解決一些與我們更密切相關(guān)的問題。
關(guān)于作者:趙志強,金融量化與建模專家,目前在金融科技公司負責(zé)金融大數(shù)據(jù)產(chǎn)品工作,專注于研究Al在金融領(lǐng)域的落地應(yīng)用。曾在由諾獎得主Robert Engle領(lǐng)導(dǎo)的上海紐約大學(xué)波動研究所研究全球金融風(fēng)險,并和上交所、中金所合作完成多項科研項目。曾在摩根士丹利華鑫基金、明汯投資負責(zé)量化投資研究工作,內(nèi)容包括股票多因子、期貨CTA和高頻交易等。劉志偉,在中國銀聯(lián)云閃付事業(yè)部從事數(shù)據(jù)分析、數(shù)據(jù)挖掘等工作。對自然語言處理、文本分類、實體識別、關(guān)系抽取、傳統(tǒng)機器學(xué)習(xí),以及大數(shù)據(jù)技術(shù)棧均有實踐經(jīng)驗。目前正在探索相關(guān)技術(shù)在金融場景內(nèi)的落地應(yīng)用,包括自動知識圖譜、大規(guī)模文本信息抽取結(jié)構(gòu)化、異常識別等領(lǐng)域,關(guān)注人工智能行業(yè)前沿技術(shù)發(fā)展。
本文摘編自《Python量化投資:技術(shù)、模型與策略》,經(jīng)出版方授權(quán)發(fā)布。