炒股魅力:數(shù)據(jù)分析俠變身“賺錢機(jī)器”
曾經(jīng)有這么一群人,他們每天早上8點(diǎn)打開軟件,調(diào)試著各種交易工具,確保每天能夠正常運(yùn)行。9點(diǎn)開盤了,靜靜的看著交易軟件的自動買入賣出。中午吃個飯,下午繼續(xù)這樣的工作。晚上想一想算法模型,思考一下人生,再算一下當(dāng)日的最新凈值。他們是可能改變?nèi)A爾街研究員的一類人,被戲稱為瘋狂的賺錢機(jī)器。他們就是以在20年的時間里創(chuàng)造了年均凈回報率高達(dá)35%驚人傳奇的量化投資大師西蒙斯為代表的量化投資研究員。
我們?nèi)缃裆钤谝粋€數(shù)據(jù)爆炸的世界里。百度每天響應(yīng)超過60億次的搜索請求,日處理數(shù)據(jù)超過100PB,相當(dāng)于6000多座中國國家圖書館的書籍信息量總和。新浪微博每天都會發(fā)布上億條微博。在荒無人煙的郊外,暗藏著無數(shù)大公司的信息存儲中心,24小時夜以繼日地運(yùn)轉(zhuǎn)著。
克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代》一書中認(rèn)為,大數(shù)據(jù)的核心就是預(yù)測,即只要數(shù)據(jù)豐富到一定程度,就可預(yù)測事情發(fā)生的可能性。例如,“從一個人亂穿馬路時行進(jìn)的軌跡和速度來看他能及時穿過馬路的可能性”,或者通過一個人穿過馬路的速度,預(yù)測車子何時應(yīng)該減速從而讓他及時穿過馬路。
那么,如果把這種預(yù)測能力應(yīng)用在股票投資上,又會如何?
目前,美國已經(jīng)有許多對沖基金采用大數(shù)據(jù)技術(shù)進(jìn)行投資,并且收獲甚豐。中國的中證廣發(fā)百度百發(fā)100指數(shù)基金(下稱百發(fā)100),上線四個多月以來已上漲68%。
和傳統(tǒng)量化投資類似,大數(shù)據(jù)投資也是依靠模型,但模型里的數(shù)據(jù)變量幾何倍地增加了,在原有的金融結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ)上,增加了社交言論、地理信息、衛(wèi)星監(jiān)測等非結(jié)構(gòu)化數(shù)據(jù),并且將這些非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行量化,從而讓模型可以吸收。
由于大數(shù)據(jù)模型對成本要求極高,業(yè)內(nèi)人士認(rèn)為,大數(shù)據(jù)將成為共享平臺化的服務(wù),數(shù)據(jù)和技術(shù)相當(dāng)于食材和鍋,基金經(jīng)理和分析師可以通過平臺制作自己的策略。
不要小看大數(shù)據(jù)的本領(lǐng),正是這項(xiàng)剛剛興起的技術(shù)已經(jīng)創(chuàng)造了無數(shù)“未卜先知”的奇跡。
2014年,百度用大數(shù)據(jù)技術(shù)預(yù)測命中了全國18卷中12卷高考作文題目,被網(wǎng)友稱為“神預(yù)測”。百度公司人士表示,在這個大數(shù)據(jù)池中,包含互聯(lián)網(wǎng)積累的用戶數(shù)據(jù)、歷年的命題數(shù)據(jù)以及教育機(jī)構(gòu)對出題方向作出的判斷。
在2014年巴西世界杯比賽中,Google亦通過大數(shù)據(jù)技術(shù)成功預(yù)測了16強(qiáng)和8強(qiáng)名單。
從當(dāng)年英格蘭報社的信鴿、費(fèi)城股票交易所的信號燈到報紙電話,再到如今的互聯(lián)網(wǎng)、云計算、大數(shù)據(jù),前沿技術(shù)迅速在投資領(lǐng)域落地。在股票策略中,大數(shù)據(jù)日益嶄露頭角。
做股票投資策略,需要的大數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù),簡單說就是“一堆數(shù)字”,通常包括傳統(tǒng)量化分析中常用的CPI、PMI、市值、交易量等專業(yè)信息;非結(jié)構(gòu)化數(shù)據(jù)就是社交文字、地理位置、用戶行為等“還沒有進(jìn)行量化的信息”。
量化非結(jié)構(gòu)化就是用深度模型替代簡單線性模型的過程,其中所涉及的技術(shù)包括自然語言處理、語音識別、圖像識別等。
金融大數(shù)據(jù)平臺-通聯(lián)數(shù)據(jù)CEO王政表示,通聯(lián)數(shù)據(jù)采用的非結(jié)構(gòu)化數(shù)據(jù)可以分為三類:第一類和人相關(guān),包括社交言論、消費(fèi)、去過的地點(diǎn)等;第二類與物相關(guān),如通過正在行駛的船只和貨車判斷物聯(lián)網(wǎng)情況;第三類則是衛(wèi)星監(jiān)測的環(huán)境信息,包括汽車流、港口裝載量、新的建筑開工等情況。
衛(wèi)星監(jiān)測信息在美國已被投入使用,2014年Google斥資5億美元收購了衛(wèi)星公司Skybox,從而可以獲得實(shí)施衛(wèi)星監(jiān)測信息。
結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)也常常相互轉(zhuǎn)化。“結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)可以形象理解成把所有數(shù)據(jù)裝在一個籃子里,根據(jù)應(yīng)用策略不同相互轉(zhuǎn)化。例如,在搜索頻率調(diào)查中,用戶搜索就是結(jié)構(gòu)化數(shù)據(jù);在金融策略分析中,用戶搜索就是非結(jié)構(gòu)化數(shù)據(jù)。”百度公司人士表示。
華爾街拿著豐厚薪水的分析師們還不知道,自己的雇主已經(jīng)將大量資本投向了取代自己的機(jī)器。
2014年11月23日,高盛向Kensho公司投資1500萬美元,以支持該公司的大數(shù)據(jù)平臺建設(shè)。該平臺很像iPhone里的Siri,可以快速整合海量數(shù)據(jù)進(jìn)行分析,并且回答投資者提出的各種金融問題,例如“下月有颶風(fēng),將對美國建材板塊造成什么影響?”
在Kensho處理的信息中,有80%是“非結(jié)構(gòu)化”數(shù)據(jù),例如政策文件、自然事件、地理環(huán)境、科技創(chuàng)新等。這類信息通常是電腦和模型難以消化的。因此,Kensho的CEO Daniel Nadler認(rèn)為,華爾街過去是基于20%的信息做出100%的決策。
既然說到高盛,順便提一下,這家華爾街老牌投行如今對大數(shù)據(jù)可謂青睞有加。除了Kensho,高盛還和Fortress信貸集團(tuán)在兩年前投資了8000萬美元給小額融資平臺On Deck Capital。這家公司的核心競爭力也是大數(shù)據(jù),它利用大數(shù)據(jù)對中小企業(yè)進(jìn)行分析,從而選出值得投資的企業(yè)并以很快的速度為之提供短期貸款。
上述諸多非結(jié)構(gòu)化數(shù)據(jù),歸根結(jié)底是為了獲得一個信息:市場情緒。
在采訪中,2013年諾貝爾經(jīng)濟(jì)學(xué)獎得主羅伯特•席勒的觀點(diǎn)被無數(shù)采訪對象引述??梢哉f,大數(shù)據(jù)策略投資的創(chuàng)業(yè)者們無一不是席勒的信奉者。
席勒于上世紀(jì)80年代設(shè)計的投資模型至今仍被業(yè)內(nèi)稱道。在他的模型中,主要參考三個變量:投資項(xiàng)目計劃的現(xiàn)金流、公司資本的估算成本、股票市場對投資的反應(yīng)(市場情緒)。他認(rèn)為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產(chǎn)價格。
然而,在大數(shù)據(jù)技術(shù)誕生之前,市場情緒始終無法進(jìn)行量化。
回顧人類股票投資發(fā)展史,其實(shí)就是將影響股價的因子不斷量化的過程。
上世紀(jì)70年代以前,股票投資是一種定性的分析,沒有數(shù)據(jù)應(yīng)用,而是一門主觀的藝術(shù)。隨著電腦的普及,很多人開始研究驅(qū)動股價變化的規(guī)律,把傳統(tǒng)基本面研究方法用模型代替,市盈率、市凈率的概念誕生,量化投資由此興起。
量化投資技術(shù)的興起也帶動了一批華爾街大鱷的誕生。例如,巴克萊全球投資者(BGI)在上世紀(jì)70年代就以其超越同行的電腦模型成為全球最大的基金管理公司;進(jìn)入80年代,另一家基金公司文藝復(fù)興(Renaissance)年均回報率在扣除管理費(fèi)和投資收益分成等費(fèi)用后仍高達(dá)34%,堪稱當(dāng)時最佳的對沖基金,之后十多年該基金資產(chǎn)亦十分穩(wěn)定。
“從主觀判斷到量化投資,是從藝術(shù)轉(zhuǎn)為科學(xué)的過程。”王政表示,上世紀(jì)70年代以前一個基本面研究員只能關(guān)注20只到50只股票,覆蓋面很有限。有了量化模型就可以覆蓋所有股票,這就是一個大的飛躍。此外,隨著計算機(jī)處理能力的發(fā)展,信息的用量也有一個飛躍變化。過去看三個指標(biāo)就夠了,現(xiàn)在看的指標(biāo)越來越多,做出的預(yù)測越來越準(zhǔn)確。
隨著21世紀(jì)的到來,量化投資又遇到了新的瓶頸,就是同質(zhì)化競爭。各家機(jī)構(gòu)的量化模型越來越趨同,導(dǎo)致投資結(jié)果同漲同跌。“能否在看到報表數(shù)據(jù)之前,用更大的數(shù)據(jù)尋找規(guī)律?”這是大數(shù)據(jù)策略創(chuàng)業(yè)者們試圖解決的問題。
于是,量化投資的多米諾骨牌終于觸碰到了席勒理論的第三層變量——市場情緒。
計算機(jī)通過分析新聞、研究報告、社交信息、搜索行為等,借助自然語言處理方法,提取有用的信息;而借助機(jī)器學(xué)習(xí)智能分析,過去量化投資只能覆蓋幾十個策略,大數(shù)據(jù)投資則可以覆蓋成千上萬個策略。
基于互聯(lián)網(wǎng)搜索數(shù)據(jù)和社交行為的經(jīng)濟(jì)預(yù)測研究,已逐漸成為一個新的學(xué)術(shù)熱點(diǎn),并在經(jīng)濟(jì)、社會以及健康等領(lǐng)域的研究中取得了一定成果。在資本市場應(yīng)用上,研究發(fā)現(xiàn)搜索數(shù)據(jù)可有效預(yù)測未來股市活躍度(以交易量指標(biāo)衡量)及股價走勢的變化。
海外就有學(xué)術(shù)研究指出,公司的名稱或者相關(guān)關(guān)鍵詞的搜索量,與該公司的股票交易量正相關(guān)。德國科學(xué)家Tobias Preis就進(jìn)行了如此研究:Tobias利用谷歌搜索引擎和谷歌趨勢(Google Trends),以美國標(biāo)普500指數(shù)的500只股票為其樣本,以2004年至2010年為觀察區(qū)間,發(fā)現(xiàn)谷歌趨勢數(shù)據(jù)的公司名稱搜索量和對應(yīng)股票的交易量,在每周一次的時間尺度上有高度關(guān)聯(lián)性。也就是說,當(dāng)某個公司名稱在谷歌的搜索量活動增加時,無論股票的價格是上漲或者下跌,股票成交量與搜索量增加;反之亦然,搜索量下降,股票成交量下降。以標(biāo)普500指數(shù)的樣本股為基礎(chǔ),依據(jù)上述策略構(gòu)建的模擬投資組合在六年的時間內(nèi)獲得了高達(dá)329%的累計收益。
在美國市場上,還有多家私募對沖基金利用Twitter和Facebook的社交數(shù)據(jù)作為反映投資者情緒和市場趨勢的因子,構(gòu)建對沖投資策略。利用互聯(lián)網(wǎng)大數(shù)據(jù)進(jìn)行投資策略和工具的開發(fā)已經(jīng)成為世界金融投資領(lǐng)域的新熱點(diǎn)。
保羅·霍丁管理的對沖基金Derwent成立于2011年5月,注冊在開曼群島,初始規(guī)模約為4000萬美元, 2013年投資收益高達(dá)23.77%。該基金的投資標(biāo)的包括流動性較好的股票及股票指數(shù)產(chǎn)品。
通聯(lián)數(shù)據(jù)董事長肖風(fēng)在《投資革命》中寫道,Derwent的投資策略是通過實(shí)時跟蹤Twitter用戶的情緒,以此感知市場參與者的“貪婪與恐懼”,從而判斷市場漲跌來獲利。
在Derwent的網(wǎng)頁上可以看到這樣一句話:“用實(shí)時的社交媒體解碼暗藏的交易機(jī)會。”保羅·霍丁在基金宣傳冊中表示:“多年以來,投資者已經(jīng)普遍接受一種觀點(diǎn),即恐懼和貪婪是金融市場的驅(qū)動力。但是以前人們沒有技術(shù)或數(shù)據(jù)來對人類情感進(jìn)行量化。這是第四維。Derwent就是要通過即時關(guān)注Twitter中的公眾情緒,指導(dǎo)投資。”
另一家位于美國加州的對沖基金MarketPsych與湯普森·路透合作提供了分布在119個國家不低于18864項(xiàng)獨(dú)立指數(shù),比如每分鐘更新的心情狀態(tài)(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創(chuàng)新、訴訟及沖突情況等),而這些指數(shù)都是通過分析Twitter的數(shù)據(jù)文本,作為股市投資的信號。
此類基金還在不斷涌現(xiàn)。金融危機(jī)后,幾個臺灣年輕人在波士頓組建了一家名為FlyBerry的對沖基金,口號是“Modeling the World(把世界建模)”。它的投資理念全部依托大數(shù)據(jù)技術(shù),通過監(jiān)測市場輿論和行為,對投資做出秒速判斷。
關(guān)于社交媒體信息的量化應(yīng)用,在股票投資之外的領(lǐng)域也很常見:Twitter自己也十分注重信息的開發(fā)挖掘,它與DataSift和Gnip兩家公司達(dá)成了一項(xiàng)出售數(shù)據(jù)訪問權(quán)限的協(xié)議,銷售人們的想法、情緒和溝通數(shù)據(jù),從而作為顧客的反饋意見匯總后對商業(yè)營銷活動的效果進(jìn)行判斷。從事類似工作的公司還有DMetics,它通過對人們的購物行為進(jìn)行分析,尋找影響消費(fèi)者最終選擇的細(xì)微原因。
回到股票世界,利用社交媒體信息做投資的公司還有StockTwits。打開這家網(wǎng)站,首先映入眼簾的宣傳語是“看看投資者和交易員此刻正如何討論你的股票”。正如其名,這家網(wǎng)站相當(dāng)于“股票界的Twitter”,主要面向分析師、媒體和投資者。它通過機(jī)器和人工相結(jié)合的手段,將關(guān)于股票和市場的信息整理為140字以內(nèi)的短消息供用戶參考。
此外,StockTwits還整合了社交功能,并作為插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平臺,讓人們可以輕易分享投資信息。
另一家公司Market Prophit也很有趣。這家網(wǎng)站的宣傳語是“從社交媒體噪音中提煉市場信號”。和StockTwits相比,Market Prophit更加注重大數(shù)據(jù)的應(yīng)用。它采用了先進(jìn)的語義分析法,可以將Twitter里的金融對話量化為“-1(極度看空)”到“1(極度看多)”之間的投資建議。網(wǎng)站還根據(jù)語義量化,每天公布前十名和后十名的股票熱度榜單。網(wǎng)站還設(shè)計了“熱度地圖”功能,根據(jù)投資者情緒和意見,按照不同板塊,將板塊內(nèi)的個股按照顏色深淺進(jìn)行標(biāo)注,誰漲誰跌一目了然。
盡管大數(shù)據(jù)策略投資在美國貌似炙手可熱,但事實(shí)上,其應(yīng)用尚僅限于中小型對沖基金和創(chuàng)業(yè)平臺公司。大數(shù)據(jù)策略投資第一次被大規(guī)模應(yīng)用,應(yīng)歸于中國的百發(fā)100。
百度金融中心相關(guān)負(fù)責(zé)人表示,與歐美等成熟資本市場主要由理性機(jī)構(gòu)投資者構(gòu)成相比,東亞尤其是中國的股票類證券投資市場仍以散戶為主,因此市場受投資者情緒和宏觀政策性因素影響很大。而個人投資者行為可以更多地反映在互聯(lián)網(wǎng)用戶行為大數(shù)據(jù)上,從而為有效地預(yù)測市場情緒和趨勢提供了可能。這也就是中國國內(nèi)公募基金在應(yīng)用互聯(lián)網(wǎng)大數(shù)據(jù)投資方面比海外市場并不落后、甚至領(lǐng)先的原因。
百發(fā)100指數(shù)由百度、中證指數(shù)公司、廣發(fā)基金聯(lián)合研發(fā)推出,于2014年7月8日正式對市場發(fā)布,實(shí)盤運(yùn)行以來一路上漲,漲幅超過60%。跟蹤該指數(shù)的指數(shù)基金規(guī)模上限為30億份,2014年9月17日正式獲批,10月20日發(fā)行時一度創(chuàng)下26小時瘋賣18億份的“神話”。
外界都知道百發(fā)100是依托大數(shù)據(jù)的指數(shù)基金,但其背后的細(xì)節(jié)鮮為人知。
百發(fā)100數(shù)據(jù)層面的分析分為兩個層面,即數(shù)據(jù)工廠的數(shù)據(jù)歸集和數(shù)據(jù)處理系統(tǒng)的數(shù)據(jù)分析。其中數(shù)據(jù)工廠負(fù)責(zé)大數(shù)據(jù)的收集分析,例如將來源于互聯(lián)網(wǎng)的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行指標(biāo)化、產(chǎn)品化等數(shù)據(jù)量化過程;數(shù)據(jù)處理系統(tǒng),可以在數(shù)據(jù)工廠遞交的大數(shù)據(jù)中尋找相互統(tǒng)計關(guān)聯(lián),提取有效信息,最終應(yīng)用于策略投資。
“其實(shí)百發(fā)100是在傳統(tǒng)量化投資技術(shù)上融合了基于互聯(lián)網(wǎng)大數(shù)據(jù)的市場走勢和投資情緒判斷。”業(yè)內(nèi)人士概括道。
和傳統(tǒng)量化投資類似,百發(fā)100對樣本股的甄選要考慮財務(wù)因子、基本面因子和動量因子,包括凈資產(chǎn)收益率(ROE)、資產(chǎn)收益率(ROA)、每股收益增長率(EPS)、流動負(fù)債比率、企業(yè)價值倍數(shù)(EV/EBITDA)、凈利潤同比增長率、股權(quán)集中度、自由流通市值以及最近一個月的個股價格收益率和波動率等。
此外,市場走勢和投資情緒是在傳統(tǒng)量化策略基礎(chǔ)上的創(chuàng)新產(chǎn)物,也是百發(fā)100的核心競爭力。接近百度的人士稱,市場情緒因子對百發(fā)100基金起決定性作用。
百度金融中心相關(guān)負(fù)責(zé)人是羅伯特•席勒觀點(diǎn)的支持者。他認(rèn)為,投資者行為和情緒對資產(chǎn)價格、市場走勢有著巨大的影響。因此“通過互聯(lián)網(wǎng)用戶行為大數(shù)據(jù)反映的投資市場情緒、宏觀經(jīng)濟(jì)預(yù)期和走勢,成為百發(fā)100指數(shù)模型引入大數(shù)據(jù)因子的重點(diǎn)”。
傳統(tǒng)量化投資主要著眼點(diǎn)在于對專業(yè)化金融市場基本面和交易數(shù)據(jù)的應(yīng)用。但在百度金融中心相關(guān)業(yè)務(wù)負(fù)責(zé)人看來,無論是來源于專業(yè)金融市場的結(jié)構(gòu)化數(shù)據(jù),還是來源于互聯(lián)網(wǎng)的非結(jié)構(gòu)化數(shù)據(jù),都是可以利用的數(shù)據(jù)資源。因此,前文所述的市場情緒數(shù)據(jù),包括來源于互聯(lián)網(wǎng)的用戶行為、搜索量、市場輿情、宏觀基本面預(yù)期等等,都被百度“變廢為寶”,從而通過互聯(lián)網(wǎng)找到投資者參與特征,選出投資者關(guān)注度較高的股票。
“與同期滬深300指數(shù)的表現(xiàn)相較,百發(fā)100更能在股票市場振蕩時期、行業(yè)輪動劇烈時期、基本面不明朗時期抓住市場熱點(diǎn)、了解投資者情緒、抗擊投資波動風(fēng)險。”百度金融中心相關(guān)負(fù)責(zé)人表示。
百發(fā)100選取的100只樣本股更換頻率是一個月,調(diào)整時間為每月第三周的周五。
業(yè)內(nèi)人士指出,百發(fā)100指數(shù)的月收益率與中證100、滬深300、中證500的相關(guān)性依次提升,說明其投資風(fēng)格偏向中小盤。
但事實(shí)并非如此。從樣本股的構(gòu)成來說,以某一期樣本股為例,樣本股總市值6700億元,占A股市值4.7%。樣本股的構(gòu)成上,中小板21只,創(chuàng)業(yè)板4只,其余75只樣本股均為大盤股。由此可見,百發(fā)100還是偏向大盤為主、反映主流市場走勢。
樣本股每個月的改變比例都不同,最極端的時候曾經(jīng)有60%進(jìn)行了換倉。用大數(shù)據(jù)預(yù)測熱點(diǎn)變化,市場熱點(diǎn)往往更迭很快;但同時也要考慮交易成本。兩方面考慮,百度最后測算認(rèn)為一個月?lián)Q一次倉位為最佳。
樣本股對百發(fā)100而言是核心機(jī)密——據(jù)說“全世界只有基金經(jīng)理和指數(shù)編制機(jī)構(gòu)負(fù)責(zé)人兩個人知道”——都是由機(jī)器決定后,基金經(jīng)理分配給不同的交易員建倉買入?;鸾?jīng)理也沒有改變樣本股的權(quán)利。
展望未來,百度金融中心相關(guān)負(fù)責(zé)人躊躇滿志,“百發(fā)100指數(shù)及基金的推出,只是我們的開端和嘗試,未來將形成多樣化、系列投資產(chǎn)品。”
除了百發(fā)100,目前市場上打著大數(shù)據(jù)旗幟的基金還有2014年9月推出的南方-新浪I100和I300指數(shù)基金。
南方-新浪I100和I300是由南方基金、新浪財經(jīng)和深圳證券信息公司三方聯(lián)合編制的。和百發(fā)100類似,也是按照財務(wù)因子和市場情緒因子進(jìn)行模型打分,按照分值將前100和前300名股票構(gòu)成樣本股。推出至今,這兩個指數(shù)基金分別上漲了10%左右。
正如百發(fā)100的市場情緒因子來自百度,南方-新浪I100和I300的市場情緒因子全部來自新浪平臺。其中包括用戶在新浪財經(jīng)對行情的訪問熱度、對股票的搜索熱度;用戶在新浪財經(jīng)對股票相關(guān)新聞的瀏覽熱度;股票相關(guān)微博的多空分析數(shù)據(jù)等。
此外,阿里巴巴旗下的天弘基金也有意在大數(shù)據(jù)策略上做文章。據(jù)了解,天弘基金將和阿里巴巴合作,推出大數(shù)據(jù)基金產(chǎn)品,最早將于2015年初問世。
天弘基金機(jī)構(gòu)產(chǎn)品部總經(jīng)理劉燕曾對媒體表示,“在傳統(tǒng)的調(diào)研上,大數(shù)據(jù)將貢獻(xiàn)于基礎(chǔ)資產(chǎn)的研究,而以往過度依賴線下研究報告。大數(shù)據(jù)將視野拓展至了線上的數(shù)據(jù)分析,給基金經(jīng)理選股帶來新的邏輯。”
在BAT三巨頭中,騰訊其實(shí)是最早推出指數(shù)基金的。騰訊與中證指數(shù)公司、濟(jì)安金信公司合作開發(fā)的“中證騰安價值100指數(shù)”早在2013年5月就發(fā)布了,號稱是國內(nèi)第一家由互聯(lián)網(wǎng)媒體與專業(yè)機(jī)構(gòu)編制發(fā)布的A股指數(shù)。不過,業(yè)內(nèi)人士表示,有關(guān)指數(shù)并沒有真正應(yīng)用大數(shù)據(jù)技術(shù)。雖然騰訊旗下的微信是目前最熱的社交平臺,蘊(yùn)藏了大量的社交數(shù)據(jù),但騰訊未來怎么開發(fā),目前還并不清晰。
中歐商學(xué)院副教授陳威如在其《平臺戰(zhàn)略》一書中提到,21世紀(jì)將成為一道分水嶺,人類商業(yè)行為將全面普及平臺模式,大數(shù)據(jù)金融也不例外。
然而,由于大數(shù)據(jù)模型對成本要求極高,就好比不可能每家公司都搭建自己的云計算系統(tǒng)一樣,讓每家機(jī)構(gòu)自己建設(shè)大數(shù)據(jù)模型,從數(shù)據(jù)來源和處理技術(shù)方面看都是不現(xiàn)實(shí)的。業(yè)內(nèi)人士認(rèn)為,大數(shù)據(jù)未來必將成為平臺化的服務(wù)。
目前,阿里、百度等企業(yè)都表示下一步方向是平臺化。
螞蟻金服所致力搭建的平臺,一方面包括招財寶一類的金融產(chǎn)品平臺,另一方面包括云計算、大數(shù)據(jù)服務(wù)平臺。螞蟻金服人士說,“我們很清楚自己的優(yōu)勢不是金融,而是包括電商、云計算、大數(shù)據(jù)等技術(shù)。螞蟻金服希望用這些技術(shù)搭建一個基礎(chǔ)平臺,把這些能力開放出去,供金融機(jī)構(gòu)使用。”
百度亦是如此。接近百度的人士稱,未來是否向平臺化發(fā)展,目前還在討論中,但可以確定的是,“百度不是金融機(jī)構(gòu),目的不是發(fā)產(chǎn)品,百發(fā)100的意義在于打造影響力,而非經(jīng)濟(jì)效益。”
當(dāng)BAT還在摸索前行時,已有嗅覺靈敏者搶占了先機(jī),那就是通聯(lián)數(shù)據(jù)。
通聯(lián)數(shù)據(jù)股份公司(DataYes)由曾任博時基金副董事長肖風(fēng)帶隊創(chuàng)建、萬向集團(tuán)投資成立,總部位于上海,公司愿景是“讓投資更容易,用金融服務(wù)云平臺提升投資管理效率和投研能力”。該平臺7月上線公測,目前已擁有130多家機(jī)構(gòu)客戶,逾萬名個人投資者。
通聯(lián)數(shù)據(jù)目前有四個主要平臺,分別是通聯(lián)智能投資研究平臺、通聯(lián)金融大數(shù)據(jù)服務(wù)平臺、通聯(lián)多資產(chǎn)投資管理平臺和金融移動辦公平臺。
通聯(lián)智能投資研究平臺包括雅典娜-智能事件研究、策略研究、智能研報三款產(chǎn)品,可以對基于自然語言的智能事件進(jìn)行策略分析,實(shí)時跟蹤市場熱點(diǎn),捕捉市場情緒??梢哉f,和百發(fā)100類似,其核心技術(shù)在于將互聯(lián)網(wǎng)非結(jié)構(gòu)化數(shù)據(jù)的量化使用。
通聯(lián)金融大數(shù)據(jù)服務(wù)平臺更側(cè)重于專業(yè)金融數(shù)據(jù)的分析整理。它可以提供公司基本面數(shù)據(jù)、國內(nèi)外主要證券、期貨交易所的行情數(shù)據(jù)、公司公告數(shù)據(jù)、公關(guān)經(jīng)濟(jì)、行業(yè)動態(tài)的結(jié)構(gòu)化數(shù)據(jù)、金融新聞和輿情的非結(jié)構(gòu)化數(shù)據(jù)等。
假如將上述兩個平臺比作“收割機(jī)”,通聯(lián)多資產(chǎn)投資管理平臺就是“廚房”。在這個“廚房”里,可以進(jìn)行全球跨資產(chǎn)的投資組合管理方案、訂單管理方案、資產(chǎn)證券化定價分析方案等。
通聯(lián)數(shù)據(jù)可以按照主題熱點(diǎn)或者自定義關(guān)鍵字進(jìn)行分析,構(gòu)建知識圖譜,將相關(guān)的新聞和股票提取做成簡潔的分析框架。例如用戶對特斯拉感興趣,就可以通過主題熱點(diǎn)看到和特斯拉相關(guān)的公司,并判斷這個概念是否值得投資。“過去這個搜集過程要花費(fèi)幾天時間,現(xiàn)在只需要幾分鐘就可以完成。”王政表示。
“通聯(lián)數(shù)據(jù)就好比一家餐館,我們把所有原料搜集來、清洗好、準(zhǔn)備好,同時準(zhǔn)備了一個鍋,也就是大數(shù)據(jù)存儲平臺。研究員和基金經(jīng)理像廚師一樣,用原料、工具去‘烹制’自己的策略。”王政形容道。
大數(shù)據(jù)在平臺上扮演的角色,就是尋找關(guān)聯(lián)關(guān)系。人類總是習(xí)慣首先構(gòu)建因果關(guān)系,繼而去倒推和佐證。機(jī)器學(xué)習(xí)則不然,它可以在海量數(shù)據(jù)中查獲超越人類想象的關(guān)聯(lián)關(guān)系。正如維克托`邁爾-舍恩伯格在《大數(shù)據(jù)時代》中所提到的,社會需要放棄它對因果關(guān)系的渴求,而僅需關(guān)注相互關(guān)系。
例如,美國超市沃爾瑪通過大數(shù)據(jù)分析,發(fā)現(xiàn)颶風(fēng)用品和蛋撻擺在一起可以提高銷量,并由此創(chuàng)造了頗大的經(jīng)濟(jì)效益。如果沒有大數(shù)據(jù)技術(shù),誰能將這毫無關(guān)聯(lián)的兩件商品聯(lián)系在一起?
通聯(lián)數(shù)據(jù)通過機(jī)器學(xué)習(xí),也能找到傳統(tǒng)量化策略無法發(fā)現(xiàn)的市場聯(lián)系。其中包括各家公司之間的資本關(guān)系、產(chǎn)品關(guān)系、競爭關(guān)系、上下游關(guān)系,也包括人與人之間的關(guān)系,例如管理團(tuán)隊和其他公司有沒有關(guān)聯(lián),是否牽扯合作等。
未來量化研究員是否將成為一個被淘汰的職業(yè)?目前研究員的主要工作就是收集整理數(shù)據(jù),變成投資決策,而之后這個工作將更多由機(jī)器完成。
“當(dāng)初醫(yī)療科技發(fā)展時,人們也認(rèn)為醫(yī)生會被淘汰,但其實(shí)并不會。同理,研究員也會一直存在,但他們會更注重深入分析和調(diào)研,初級的數(shù)據(jù)搜集可以交給機(jī)器完成。”王政表示。
但當(dāng)未來大數(shù)據(jù)平臺并廣泛應(yīng)用后,是否會迅速擠壓套利空間?這也是一個問題。