重要觀點
1
大盤謹慎持倉為宜,現金為王
2017年2月09日發出看空信號,近期謹慎持倉為宜。從2014年1月1日到2017年2月10日,多倉單個信號平均收益2.61%,累計收益182.34%;空倉信號單個平均收益0.28%,累積收益10.49%。
2
新聞情緒因子選股不同板塊風格各異
主板方面,情緒指數與股票未來表現為正向指標,且持續天數大概5個交易日;中小板方面,情緒指數與股票未來表現為反向指標,且持續天數大概22個交易日;創業板塊方面,情緒指數與股票未來上漲或下跌效果不顯著。
3
主板空頭負超額收益十分顯著
2014年1月1日到2016年11月30日多頭組合相對滬深300指數最終值為1.28,多頭組合相對滬深300指數年化超額收益9.1%,而空頭組合相對滬深300指數最終值為0.35,空頭組合相對滬深300指數年化負超額收益達30.9%。
一、大數據體系構建
1.1
數據采集與預處理
大數據的源頭質量,直接決定我們指標質量,決定著我們的策略優劣性。目前,國內的相關數據來源主要為第一類上交所,深交所等的公告、財報,監管信息等;第二類財經新聞網站,比如新浪財經,第一財經,東方財富網,中國證券網,金融界,雪球財經,騰訊財經,第一財經等的個股新聞,行業新聞,宏觀經濟等;第三類社交媒體,比如股吧,貼吧,微博等;第四類為關注數據,比如百度,搜狗等個股每天搜索數量及分析師研報提及個股等。我們目前數據主要爬取新浪財經個股相關新聞,包括200多家媒體在內的所有個股新聞。
大數據采集則是通過網絡爬蟲或網站公開API等方式從上述相關網站上獲取我們所需要的數據信息,將非結構化數據從網頁中爬取下來,并解析相關信息,將其存儲為統一的本地數據文件,并以結構化的方式存儲在我們的數據庫中。