關于量化投資的七大誤區
從06年開始進入股市已經快10年了,也做了快10年的量化投資,作為一個非專業人士,從一開始懵懵懂懂的不自覺的用了量化模型還不知道自己是在用量化投資開始,幾乎所有初學者犯過的錯誤我都犯過。正好下周有個量化投資的采訪,在采訪前先把這些誤區拿出來曬給大家:
誤區一:原始數據過少。畢竟有不少原始數據和價格之間是沒有直接的關系的,數據過少會導致結果有較大的偏差。一般來說,原始數據至少要經歷過一個牛熊周期。如果你在牛市里收集的數據來優化的,往往到了熊市一敗涂地;而僅僅在熊市里收集的數據優化的,到了牛市就顯得過于保守。我自己10年里面惟一一年跑輸大盤的就是09年,雖然這一年也賺了不少,但受08年大熊的影響,量化投資采取了非常保守的策略,才會在09年嚴重跑輸大盤。如果真的覺得原始數據過少,比如在10年剛剛出來創業板,當時的數據肯定非常少,用來做量化是遠遠不夠的,但可以慢慢積累數據,同時對于這些可靠性不強的模型,可以用模擬盤監控或者非常小的倉位參與。
誤區二:用了未來函數,也就是說用未來獲得的信息對現在的收益率產生了影響。我見過最多的量化模型里誤用未來函數的就是用當天的收盤價對當天選擇的品種產生影響,那當然是巨高無比的收益率啊,你能知道當天的收盤價,那這個世界上的財富都是你的了。另外最常見的是用下一年一季度公布的年報里的數據放到當年、分紅到帳日和分紅除息日混淆等等。避免的方法只有對你優化的標的加上理解,慢慢熟悉后才能避免,即使像我做了近10年的量化,都不敢說100%避免使用未來函數,只是可能bug少一些而已。
誤區三:不注意當時的一些邊界條件。最典型的是漲停跌停,初學者很容易犯的毛病,回測的時候不考慮漲停買不進,跌停賣不出。回撤的結果巨高無比,實盤一做就不行了。還有類似的停牌也是需要考慮的。
誤區四:過度優化 初學者最容易犯的毛病,可變參數用的越多,優化后得到的年化收益率越高,越容易過度優化,過度優化好比做了一件非常貼身的西服,穿在這個人身上還不錯,但只要換一個人馬上就穿不下。往往過度優化后實盤和模型的差異非常大,最后導致否認模型。建議的辦法是一方面不要過多的參數來優化模型,另一方面可以采取這樣的辦法,比如說現在有07年到16年10年的數據,你可以先去掉16年的數據,就“假裝”回到了15年然后優化模型,再把16年的數據放到模型中去看看是否有效,如果效果非常差的,十有八九就是過度優化了。當然這只是我的經驗之談。
誤區五:試圖每月每周甚至每天都能戰勝參照指數 上面誤區四說了“假裝”回到15年去看16年的情況,這里也要注意一個問題,就是再好的模型都不能保證每個月都戰勝指數,甚至某一年戰勝不了都是很正常的事情。初學者跟蹤了某個模型后最多的問題就是,為什么今天會跑輸?為什么這個月也跑輸了?我可以很負責的告訴大家,我做了快10年的量化,我就從來沒有遇到過一年里每個月都能跑贏參照指數的系統,將來隨著散戶的慢慢退出更加不可能有。
誤區六:量化投資就是對沖。說實在,國外量化投資做對沖的非常多,但在國內因為一是做空品種少,無法做到完全對沖活大部分對沖,在A股上對沖效果不好,有一些類似熊寶的產品又不是場內的而且交易量也不大并且經常偏差較大,而且現在的政策也限制做空。所以我在A股市場里的模型只用概率和負相關品種而沒有用對沖。當然如果是商品市場、外幣市場等又是另外一碼事情了,我們這里討論的范圍僅僅限于A股市場而且絕大部分小散可以做的事情。
誤區七:量化投資就是高頻交易 應該這樣說,大部分高頻交易都是量化交易,而量化交易不僅僅是高頻交易,我自己因為前幾年工作很忙,沒有用過日線外的任何數據,交易模型也僅僅是平均一周交易一次,但依然可以獲得很好的效果。
誤區七:量化一定要用高大上的工具 現在主流的量化工具是Matlab、Python等。當然除此之外還有一些工具也是可以用到量化中的。
第一種:用專用的工具如Matlab、Python。打個比方,就好像機關木倉,熟悉了后效率非常高,但木倉械相對復雜,而且掃射可能有死角。
第二種:就是我現在在用的用了十年的excel,非常土,但好比一把小手木倉,因為方便,隨身帶著,拿出來就可以打,但可能打不遠。
第三種:以flitter為代表,編寫了專用的軟件,動用了四臺服務器,算一次化很長時間,但能找到一個最佳值。好比是狙擊木倉,一次狙擊要花上很長時間,要有耐心,但好的狙擊手是一木倉制勝。
不管你用什么木倉,能打死敵人就是好木倉,而且現在在國內這個大刀長矛時代,有一把木倉就足夠你橫行江湖了
本文由東方銅牛網編輯,轉載 關于量化投資的七大誤區 請注明文章地址。