量化投資選股之多因子選股模型
一、定義與思想
量化投資選股就是利用數(shù)量化的方法選擇股票組合,期望股票組合能獲得超越基準(zhǔn)收益率的投資行為。多因子模型是運(yùn)用最廣泛的一種選股模型,基本的原理是采用一系列的因子作為選股的條件,滿足這些因子的股票則被買入,不滿足則被賣出。多因子模型相關(guān)比較穩(wěn)定,因?yàn)樵诓煌袌?chǎng)下,總有一些因子會(huì)發(fā)揮作用。
市場(chǎng)上的投資者,不管是價(jià)值投資者,還是投機(jī)者,或者短線交易者,都會(huì)根據(jù)某些因子來判斷股票的漲跌。當(dāng)一群交易者同時(shí)采用某個(gè)因子的時(shí)候,就會(huì)造成該因子有效。
因子選股模型為什么適用?舉一個(gè)簡(jiǎn)單的例子:如果有一批人參加馬拉松,想知道哪些人能獲得不錯(cuò)的成績(jī),只需在跑前做一個(gè)身體測(cè)試即可。測(cè)試可以用一個(gè)或多個(gè)指標(biāo)。對(duì)測(cè)試的結(jié)果進(jìn)行排名,排名靠前的運(yùn)動(dòng)員獲得好成績(jī)的可能性就比較大。因子選股模型的原理與此類似,可以利用某些指標(biāo)(因子)選擇未來可能表現(xiàn)較好的股票。
二、因子的種類
哪些因子可能成為選擇股票的依據(jù)?這主要依賴于金融經(jīng)濟(jì)邏輯和市場(chǎng)經(jīng)驗(yàn)。總的來說,因子的來源有三方面:
1)公司層面因子;2)外部環(huán)境因子;3)市場(chǎng)表現(xiàn)因子。
(一)公司層面因子公司層面因子來自于公司的微觀結(jié)構(gòu),與公司的生產(chǎn)經(jīng)營(yíng)息息相關(guān),一般來自公司的財(cái)務(wù)指標(biāo),反映了公司的盈利、運(yùn)營(yíng)、債務(wù)和成長(zhǎng)狀況。這些因子主要有:
1)價(jià)值類因子,如PE、PB;
2)成長(zhǎng)類因子,如ROE、凈利潤(rùn)增長(zhǎng)率;
3)規(guī)模類因子,如凈利潤(rùn)、營(yíng)業(yè)收入;
4)情緒類因子,如預(yù)測(cè)未來12個(gè)月的利潤(rùn)增長(zhǎng)率;
5)質(zhì)量類因子,如資產(chǎn)負(fù)債率、應(yīng)收賬款周轉(zhuǎn)率。
(二)外部環(huán)境因子政治法律、宏觀經(jīng)濟(jì)、社會(huì)習(xí)俗和技術(shù)發(fā)展等外部環(huán)境對(duì)一個(gè)行業(yè)和企業(yè)來說都是非常重要的。比較重要并且容易量化投資的外部環(huán)境因子主要是
1)宏觀環(huán)境因子,如經(jīng)濟(jì)增長(zhǎng)率、利率等;
2)行業(yè)環(huán)境,如行業(yè)集中度等。
(三)市場(chǎng)表現(xiàn)因子市場(chǎng)表現(xiàn)因子主要體現(xiàn)的是股票在交易過程中的價(jià)格和交易量。這些因子主要有動(dòng)量和反轉(zhuǎn)類因子、資金流向和各種技術(shù)類指標(biāo)等。
三、建模方法
因子選股模型想法比較簡(jiǎn)單,幾乎用不到特別復(fù)雜的數(shù)學(xué)模型。如果從數(shù)學(xué)的角度來看,因子選股模型僅僅是一個(gè)從因子到資金曲線的映射:
f(factors,parameters)=equity
其中f表示交易系統(tǒng)(線性或非線性),實(shí)際建模時(shí)可以用回歸法或打分法進(jìn)行簡(jiǎn)化處理。Factors是我們篩選出來的一些有效因子,如果這些因子有信息重疊,可以采用多元統(tǒng)計(jì)中的主成分分析或因子分析進(jìn)行降維處理。Parameters是建模時(shí)遇到的各種參數(shù),它們包括因子的權(quán)重、觀察時(shí)間長(zhǎng)度和持有時(shí)間長(zhǎng)度等。Equity是資金曲線,它反映我們賬戶隨時(shí)間的變化情況。通過對(duì)資金曲線equity的一些再處理,就可以得到一些評(píng)價(jià)指標(biāo)(如年化收益率、年化夏普比率和最大回撤等),通過這些指標(biāo)可以來評(píng)價(jià)該投資策略的效果。
從上面的模型可以可以看出,因子選股模型最重要的有兩方面:一個(gè)是有效因子的選擇,另一個(gè)是因子參數(shù)的選擇。例如到底是PE有效還是ROE有效;到底是采用1個(gè)月做調(diào)倉(cāng)周期還是3個(gè)月做調(diào)倉(cāng)周期。這些因子和參數(shù)的獲取只能通過歷史數(shù)據(jù)的回測(cè)來獲得。