- 相關(guān)推薦
量化投資論文
基于量化投資角度的多因素模型投資綜合策略報告
1 研究方法
本篇報告的量化投資策略主要采用的方法與理論有以下幾種:1、線性回歸。
2、多因素模型。
3、CAPM(資本資產(chǎn)定價模型)。
4、假設(shè)檢驗與置信區(qū)間估計。
5、蒙特卡洛模擬。
6、VaR(風(fēng)險價值)方法。
7、Matlab(矩陣實驗室,用于數(shù)據(jù)的處理與圖形的分析)技術(shù)。
主體內(nèi)容主要分為四大部分。
第一部分為模型建立階段,主要是挑選影響股票收益率的相關(guān)因素。
第二部分主要是挑選出收益率排名前20%的股票,并運用CAPM模型進行組合搭配,以求降低非系統(tǒng)性風(fēng)險,最大化股票的收益。
第三部分采用統(tǒng)計學(xué)的知識,對上述建立的模型的相關(guān)參數(shù)進行范圍上與概率上的估計。
并采用VaR方法與蒙特卡洛模擬,進行風(fēng)險的評估與控制,并運用多種評估績效的方式(夏普比率、特雷諾比率、簡森阿爾法等指標(biāo)),對股票的風(fēng)險與收益做出客觀的評判。
第四部分為模型的評價階段,即由宏觀到微觀對該模型做出全面的解釋。
與此同時,運用matlab技術(shù)對參數(shù)進行適當(dāng)?shù)膭討B(tài)更新,使其盡量符合市場的波動情況,并進行回溯測試,用市場的實際結(jié)果來解釋模型的合理之處。
2 策略步驟
第一部分:模型建立階段。
2.1 影響收益率的因子初選
我們采用以下收益率因子。
以上表格反映了影響收益率的主要四大類因子,較好地包括了影響收益率的主要因素。
雖然從宏觀層面上我們挑選出了一些影響收益率的主要因子,然而,在現(xiàn)實過程中,影響某個具體公司收益率的因素很可能只是其中某幾個。
因此,我們應(yīng)當(dāng)試圖找出影響每個股票的收益率的個別關(guān)鍵因素,這里我們采用matlab技術(shù)以及線性回歸的方法,以融捷股份(002192)與暴風(fēng)科技(300431)為例進行說明。
筆者根據(jù)深圳證券交易所統(tǒng)計的數(shù)據(jù)通過EXCEL表格進行合并整理后得到融捷股份的收益率數(shù)據(jù),將該數(shù)據(jù)導(dǎo)入matlab中,以市盈率為橫軸、收益率為縱軸,建立圖形關(guān)系。
根據(jù)統(tǒng)計學(xué)的知識可知,我們用決定系數(shù)R2來反應(yīng)自變量解釋因變量力度的強弱,而決定系數(shù)與相關(guān)系數(shù)之間存在平方關(guān)系,即ρ2=R2。
因此,在matlab中我們通過計算一組數(shù)據(jù)之間的相關(guān)系數(shù),反求出其決定系數(shù),從而說明該特定自變量能從多大程度上解釋因變量。
代碼運行的結(jié)果如下:
從上述運行結(jié)果可知,市盈率與股票收益率之間的R2只有0.0934,遠(yuǎn)小于1,因此市盈率這一項指標(biāo)在融捷股份里并不能對收益率的變動起到?jīng)Q定性作用。
類似地,我們對表1-1中所有的因子進行相同的操作方法,在此由于篇幅原因不再贅述,僅展示操作步驟與過程。
2.2 剔除冗余因子
在進行上述步驟的過程中,值得一提的是,各個因子之間可能本身就具有一定的相關(guān)性。
比如,ROE指標(biāo)與ROA指標(biāo)本身就滿足一個等式:ROE=ROA*EM, 其中EM為權(quán)益乘數(shù),計算公式為EM=1/(1-負(fù)債率)。
如果因素之間的相關(guān)性甚小,我們可以忽略不計,但是當(dāng)相關(guān)性大到一定程度時,便會對之后的多因素模型分析過程產(chǎn)生誤導(dǎo),因此在這里我們需要補充的一步是利用matlab軟件,建立不同指標(biāo)之間的關(guān)系方程,判斷是否存在多重共線性。
2.3 多因素模型體系的建立
在進行完影響收益率的因子選擇以及剔除完冗余因子之后,便是最為重要的建立綜合評分體系,將所有的因子共同反映到一個方程中,用來解釋股票收益率與因子之間的具體變化。
多因素模型的建立過程分為如下幾個步驟:
(1). 標(biāo)準(zhǔn)化原始數(shù)據(jù)
(2). 建立相關(guān)性矩陣
(3). 計算相關(guān)性矩陣的特征值和特征向量
(4). 得出總方程表達(dá)式
通過對上述運行結(jié)果的分析我們可以看出,月最大超額收益的影響最大,而累計收益的影響最小。
這樣,我們便量化出了影響該股票收益率的方程式。
第二部分:交易標(biāo)的股票的選取
2.4 選取收益率前20%的股票
通過第一部分的論述,我們最終可以得到影響不同公司股票收益率的方程式,可以用matlab或者數(shù)據(jù)庫技術(shù)進行保存,當(dāng)需要更新參數(shù)或者進行預(yù)測決策時,調(diào)用相關(guān)函數(shù)即可。
在第二部分中,我們將選取的標(biāo)的股票資產(chǎn)池的相關(guān)數(shù)據(jù)輸入到方程式中,即可得到未來一段時間的預(yù)期收益率。
假設(shè)我們從每個板塊中選取出了20支股票,我們保留預(yù)期收益率排在前20%的股票,優(yōu)中選優(yōu),盡量最大化我們的收益。
2.5 利用CAPM模型進行資產(chǎn)組合
20世紀(jì)誕生的資本資產(chǎn)定價模型(CAPM)為廣大投資者選擇資產(chǎn)組合提供了良好的理論基礎(chǔ)與依據(jù)。
威廉夏普(William F. Sharpe,1934-)與馬克維茨(Harry M. Markowitz)等人所建立的組合管理理論核心即為以下等式:
E(Rn)=Rf+β(E(Rm)-Rf)
其中,E(Rn)為股票的預(yù)期收益率,Rf為無風(fēng)險利率,β為單個股票與市場之間的相關(guān)性,E(Rm)為某一基準(zhǔn)的收益率。
通過該理論,我們可以建立多個資產(chǎn)的不同搭配情況。
在第三部分,我們會進一步討論運用各項績效評估指標(biāo),來權(quán)衡風(fēng)險與收益。
第三部分:風(fēng)險控制
2.6 對各項參數(shù)進行區(qū)間估計和假設(shè)檢驗。
前兩部分重點關(guān)注了組合的收益情況,力求在市場處于無效或弱有效的情況下,取得超越市場的收益率。
然而,對風(fēng)險的把握仍為非常重要的方面,自從2007-2009年間發(fā)生的金融災(zāi)難以后,人們對于風(fēng)險控制的意識又提高到一個新的水平。
下面具體介紹如何利用統(tǒng)計學(xué)知識,對風(fēng)險以及收益的取值范圍做出評估與估計。
假設(shè)由第一部分模擬出的收益率方程滿足如下等式:
Yi = -4.451 +2.057 * X1i + 2.008 * X2i
我們可以看到,在這個等式中出現(xiàn)了三個參數(shù),分別是截距項-4.451、X1i的系數(shù)2.057以及X2i的系數(shù)2.008。
然而,這畢竟是模擬出來的結(jié)果,或多或少會存在著一定的誤差,那么對這種誤差水平的度量就顯得尤為重要。
特別是對于X1i與X2i的參數(shù)的估計,其改變直接決定了Yi的變化的方向以及程度。
在這里,我們運用統(tǒng)計學(xué)上的假設(shè)檢驗與置信區(qū)間估計的方式,判斷我們有多大的信心,或者說有多大的概率,該參數(shù)可以滿足我們的要求,從而對我們的決策活動形成指導(dǎo)意義。
見下圖:
如上圖所示,該圖為用統(tǒng)計軟件所得出的上式的相關(guān)統(tǒng)計學(xué)分析,可以看出上式的R2(R-squared)為0.934,并且調(diào)整后的R2(Adj R-squared)為0.890,說明該式的所有系數(shù),作為一個整體,對Yi具有較好的解釋力度。
其中ESS(Explained Sum of Squared)為模型模擬出的曲線與平均值的差的平方和,而SSR(Squared Sum of Residual)為真實點與估計點的差的平方和。
Matlab圖示如下:
上圖是通過最小二乘法擬合出來的一條回歸曲線,其中藍(lán)色的點與實線之間的距離的平方和即為SSR,而實線與所有實際點的均值之間的距離的平方和即為ESS。
R2=ESS/(ESS+SSR)。
由圖6-1還可以看到,2.057所處的95%置信區(qū)間范圍為0.984-3.130。
其中,P值與t統(tǒng)計量用來判斷在95%的把握下,是否可以拒絕一項參數(shù),即判斷該參數(shù)在一定概率條件下的真假情況。
我們通?梢酝ㄟ^查對應(yīng)的t分布表來找到對應(yīng)的關(guān)鍵值,或者采用比較p值大小的方式進行判斷。
比如說,要判斷圖6-1中Experience的參數(shù)2.008在95%的概率條件下的合理性,我們計算出其t統(tǒng)計量如圖上的2.664,而對應(yīng)的置信區(qū)間范圍中包括了2.664這個值,因此我們可以得出如下結(jié)論:Experience的系數(shù)2.008在95%的置信水平下是無法拒絕的。
這一結(jié)論同樣可以通過判斷p值的大小得出,p值為0.076,大于顯著性水平0.05(通過1-95%得到),因此有足夠的自信可以保證該系數(shù)的合理性。
通過上述方法,我們可以對之前模擬出的收益率方程的系數(shù)的合理性做出判斷與評估,使我們對其有一個更為深入的了解。
2.7 基于蒙特卡洛模擬的風(fēng)險控制。
在風(fēng)險管理領(lǐng)域,VaR方法一直在各大金融機構(gòu)被視為進行風(fēng)險度量的首選,因為其可以提供在一定的置信區(qū)間下所發(fā)生的最大損失的大小。
然而,實踐證明,在市場出現(xiàn)劇烈波動的情況下(比如2007-2009的金融危機),資產(chǎn)之間的相關(guān)性會增強,以前可能相關(guān)性很弱的資產(chǎn)在市場不穩(wěn)定時期出現(xiàn)了高度關(guān)聯(lián)的相關(guān)性。
而普通的線性估算VaR的方法在金融危機期間,對于風(fēng)險的度量不再準(zhǔn)確與合理。
因此,出現(xiàn)了后來的情景分析方法(scenario analysis )以及這里要討論的蒙特卡洛模擬。
所謂蒙特卡洛模擬,是對一項資產(chǎn)的所有可能取值進行隨機數(shù)模擬,來計算產(chǎn)品的價格以及計算風(fēng)險價值的大小。
其應(yīng)用領(lǐng)域十分廣泛,不僅可以用來模擬復(fù)雜金融產(chǎn)品的價格(例如,含權(quán)債券的定價、住房抵押貸款證券化產(chǎn)品的定價),在風(fēng)險管理領(lǐng)域還可以用來度量風(fēng)險的大小。
在此,我們給出詳細(xì)的解釋,來說明怎樣進行基于蒙特卡洛模擬的風(fēng)險的度量。
重復(fù)上述代碼四次,模擬出不同收益率的圖形,每次模擬都可以得到一條收益率的曲線,當(dāng)我們從股票收益率的總體曲線中隨機抽出N個樣本的收益率曲線,對其進行算術(shù)平均,便可以得到最終模擬出的收益率曲線,通過正態(tài)分布或?qū)?shù)正態(tài)分布作圖,我們可以在豎直方向上做出一條輔助線,該輔助線對應(yīng)的分位點即是VaR所處的位置,如此一來我們便可以得到VaR的結(jié)果。
第四部分:模型的改進與實時更新
2.8 模型評價
在這一部分,我們主要對上述建立的收益風(fēng)險模型進行評價,包括引進一些至關(guān)重要的績效評估指標(biāo),例如夏普比率,特雷諾比率,簡森阿爾法,信息比率,索提諾指標(biāo)等。
夏普比率來自于CAPM模型,其基本內(nèi)涵是單位風(fēng)險所對應(yīng)的超額收益。
在CAPM模型中,夏普比率即是資本市場線的斜率。
因此,對于一個組合的風(fēng)險收益的評估,我們可以通過計算其夏普比率,再與其他組合比較,選出夏普比率最大的那一個,即是我們滿意的組合(單位風(fēng)險承擔(dān)了更多的超額收益)。
特雷諾比率與夏普比率類似,但其分母上所對應(yīng)的是系統(tǒng)性風(fēng)險,而不是總風(fēng)險。
這反應(yīng)了一項組合其內(nèi)在的超額收益,因為非系統(tǒng)性風(fēng)險是可以通過組合規(guī)避掉的,而系統(tǒng)性風(fēng)險則更多的由市場、行業(yè)以及經(jīng)濟周期等不可控因素所決定。
因此,特雷諾比率也被廣泛應(yīng)用于組合績效的評估。
簡森阿爾法描述的是一項組合的市場收益與CAPM計算出的理論收益之間的差額。
在CAPM圖形上描述出來便是資本市場線上的點與實際的點之間的距離。
簡森阿爾法直接反應(yīng)了一項組合的收益與其理論收益的偏差,因此投資者可以進行無風(fēng)險的套利交易,低買高賣,賺取超額收益。
值得一提的是,用簡森阿爾法來描述兩個組合的風(fēng)險收益時,要求兩個組合的系統(tǒng)性風(fēng)險處于同一水平,即CAPM模型中的β相同。
特雷諾比率將系統(tǒng)性風(fēng)險單位化,因此可以直接進行比較,這是簡森阿爾法與特雷諾比率之間的區(qū)別。
信息比率也是實際工作中用到的比較多的領(lǐng)域,通常會和夏普比率搭配使用。
信息比率的計算公式為:信息比率=超額收益/跟蹤誤差。
索提諾指標(biāo)的計算公式為:索提諾指標(biāo)=(組合收益-最小收益)/下半方差,其中下半方差只考慮風(fēng)險的影響,因為價格上漲的風(fēng)險可以不考慮,只考慮下跌的風(fēng)險。
2.9 利用matlab動態(tài)更新參數(shù)
上述建立的多因素模型的參數(shù)一般會隨著市場條件的變化而發(fā)生變化,例如金融危機期間,金融產(chǎn)品之間的相關(guān)性增強,可能會使得參數(shù)的估計不再準(zhǔn)確。
因此,我們需要通過不斷的測算市場數(shù)據(jù),來保證模型參數(shù)的合理性。
在matlab中不斷更新改進參數(shù)的步驟是不能省略的。
2.10 回溯測試
在完成了模型的構(gòu)建以后,我們通常會進行一段時間的回溯測試期,目的是為了對模型的合理性進行檢驗。
即采用從市場上觀察得到的數(shù)據(jù),與模型估計出的數(shù)據(jù)進行比較。
這是回溯測試的主要思想。
通常在一些交易平臺上我們可以進行回溯測試。
Matlab平臺上也為我們提供了相關(guān)的回測計算的功能,目的是盡可能地還原市場的真實情況,以檢測策略的準(zhǔn)確性。
2.11 模型評價
已上便是筆者構(gòu)建的投資策略的基本框架與內(nèi)容,按照上文指導(dǎo)的內(nèi)容進行投資,可以在一定程度上獲取超額收益。
量化的方法相比較傳統(tǒng)的基本面分析、技術(shù)分析,具有其自身的合理性。
然而量化投資并不是時時刻刻百分百有效,但根據(jù)歷史經(jīng)驗來看,量化投資的收益已經(jīng)遠(yuǎn)超其他投資方式。
量化投資還具有更為高深的理論,例如結(jié)合了心理學(xué)、生物學(xué)與計算機科學(xué)的神經(jīng)網(wǎng)絡(luò)、遺傳算法等,使用機器代替人腦進行投資決策,這樣可以減少人的主觀性,客觀的根據(jù)一些標(biāo)準(zhǔn)、指標(biāo)嚴(yán)格執(zhí)行投資策略。
這里只是使用了量化投資領(lǐng)域中的冰山一角,即使用綜合模型評分方法來構(gòu)建投資組合的預(yù)期收益。
然而,該模型仍有其自身的局限性。
例如,模型本身采用的是線性回歸的基本思想,即最高次冪為1次冪。
然而在現(xiàn)實過程中,很多金融產(chǎn)品的收益曲線并不是一條嚴(yán)格的直線,而更多的是具有二階導(dǎo)的曲線。
舉例如下圖所示:
上圖是包含了期權(quán)時間價值在內(nèi)的利潤圖,可以看到,在引進期權(quán)的時間價值以后,其圖形不再是直線,而是帶有弧度。
因此,我們通常采用的方法是利用泰勒級數(shù)進行估計,引入二階導(dǎo)來進一步估計金融產(chǎn)品的價格。
例如在債券中一階導(dǎo)采用久期進行計算,二階導(dǎo)采用凸性進行調(diào)整。
因此,針對本篇策略報告的模型,我們可以采用類似的方法,引入二階導(dǎo)來進行估計。
這一點可以通過matlab不斷擬合收益率的曲線來進一步精確估計收益率未來的變化趨勢。
然而,與蒙特卡洛模擬類似,這需要相當(dāng)大的計算量。
我們通常會采用樣本大小與時間的平方根的乘積來衡量最有效率的估計方式。
3 結(jié)束語
通過以上的分析,我們可以得出一套利用量化的手段模擬股票的收益率的曲線,進而實現(xiàn)我們的投資思想。
筆者從多因素模型入手,首先找影響單個公司特定的因素,通過篩選找出合適的,具有關(guān)鍵影響的主要因素。
具體通過matlab方法實現(xiàn)關(guān)鍵因素的選取。
在此之后,我們需要特別關(guān)注因子之間是否存在相關(guān)性,即多重共線性。
使用matlab找出并消除這種關(guān)系后,我們建立多因素回歸模型。
在此基礎(chǔ)上,我們運用統(tǒng)計學(xué)中的假設(shè)檢驗與置信區(qū)間估計的方法,對多因素回歸模型的相關(guān)參數(shù)的合理性做出說明。
并使用蒙特卡洛模擬方法,描述出組合的風(fēng)險大小。
特別是在市場劇烈波動的時候,可以很好地避免普通的線性VaR方法所帶來的低估風(fēng)險的問題。
最后,我們采用一系列的績效評估指標(biāo),來衡量對應(yīng)一定風(fēng)險的收益水平的大小。
使用回溯測試進行模型合理性的判斷,并給出相應(yīng)的解釋。
如此一來,便完成了這套投資策略的設(shè)計與分析。
【量化投資論文】相關(guān)文章:
證券投資風(fēng)險論文10-09
投資管理論文10-01
組合投資模型的優(yōu)化論文10-08
高職院校職稱量化評審模式的探索與實踐論文10-08
個人量化的方案03-24
量化簡歷10-09