- 相關推薦
量化投資論文
基于量化投資角度的多因素模型投資綜合策略報告
1 研究方法
本篇報告的量化投資策略主要采用的方法與理論有以下幾種:1、線性回歸。
2、多因素模型。
3、CAPM(資本資產定價模型)。
4、假設檢驗與置信區間估計。
5、蒙特卡洛模擬。
6、VaR(風險價值)方法。
7、Matlab(矩陣實驗室,用于數據的處理與圖形的分析)技術。
主體內容主要分為四大部分。
第一部分為模型建立階段,主要是挑選影響股票收益率的相關因素。
第二部分主要是挑選出收益率排名前20%的股票,并運用CAPM模型進行組合搭配,以求降低非系統性風險,最大化股票的收益。
第三部分采用統計學的知識,對上述建立的模型的相關參數進行范圍上與概率上的估計。
并采用VaR方法與蒙特卡洛模擬,進行風險的評估與控制,并運用多種評估績效的方式(夏普比率、特雷諾比率、簡森阿爾法等指標),對股票的風險與收益做出客觀的評判。
第四部分為模型的評價階段,即由宏觀到微觀對該模型做出全面的解釋。
與此同時,運用matlab技術對參數進行適當的動態更新,使其盡量符合市場的波動情況,并進行回溯測試,用市場的實際結果來解釋模型的合理之處。
2 策略步驟
第一部分:模型建立階段。
2.1 影響收益率的因子初選
我們采用以下收益率因子。
以上表格反映了影響收益率的主要四大類因子,較好地包括了影響收益率的主要因素。
雖然從宏觀層面上我們挑選出了一些影響收益率的主要因子,然而,在現實過程中,影響某個具體公司收益率的因素很可能只是其中某幾個。
因此,我們應當試圖找出影響每個股票的收益率的個別關鍵因素,這里我們采用matlab技術以及線性回歸的方法,以融捷股份(002192)與暴風科技(300431)為例進行說明。
筆者根據深圳證券交易所統計的數據通過EXCEL表格進行合并整理后得到融捷股份的收益率數據,將該數據導入matlab中,以市盈率為橫軸、收益率為縱軸,建立圖形關系。
根據統計學的知識可知,我們用決定系數R2來反應自變量解釋因變量力度的強弱,而決定系數與相關系數之間存在平方關系,即ρ2=R2。
因此,在matlab中我們通過計算一組數據之間的相關系數,反求出其決定系數,從而說明該特定自變量能從多大程度上解釋因變量。
代碼運行的結果如下:
從上述運行結果可知,市盈率與股票收益率之間的R2只有0.0934,遠小于1,因此市盈率這一項指標在融捷股份里并不能對收益率的變動起到決定性作用。
類似地,我們對表1-1中所有的因子進行相同的操作方法,在此由于篇幅原因不再贅述,僅展示操作步驟與過程。
2.2 剔除冗余因子
在進行上述步驟的過程中,值得一提的是,各個因子之間可能本身就具有一定的相關性。
比如,ROE指標與ROA指標本身就滿足一個等式:ROE=ROA*EM, 其中EM為權益乘數,計算公式為EM=1/(1-負債率)。
如果因素之間的相關性甚小,我們可以忽略不計,但是當相關性大到一定程度時,便會對之后的多因素模型分析過程產生誤導,因此在這里我們需要補充的一步是利用matlab軟件,建立不同指標之間的關系方程,判斷是否存在多重共線性。
2.3 多因素模型體系的建立
在進行完影響收益率的因子選擇以及剔除完冗余因子之后,便是最為重要的建立綜合評分體系,將所有的因子共同反映到一個方程中,用來解釋股票收益率與因子之間的具體變化。
多因素模型的建立過程分為如下幾個步驟:
(1). 標準化原始數據
(2). 建立相關性矩陣
(3). 計算相關性矩陣的特征值和特征向量
(4). 得出總方程表達式
通過對上述運行結果的分析我們可以看出,月最大超額收益的影響最大,而累計收益的影響最小。
這樣,我們便量化出了影響該股票收益率的方程式。
第二部分:交易標的股票的選取
2.4 選取收益率前20%的股票
通過第一部分的論述,我們最終可以得到影響不同公司股票收益率的方程式,可以用matlab或者數據庫技術進行保存,當需要更新參數或者進行預測決策時,調用相關函數即可。
在第二部分中,我們將選取的標的股票資產池的相關數據輸入到方程式中,即可得到未來一段時間的預期收益率。
假設我們從每個板塊中選取出了20支股票,我們保留預期收益率排在前20%的股票,優中選優,盡量最大化我們的收益。
2.5 利用CAPM模型進行資產組合
20世紀誕生的資本資產定價模型(CAPM)為廣大投資者選擇資產組合提供了良好的理論基礎與依據。
威廉夏普(William F. Sharpe,1934-)與馬克維茨(Harry M. Markowitz)等人所建立的組合管理理論核心即為以下等式:
E(Rn)=Rf+β(E(Rm)-Rf)
其中,E(Rn)為股票的預期收益率,Rf為無風險利率,β為單個股票與市場之間的相關性,E(Rm)為某一基準的收益率。
通過該理論,我們可以建立多個資產的不同搭配情況。
在第三部分,我們會進一步討論運用各項績效評估指標,來權衡風險與收益。
第三部分:風險控制
2.6 對各項參數進行區間估計和假設檢驗。
前兩部分重點關注了組合的收益情況,力求在市場處于無效或弱有效的情況下,取得超越市場的收益率。
然而,對風險的把握仍為非常重要的方面,自從2007-2009年間發生的金融災難以后,人們對于風險控制的意識又提高到一個新的水平。
下面具體介紹如何利用統計學知識,對風險以及收益的取值范圍做出評估與估計。
假設由第一部分模擬出的收益率方程滿足如下等式:
Yi = -4.451 +2.057 * X1i + 2.008 * X2i
我們可以看到,在這個等式中出現了三個參數,分別是截距項-4.451、X1i的系數2.057以及X2i的系數2.008。
然而,這畢竟是模擬出來的結果,或多或少會存在著一定的誤差,那么對這種誤差水平的度量就顯得尤為重要。
特別是對于X1i與X2i的參數的估計,其改變直接決定了Yi的變化的方向以及程度。
在這里,我們運用統計學上的假設檢驗與置信區間估計的方式,判斷我們有多大的信心,或者說有多大的概率,該參數可以滿足我們的要求,從而對我們的決策活動形成指導意義。
見下圖:
如上圖所示,該圖為用統計軟件所得出的上式的相關統計學分析,可以看出上式的R2(R-squared)為0.934,并且調整后的R2(Adj R-squared)為0.890,說明該式的所有系數,作為一個整體,對Yi具有較好的解釋力度。
其中ESS(Explained Sum of Squared)為模型模擬出的曲線與平均值的差的平方和,而SSR(Squared Sum of Residual)為真實點與估計點的差的平方和。
Matlab圖示如下:
上圖是通過最小二乘法擬合出來的一條回歸曲線,其中藍色的點與實線之間的距離的平方和即為SSR,而實線與所有實際點的均值之間的距離的平方和即為ESS。
R2=ESS/(ESS+SSR)。
由圖6-1還可以看到,2.057所處的95%置信區間范圍為0.984-3.130。
其中,P值與t統計量用來判斷在95%的把握下,是否可以拒絕一項參數,即判斷該參數在一定概率條件下的真假情況。
我們通常可以通過查對應的t分布表來找到對應的關鍵值,或者采用比較p值大小的方式進行判斷。
比如說,要判斷圖6-1中Experience的參數2.008在95%的概率條件下的合理性,我們計算出其t統計量如圖上的2.664,而對應的置信區間范圍中包括了2.664這個值,因此我們可以得出如下結論:Experience的系數2.008在95%的置信水平下是無法拒絕的。
這一結論同樣可以通過判斷p值的大小得出,p值為0.076,大于顯著性水平0.05(通過1-95%得到),因此有足夠的自信可以保證該系數的合理性。
通過上述方法,我們可以對之前模擬出的收益率方程的系數的合理性做出判斷與評估,使我們對其有一個更為深入的了解。
2.7 基于蒙特卡洛模擬的風險控制。
在風險管理領域,VaR方法一直在各大金融機構被視為進行風險度量的首選,因為其可以提供在一定的置信區間下所發生的最大損失的大小。
然而,實踐證明,在市場出現劇烈波動的情況下(比如2007-2009的金融危機),資產之間的相關性會增強,以前可能相關性很弱的資產在市場不穩定時期出現了高度關聯的相關性。
而普通的線性估算VaR的方法在金融危機期間,對于風險的度量不再準確與合理。
因此,出現了后來的情景分析方法(scenario analysis )以及這里要討論的蒙特卡洛模擬。
所謂蒙特卡洛模擬,是對一項資產的所有可能取值進行隨機數模擬,來計算產品的價格以及計算風險價值的大小。
其應用領域十分廣泛,不僅可以用來模擬復雜金融產品的價格(例如,含權債券的定價、住房抵押貸款證券化產品的定價),在風險管理領域還可以用來度量風險的大小。
在此,我們給出詳細的解釋,來說明怎樣進行基于蒙特卡洛模擬的風險的度量。
重復上述代碼四次,模擬出不同收益率的圖形,每次模擬都可以得到一條收益率的曲線,當我們從股票收益率的總體曲線中隨機抽出N個樣本的收益率曲線,對其進行算術平均,便可以得到最終模擬出的收益率曲線,通過正態分布或對數正態分布作圖,我們可以在豎直方向上做出一條輔助線,該輔助線對應的分位點即是VaR所處的位置,如此一來我們便可以得到VaR的結果。
第四部分:模型的改進與實時更新
2.8 模型評價
在這一部分,我們主要對上述建立的收益風險模型進行評價,包括引進一些至關重要的績效評估指標,例如夏普比率,特雷諾比率,簡森阿爾法,信息比率,索提諾指標等。
夏普比率來自于CAPM模型,其基本內涵是單位風險所對應的超額收益。
在CAPM模型中,夏普比率即是資本市場線的斜率。
因此,對于一個組合的風險收益的評估,我們可以通過計算其夏普比率,再與其他組合比較,選出夏普比率最大的那一個,即是我們滿意的組合(單位風險承擔了更多的超額收益)。
特雷諾比率與夏普比率類似,但其分母上所對應的是系統性風險,而不是總風險。
這反應了一項組合其內在的超額收益,因為非系統性風險是可以通過組合規避掉的,而系統性風險則更多的由市場、行業以及經濟周期等不可控因素所決定。
因此,特雷諾比率也被廣泛應用于組合績效的評估。
簡森阿爾法描述的是一項組合的市場收益與CAPM計算出的理論收益之間的差額。
在CAPM圖形上描述出來便是資本市場線上的點與實際的點之間的距離。
簡森阿爾法直接反應了一項組合的收益與其理論收益的偏差,因此投資者可以進行無風險的套利交易,低買高賣,賺取超額收益。
值得一提的是,用簡森阿爾法來描述兩個組合的風險收益時,要求兩個組合的系統性風險處于同一水平,即CAPM模型中的β相同。
特雷諾比率將系統性風險單位化,因此可以直接進行比較,這是簡森阿爾法與特雷諾比率之間的區別。
信息比率也是實際工作中用到的比較多的領域,通常會和夏普比率搭配使用。
信息比率的計算公式為:信息比率=超額收益/跟蹤誤差。
索提諾指標的計算公式為:索提諾指標=(組合收益-最小收益)/下半方差,其中下半方差只考慮風險的影響,因為價格上漲的風險可以不考慮,只考慮下跌的風險。
2.9 利用matlab動態更新參數
上述建立的多因素模型的參數一般會隨著市場條件的變化而發生變化,例如金融危機期間,金融產品之間的相關性增強,可能會使得參數的估計不再準確。
因此,我們需要通過不斷的測算市場數據,來保證模型參數的合理性。
在matlab中不斷更新改進參數的步驟是不能省略的。
2.10 回溯測試
在完成了模型的構建以后,我們通常會進行一段時間的回溯測試期,目的是為了對模型的合理性進行檢驗。
即采用從市場上觀察得到的數據,與模型估計出的數據進行比較。
這是回溯測試的主要思想。
通常在一些交易平臺上我們可以進行回溯測試。
Matlab平臺上也為我們提供了相關的回測計算的功能,目的是盡可能地還原市場的真實情況,以檢測策略的準確性。
2.11 模型評價
已上便是筆者構建的投資策略的基本框架與內容,按照上文指導的內容進行投資,可以在一定程度上獲取超額收益。
量化的方法相比較傳統的基本面分析、技術分析,具有其自身的合理性。
然而量化投資并不是時時刻刻百分百有效,但根據歷史經驗來看,量化投資的收益已經遠超其他投資方式。
量化投資還具有更為高深的理論,例如結合了心理學、生物學與計算機科學的神經網絡、遺傳算法等,使用機器代替人腦進行投資決策,這樣可以減少人的主觀性,客觀的根據一些標準、指標嚴格執行投資策略。
這里只是使用了量化投資領域中的冰山一角,即使用綜合模型評分方法來構建投資組合的預期收益。
然而,該模型仍有其自身的局限性。
例如,模型本身采用的是線性回歸的基本思想,即最高次冪為1次冪。
然而在現實過程中,很多金融產品的收益曲線并不是一條嚴格的直線,而更多的是具有二階導的曲線。
舉例如下圖所示:
上圖是包含了期權時間價值在內的利潤圖,可以看到,在引進期權的時間價值以后,其圖形不再是直線,而是帶有弧度。
因此,我們通常采用的方法是利用泰勒級數進行估計,引入二階導來進一步估計金融產品的價格。
例如在債券中一階導采用久期進行計算,二階導采用凸性進行調整。
因此,針對本篇策略報告的模型,我們可以采用類似的方法,引入二階導來進行估計。
這一點可以通過matlab不斷擬合收益率的曲線來進一步精確估計收益率未來的變化趨勢。
然而,與蒙特卡洛模擬類似,這需要相當大的計算量。
我們通常會采用樣本大小與時間的平方根的乘積來衡量最有效率的估計方式。
3 結束語
通過以上的分析,我們可以得出一套利用量化的手段模擬股票的收益率的曲線,進而實現我們的投資思想。
筆者從多因素模型入手,首先找影響單個公司特定的因素,通過篩選找出合適的,具有關鍵影響的主要因素。
具體通過matlab方法實現關鍵因素的選取。
在此之后,我們需要特別關注因子之間是否存在相關性,即多重共線性。
使用matlab找出并消除這種關系后,我們建立多因素回歸模型。
在此基礎上,我們運用統計學中的假設檢驗與置信區間估計的方法,對多因素回歸模型的相關參數的合理性做出說明。
并使用蒙特卡洛模擬方法,描述出組合的風險大小。
特別是在市場劇烈波動的時候,可以很好地避免普通的線性VaR方法所帶來的低估風險的問題。
最后,我們采用一系列的績效評估指標,來衡量對應一定風險的收益水平的大小。
使用回溯測試進行模型合理性的判斷,并給出相應的解釋。
如此一來,便完成了這套投資策略的設計與分析。
【量化投資論文】相關文章:
證券投資風險論文10-09
投資管理論文10-01
組合投資模型的優化論文10-08
高職院校職稱量化評審模式的探索與實踐論文10-08
新西蘭投資法律規定與中新投資合作論文10-02
個人量化的方案03-24
量化簡歷10-09