1000部丰满熟女富婆视频,托着奶头喂男人吃奶,厨房挺进朋友人妻,成 人 免费 黄 色 网站无毒下载

首頁 > 文章中心 > 參數估計

參數估計

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇參數估計范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

參數估計范文第1篇

Abstract: The non-parametric methodis a branch of probability statistics. Kernel density estimation will appear the boundary effect when estimating border region. This article proved the strong consistency of the given non-parametric condition kernel density estimation h■■(m,n).

關鍵詞:非參數估計;Copula函數密度;條件核密度估計

Key words: non-parametric estimation;Copula function density;conditions kernel density estimation

中圖分類號:F830 文獻標識碼:A 文章編號:1006-4311(2015)25-0214-02

0 引言

本文根據核密度估計方法不利于和有關數據分布的先驗知識,因此將一些數據分布不增設其他的假設,那就是一些從基本數據樣本本身出面來研究數據分布估算特征的辦法,經過對核密度估計變化系數進行加權處理,就應該建立不同的風險投資價值的假設模型。參數估計一般應該分成參數回歸分析法和參數判別分析法。為了解釋此個問題的現有的方法含有參數估計法和非參數估計法,對參數回歸一系列的分析中。

1 首先來了解非參數估計

非參數方法是概率統計學的一個分支,通常在一個統計課題中,如果確定或者假定了全體分布的清晰形式,并且其中含有一系列參數,要從來自全體的樣本對這些參數做出的一系列估算或進行某種形式的假定檢測,這種推理的方法稱為非參數方法。

連續型隨機變量的概率密度函數有如下性質:如果概率密度函數h(x)在一點x上連續,那么累積分布函數可導,并且它的導數,由于隨機變量x的取值,只取決于概率密度函數的積分,所以概率密度函數在個別點上的取值并不會影響隨機變量的表現。更準確來說,如果一個函數和x的概率密度函數取值不同的點只有有限個、可數無限個或者相對于整個實數軸來說測度為0,那么這個函數也可以是概率密度函數。函數型數據統計分析方式是近幾年才開始發展起來的,它涉及到很多學科,比如分類學、醫學、生物力學等,是在這些學科的基礎上結合非參數統計推斷理論、方法與應用研究形成的。并且因為這些學科中常常會用到大量的函數型數據,所以函數型數據統計分析方法也得到了廣泛關注和應用。(應用了連續型隨機變量的概率密度函數定義)

連續型的隨機變量取值在任意一點的概率都是0。作為推論,連續型隨機變量在區間上取值的概率與這個區間是開區間還是閉區間無關。要注意的是,概率L{x=a}=0,但{x=a}并不是不可能事件。非參數估計的目的就是在一定條件下,估計未知密度函數h(x)。對于一維實隨機變量x,設它的累積分布函數是h(x)。如果存在可測函數h(x),滿足:①f(x)?叟0;②■f(x)dx=1;③P(a

2 再來了解Copula密度函數

Copula函數解釋的是變量空間的一般相關性問題,現實上是一種將聯合分布函數與本身的各自邊緣分布函數相連在一起的密度函數,所以我們還將它稱為連接函數。上個世紀九十年代中后期的相關理論和解決方法已經在其他國家開始得到快速發展并且還應用到金融、醫藥等領域的相關分析、投資組合分析和風險投資管理等方方面面。在某些參數判別分析里面,一般需要假定認為辨別依據的、隨機取樣的數據樣本在很多機會的類別中都配成特定的分布。實踐表明,參數模型的這種基本設定和真實的物理空間模型之間存在的差別并不大,但是由此方法得到的結論卻與現實相距甚遠,這是因為密度估計方法不利于有關數據分布的先驗知識,所以一些數據分布不增設其他的假設時,其結果很難令人滿意。

通過了解知道Copula函數是兩個邊緣分布的連接函數,因此得出Copula函數的條件密度就是聯合密度函數,在這種情況下需創新傳統的估計方法,選用條件密度來估計隨機變量間的相輔結構,在非參數核密度估計方法里面,條件概率密度核估計才是一整套相對比較完善的理論,因此將條件核密度估計理論在Copula函數的估計中進行應用,就可以得出在預定值超出所有知道的Copula類時刻對這種相依結構的非參數估計。

3 最后來了解條件核密度估計法

核密度估計方法在估計邊界區域的時候會出現一般的邊界效應。經過對核密度估計變化系數進行加權處理,就應該建立不同的風險投資價值的假設模型。參數估計一般應該分成參數回歸分析法和參數判別分析法。

通過給定的集合樣本點來分析隨機變量的分布密度問題的函數是概率統計學的一個基礎課題之一。解釋此問題的現有方法包括參數估計法和非參數估計法。對參數回歸一系列的分析中,通常來設定數據分布符合某些給定的特定的形態,比如可化線性分析、線性分析等,再次在目標函數中追尋一固定的解,那就是確定回歸模型中的未知參數值。

假定聯合隨機變量(X,Y),其中(Xi,Yi),i=1,2,3…,備有一定的聯合密度f(x,y)的Kp×Kq上各自單獨分布的樣本點,g(φ)是X的密度邊緣,h(y│x)=■為給定X=x時Y的條件密度。令R1,R2分別是Kp及Kq上的核函數,{an},{bn}為可以設計的一個序列。h(y│x)的雙重核估計定義為:hn(y│x)=■。

設(X,Y)的布局為δ,δ的著力點為D。X,Y的邊緣分布分別為δ1,δ2,對應的著力點為D1,D2。對于任意的x=(x1,…,xp)∈Kp,y=(y1,…,yp)∈Kq,a>0,b>0,假定R1,R2,

an(x),bn(y)符合下面條件:R1,R2分別是Kp及Kq上的有邊界概率密度邊緣函數;R1,R2可積;Kp及Kq著力點有界;對與任何一個Kp中緊集H1和Kq中緊集H2,有■a■(x)0,a.s當n∞,■b■(y)0,a.s當n∞,對任意Kp中緊集H1和Kq中緊集H2,■a■(x)0,a.s當n∞,■b■(y)0,a.s當n∞,inf■∞,a.s當n∞,對于所有一切正整數n,x1,x2∈Kp,y1,y2∈Kq及所有的樣本點(X1,Y1),…(Xn,Yn)皆成立。

從實際應用情況可以了解,按照給予的估計數量的不益的地方在于,窗寬{an},{bn}的給定應該重新再估算過。從歷史上來看,這種理論已經得到了實踐,且得到了廣泛應用,查閱很多相關的已發表的論文或者著作,發現在大多數情況下窗寬都是常數的形式,因此在實際的應用過程中,若對窗寬進行限制,會存在很多不便的地方,那些窗寬不為常數的情況,最突出的情況就是1965年提出的“最近鄰估計”,形同的估計在案例里也有很多的出現。

另知DEVROYE曾經出現過“自動選擇窗寬”的核估計一般概念,那就是說窗寬基本由樣本來給定,不過其研討那窗寬與基于異議的(x,y)的位置相異,這些在實際運用上基本不能適應,按照(x,y)的地理位置不定相同,窗寬適宜區別很大。因此我在此文章中采用隨機窗寬an(x)=an(x,X1,…,Xn),bn(y)=bn(y,Y1,…,Yn),把其中an,bn的區別代替以an(x),bn(y)作為h(y│x)的新估計,但是還是記為hn(y│x)。

這個時候所以就要重點看待的是,當M,N是[0,1]×[0,1]上的隨機變量h■■(m,n)應該在此區域內的不定積分不一定等于1,為什么這樣說,這是因為在選取不同的核函數是有一定的關系,所以這樣了就與分布函數的概念自相產生了矛盾,因此為了解決這個疑問,所以就這個估算值必須重新來個標準,所以就標為h■■(m,n),假定

h■■(m,n)= 0,m?埸[0,1],n?埸[0,1]■,m∈[0,1],n∈[0,1]

所以h■■(m,n)為[0,1]×[0,1]上的密度函數,通過以下來假定一下h■■(m,n)與h■■(m,n)以及h(m,n)三者之間的函數關系。令m,n為[0,1]上的隨機變量,其條件分布函數記為h(m│n),其聯合密度為f(m,n),邊緣密度為g(m),其中f(m,n),g(m)一致連續,inf g(m)>0,h■■(m,n)為h(n│m)的近鄰估計,h■■(m,n),那么當n∞時,

■h■■(m,n)-h■■(m,n)0,a.s。因為聯合密度函Copula函數等于其條件密度函數,因此就有■h■■(m│n)-h■■(m│n)0,a.s。

通過已知條件可以知道f(m,n)是一致連續,故f(m,n)有界,即?堝U′>0使得f(m,n)0,g(m)是一致的連續性,故?堝U>0,可以讓■0,使得h(m│n)

?堝N1,當n>N1時有以下式子成立:f■■(v│u)N2時可以有如下不等式成立:

H(1,1)-?諄-F(0,0)-?諄

所以當n∞時,就有Hn(1,1)-Hn(0,0)1,a.s。因此suph■■(n│m)-h■■(n│m)=■■-h■■(n│m)=■(■-1)h■■(n│m)?燮(■-1)(U-?諄),a.s。

通過上式可以知道,當n∞時,即■h■■(n│m)-h■■(n│m)0,a.s。

所以■h■■(m,n)-h■■(m,n)0,a.s。

從上面可以看出來,已經證明了一切的非參數條件核密度估計h■■(m,n)的一致強相合性與關聯。

4 結論

對參數回歸一系列的分析中,一般先來設定數據分布符合某些給定的特定的性態,再次在目標函數中追尋一固定的解,那就是確定回歸模型中的未知參數值。在選取不同的核函數是有一定的關系,所以這樣了就與分布函數的概念自相產生了矛盾,因此為了解決這個疑問,所以就這個估算值必須重新來個標準,證明了一切的非參數條件核密度估計h■■(m,n)的一致強相合性與關聯。

參考文獻:

[1]趙凱鴿,袁永生,吳清嬌.基于Copula理論和非參數極值估計在上下游水位的相關性分析應用[J].江南大學學報(自然科學版),2015-04-28.

[2]孔繁利.金融市場風險的度量――基于極值理論和Copula的應用研究[D].吉林大學博士論文,2006-04-01.

[3]陳江平,黃炳堅.數據空間自相關性對關聯規則的挖掘與實驗分析[J].地球信息科學學報,2011(1).

參數估計范文第2篇

關鍵詞:生長曲線,參數估計,伴隨同化

 

0 引言

生長曲線(Logistic curve)也稱S曲線,它是描述單一種群空間約束的生長過程曲線。其特點是開始生長較為緩慢,以后隨著某些條件的變化,在某一段時間內增長速度較快,當達到某一界限之后,生長速度又趨于緩慢,以至最后停止增長,生長曲線的特征決定了其在生命科學領域中的廣泛應用。論文大全。目前,生長曲線在其他領域中也得到廣泛應用。例如向前忠將生長曲線模型用于高速公路誘增交通量預測,王吉權等將生長曲線用于電力負荷預測中。生長曲線的一般形式為

(1)

這里是某物種數量,、、是三個參數,應用時通常需要識別。參數識別是生長曲線

模型應用的前提,目前已有一些研究結果。如果令,,,則是如下方程的解

(2)

通常已知,于是只需要識別參數和,方程式(2)即為著名的Logistic模型。這里利用伴隨同化方法對生長曲線的參數進行識別,同時將該方法用于文獻[1]和美國1790-1950年人口數據。

1伴隨同化參數識別方法

令為的觀測,定義代價函數

(3)

這里為權重,為觀測算子,為研究區間。代價函數是度量觀測與模型解之間的距離函數,它反映在區間上與的擬合程度。于是模型參數識別問題就轉換為以(2)為約束,以(3)目標函數的約束的極小值問題

(4)

構造拉格朗日函數

(5)

這里為的伴隨變量。依據取極值的條件,容易得到滿足

(6)

方程(6)稱為方程(2)的伴隨方程,需要逆向求解。依據(5)可計算代價函數關于模型參數的梯度

(7)

為方便,記

,(8)

于是可對模型參數進行校正

(9)

從而達到識別模型參數的目的。通常采用差分方法數值求解(2)和(6),這里采用精度較高的4階Rounge-Kutta方法,但要注意(6)要逆向求解。歸納起來利用伴隨同化方法識別生長曲線參數的步驟如下:

1) 正向積分方程 (2);

2) 逆向積分方程 (6);

3) 計算梯度和代價函數;

4) 調整參數,為步長;

5) 如果則迭代終止(為事先給定的迭代終止參數),否則轉(1)。

2 數值實驗

2.1 基于文獻[1-2]數據的數值實驗

由文獻[1-2]可知,某種大豆的葉面指數y(t)與生育日數t的關系如表1的第一行和第2行。第3行為本文的結果,第4行為文獻[2]的結果。通過表1可看出,本文方法可以較好地識別出參數值,本文得到生長曲線

(10)

表1 數值實驗結果

參數估計范文第3篇

Abstract: In recent years, the research of the semi-parametric regression model which is a potentially tool for dealing with the regression has attracted considerable attention and becomes an important field in the regression analysis. This paper discusses the semi-parametric regression model with AR(p)errors, the problem of the autocorrelation is solved firstly, then the penalized least square estimation of the model is given.

關鍵詞: 半參數回歸;AR(p);懲罰最小二乘

Key words: semi-parametric regression;auto-regression;penalized least square

中圖分類號:O212 文獻標識碼:A 文章編號:1006-4311(2012)20-0301-02

0 引言

半參數回歸模型可以看作是參數回歸模型和非參數回歸模型的混合模型,是線性模型的推廣。由于其適應數據變化的能力強,所以它是尋求變量之間關系的有力工具,近年來在經濟學,醫學和社會等領域的實際問題中有著廣泛的應用。

①模型簡介:

模型

y■=x■■β+g(t■)+μ■ i=1,…,n(1)

其中y■為影響變量,xi∈Rm為m維解釋變量,g(ti)是模型的參數部分,它是R上的未知光滑函數,μ■是隨機誤差,若μ■滿足Gauss-Markov假設。則模型(1)經典的半參數回歸模型。

但是在實際問題中,一般模型(1)的誤差項μ■很難同時滿足Gauss-Markov的三個假設。若cov(μ■,μj)=0,i≠j不成立,則說明誤差項存在著異方差性。

模型

y■=X■■β+g(t■)+μ■ i<p時μ■=φ■μ■+φ■μ■+…+φ■μ■+ε■ i>p時(2)

其中X■■=(Xi1,…Xin) β=(β1,…βn)T,ε■滿足Gauss-Markov假設,即E(ε■)=0 Var(ε■)σ2,Cov(ε■,εj)=0,(i≠j)

則模型稱為具有AR(p)誤差的半參數回歸模型。

②半參數回歸模型的研究現狀:

由于半參數回歸模型既充分利用了數據的信息,又將一些信息不充分的變量納入了模型,因而,基于半參數回歸模型所得到的推斷結果一般比參數和非參數模型更加優良,所以對這種模型有許多方面的研究,Severuni對異方差半參數回歸模型參數與非參數部分估計作了研究[1],Chen研究了半參數廣義線性模型的漸近有效估計[2],王啟華等研究了隨機刪除的半參數回歸模型[3],曾林蕊等研究了半參數廣義線性模型的統計診斷和影響分析[4],胡宏昌研究了誤差為AR(1)情形的半參數回歸模型的極大似然估計的存在性問題[5],但是對于誤差為AR(p)情形的半參數模型還未發現進行相關的研究,文章就對此模型進行了相關性消除,然后對其進行了懲罰最小二乘估計。

1 模型誤差項相關性的消除

對于模型(2)

yi-φ1yi-1-……-φpyi-p

=X■■β+g(t■)+μ■-φ■X■■β+g(t■)+μ■-…-

φ■X■■β+g(t■)+μ■

=X■■-φ■X■■-…-φ■X■■β+g(t■)-φ■g(t■)+μ■-φ■μ■-…-φ■μ■

=■X■-φ■X■-…-φ■X■β■+

g(t■)-φ■g(t■)-…-φ■g(t■)+ε■

若令■=y■,■=X■,■(t■)=g(t■) i=1,2,…p■=y■-φ■y■-…-φ■y■■=X■-φ■X■-…φ■X■■(t■)=g(t■)-φ■g(t■)-…-φ■g(t■)

則(1)式可化為:

■=■β+■+ε■ i=1,…,n(3)

由于ε■,…,εn是滿足Gauss-Markov假設,故(3)式滿足經典的半參數回歸模型的假設,下面我們通過研究模型(3)來間接研究模型(2)。

2 模型的懲罰最小二乘估計

為下面計算方便設:

M=■

則有■=MY,■=MX,■=Mg,ε=Mμ

定理:模型(3)的懲罰最小二乘估計為:

■=■(I-N)■■■(I-N)■

■=M■N■-■■

證明:對于模型(3),求β,g的光滑樣條估計,即求■和■使得光滑樣條函數取得最大值。

PL(β,■)=Ln(β,■)-■(4)

其中對數似然函數

Ln(β,■)=-■log(2πσ■)-■■■■-■■β-■(t■)■

參數估計范文第4篇

Abstract: In this paper, we discussed the parameter in Price's documental growth model and the shortage of three methods for estimating. Further, the modified estimation methods are given. The modified methods are more reasonable and their numerical results are satisfactory.

關鍵詞:文獻增長模型;參數估計;3準則;最小二乘法

Key words: documental growth model;parameter estimation;rule of 3σ;least square method

中圖分類號:G350文獻標識碼:A文章編號:1006-4311(2010)20-0117-02

0引言

美國科學學與情報科學家普賴斯(D.J.Price)提出的揭示科技文獻數量隨時間的變化規律的文獻指數增長模型如下:

Y(t)=aebt(1)

其中Y(t)表示t時刻已積累的科技文獻量,a為某初始時刻(用t=0表示)的科技文獻量,e是自然對數的底數,b為某常數。

顯然,要利用(1)式來具體描述某類科技文獻數量隨時間的變化規律,最關鍵的是要確定出參數b。在文[1]中探討了參數b的含義,認為參數b近似等于“單位時間”內文獻數量的增長率,并以此為基礎給出了兩種確定參數b的方法;文[2]在接受文[1]對參數b的釋義的基礎上,提出了一種更簡捷的確定參數b的方法。本文將分析文獻[1,2]方法的不足,并分別提出了其改進的方法。

1對普賴斯增長定律中參數b的理解

設Y(t)表示t時刻已積累的科技文獻量,a為初始時刻t=0時的文獻量,如果設單位時間內新增文獻量是已有文獻量的b倍,則得微分方程初值問題:

=bY(2)

Y(0)=a(3)

求解此初值問題得Y=aebt,可見普賴斯文獻增長定律的表達式正是該初值問題的解。

如果將方程(2)變形成=b,則可看出參數b正是單位時間內的文獻增長率。因此這里對參數b的理解跟文[1]的解釋是一致的。但在文[1]的推演過程中要求b

2參數b的估計方法的討論

2.1 對文[1]方法的改進普賴斯文獻增長定律的應用,最關鍵的是參數b的確定。單位時間內的文獻增長率可作為b的近似,但不同時段內文獻增長率可能是變化的,因此文[1]提出了對文獻增長率取平均的兩種方法,并把算得的“平均值”作為參數b的估計值。

方法一(文[1]稱其為“全段平均值技術”):如果統計數據表明各時間段的增長率的最大值和最小值之間差距不大時,則取各時間段的增長率的算術平均值作為b的近似。

方法二(文[1]稱其為“去頭尾取平均值技術”):如果統計數據表明各時間段的增長率的最大值和最小值之間差距較大時,則去掉一個最大值,去掉一個最低值。然后對剩下的增長率取算術平均值作為b的近似。

文[1]給出的這兩個方法簡單易算,但存在一個問題,就是最大值與最小值之間的差距“不大”和“較大”怎么理解,相差多少算“不大”或“較大”,沒有給出量化標準,這個問題不解決,這兩個方法就缺乏可操作性。為解決這個問題,本文利用數據處理中常用的所謂3σ準則,把這兩個方法統一起來,并進行改進。

一般來說,我們可假設文獻增長率r服從正態分布,即r~N(μ,σ2)。根據概率統計知識,我們知道增長率r介于μ-3σ與μ+3σ間的概率為99.74%,因而增長率r?燮μ-3σ或r?叟μ+3σ可能性就很小。如果某個增長率數據r落在區間(μ-3σ,μ+3σ)之外,則可認為此數據r異常,應予以剔除。這就是3σ準則的思想。即使不作增長率服從正態分布的假定,我們也可由切貝謝夫不等式知P(│r-Er│?叟3)?燮

下面我們假設“單位時間”為年,根據3σ準則,給出確定年平均增長率的方法。

方法三:設r1,r2,…,rn為n個年份的文獻增長率,可先算出樣本均值和樣本標準差:

=r(4)

s=(5)

因為樣本均值和樣本標準差s可作為總體均值μ和總體標準差σ的近似,所以我們認為若某個rk落在區間(-3s,+3s)之外,即增長率rk偏離樣本均值太多,要么是偏小,要么是過大,屬于異常數據,應將rk剔除。

將r1,r2,…,rn中的異常數據都剔除后,對剩下的增長率取算術平均值作為參數b的近似。

方法三顯然是對文[1]中的方法一、方法二的改進,不光統一了方法一和方法二,也給出了剔除異常數據的量化標準,精確表述了“偏大”、“較小”的含義。

2.2 對文[2]方法的改進文[2]以年為“時間單位”,設a為初始時刻t=0時的文獻量,Y(n)為第n年末(t=n)時的文獻累積量,r為年增長率,則Y(n)=a(1+r)n,所以r=-1

根據文[1],b≈r,從而文[2]給出確定參數b的公式:

b=-1(6)

正如文[2]所述,這個公式比文[1]的兩個方法都更簡單,但公式只用到初值和終值,而完全不涉及中間過程中的年份的數據,這顯然不合情理。如果允許只用文獻量的初值和終值來計算參數b,那么我們可以直接在普賴斯增長定律Y(t)=aebt中令t=n,則可得:

b=ln(7)

由(7)式計算參數b應該說比用(6)式更好,因為(7)式是由普賴斯增長定律直接導出的,而不存在把b近似地解釋為年增長率的誤差問題。但我們認為仍然不能用(7)式來確定參數b,這正如由序列數據求回歸直線時不能只由兩點就把直線確定下來一樣。

在普賴斯增長定律Y(t)=aebt兩端取自然對數得:

lnY(t)=lna+bt(8)

lnY(t)是關于時間變量t的線性函數,系數b可由時間序列數據通過線性回歸或最小二乘法來確定,這樣確定的b使得整體誤差Q=[lnY(t)-(lna+bt)]達到最小,而不只是與初值(t=0時)和終值(t=n)時完全吻合。

我們認為,由于文[2]的方法完全不涉及中間年份數據,因此它的計算結果不應和文獻增長的變化情況吻合得好。由(8)式通過線性回歸雖然計算上比用(6)式稍復雜一些,但所得b值更能整體上反映文獻增長的變化規律,比文[2]的方法更具有合理性。下面的計算實例也說明了這一點。

3計算實例及結果比較

為了敘述方便,下面我們把用公式(6)求參數b的方法叫做方法四。而把從(8)式出發通過線性回歸來確定參數b的方法叫做方法五。為了便于比較,我們下面的計算引用的原始數據完全同于文[2],即我國1979年~1993年的社科類圖書出版種數,具體數據見表1。

根據表1中的數據,文[2]已按方法一[1],方法二[1],方法四[2]分別計算出參數b的值,我們按方法三,方法五分別求出了參數b,現將文[2]的計算結果和我們用新方法計算的結果一并給出如下。

方法一:b=b1=0.360358872

方法二:b=b2=0.280085925

方法三:根據3σ準則,1980年的增長率(其值為1.564263323)為異常數據,去掉該數據后求得參數b=b3=0.267750836

方法四[2]:r=b=b4=0.299935918

方法五:利用(8)式通過線性回歸求得b=b5=0.243580459(我們還算得相關系數為0.955701057,比較接近1,說明(8)式中lnY(t)與t具有較強的線性相關性,當b=b5=0.243580459時,模型(1)是合同理可用的。)

同文[2]一樣,我們也利用方法三和方法五估計出的參數b代入普賴斯增長模型(1)中,求出1980年至1993年各年份的文獻量的理論值,與這一時段各年份的實際值比較,我們發現方法三的計算結果比方法一、方法二的要好,而方法五的整體誤差比其余四個方法的誤差都小。因此從某種意義上講,通過回歸方法確定參數b更合理些。

參考文獻:

[1]羅式勝. 關于普賴斯曲線方程參數b的討論[J].情報理論與實踐,1994,(1).

參數估計范文第5篇

關鍵詞SV模型 ;貝葉斯估計;MCMC方法

中圖分類號O218.8文獻標識碼A

1引言

波動性是金融市場最為重要的特征之一,關于有價證券的收益率波動一直是金融學研究的熱點.為了對波動率進行估計,學者們進行過廣泛而深入的探索,其中最具代表性的兩類模型分別是Engel[1]提出的自回歸條件異方差(ARCH)類模型和Taylor[2]提出的隨機波動率(SV)模型.但ARCH類模型中條件方差的估計值與過去擾動項直接相關,因此當存在異常觀y值時,模型估計出的波動序列不是很穩定.而SV模型假定時變方差是一類不可觀測的隨機過程,因此其估計的波動序列比ARCH類模型更加穩定.對此,Shephard[3]通過對比兩類模型,發現SV模型比ARCH模型能更好地描述金融數據的特性,特別是對2個模型的預測的均方誤差的比較發現,SV模型比ARCH模型具有更好的預測能力,尤其是對長期波動性的預測[4].

但是,由于SV模型自身的復雜性,模型的似然函數解析式與無條件矩的解析形式往往難以獲得,無法進行極大似然估計,故如何對SV模型進行參數估計就是一個具有現實意義的問題.對此,Metropolis提出了馬爾科夫蒙特卡洛(MCMC)方法,Hasting[5]在此基礎上提出了MetropolisHasting算法,Geman[5]提出了Gibbs抽樣,這兩種算法因其靈活性和計算機技術的發展,使得針對復雜模型及其后驗分布的精確估計成為可能.除了MCMC方法,國外學者對SV模型的估計方法進行了大量研究,并取得了豐富的成果:Harvey[5]等人的偽極大似然估計,Anderson,Chung[5]的有效矩估計, Dimitrakopoulos Stefano[6]針對時變參數SV(TVPSV)模型提出的一種半參數貝葉斯估計方法,Milan Mrázek[7]等人基于非線性最小二乘法對分數維SV模型參數估計精確度的校準.在眾多估計方法中,蒙特卡羅隨機模擬相對于其他方法,效率較高,易于編程實現.本文即選用基于貝葉斯的MCMC方法對SV模型進行參數估計.

由于許多金融時間序列的無條件分布與標準正態分布相比,會呈現出較大的峰度和更厚的尾部,因此為了將基本的SV模型擴展到較一般的形式,經過學者們多年的研究,SV類模型已經發展出了離散和連續兩類的眾多擴展模型.比如,Geweke[7]對模型進行貝葉斯分析時提出了厚尾SV模型,即將標準SV模型中觀測方程的隨機誤差項設定為具有厚尾特征的概率分布如t分布、GED分布等,從而可以更好地描述金融時間序列的尖峰厚尾特征.Bredit[8]針對金融波動序列的長記憶性提出了長記憶隨機波動模型(LMSV),Chib[5]將跳躍過程引入到了SV模型中,提出了跳躍SV模型,并提供了一種快速有效的估計模型參數的MCMC算法,以此來解決如何反映金融市場中的突發事件和較大波動的問題.

經濟數學第 34卷第1期

黃文禮等:厚尾隨機波動率模型的貝葉斯參數估計及實證研究

近年來,國內學者對SV模型進行了大量研討,這其中包括:劉鳳芹和吳喜之[9]利用一種改進的MCMC方法估計了SV模型,并對上證指數進行了波動性分析;朱慧明[10]在研究滬深300股指期貨數據時,考慮到期貨市場與現貨市場之間存在雙向波動溢出效應以及仿真交易與實盤交易在期貨與現貨聯動性、交易策略等方面存在的差異,建立了一個多變量厚尾SV模型,并借助MCMC方法實現了模型的參數估計.于冉春[11]分別選用標準SV模型和厚尾SV模型對美國標普500指數進行了實證分析,得出厚尾SV模型更能夠準確描述標普指數波動具有長期記憶性的特征.而吳鑫育、馬超群[12]等以上證指數和深證成指為例,提出極大似然方法估計了4種不同收益率分布假定的SV模型,通過比較認為具有偏學生t分布假定的SVSKt模型能夠更好地描述中國股票市場的波動性.在研究中發現,我國股市呈現出許多不同于傳統研究中波動的典型特征,比如反杠桿效應,即股票價格運行未來價格波動呈現正相關關系,特別是2015下半年和2016年年初,整個股市出現了罕見的大幅波動.而對于具有以上新型特征的中國股市,有關厚尾SV模型是否還能有效刻畫出我國資本市場波動性的相關研究還相對缺乏.本文考慮到金融時間序列普遍存在的尖峰厚尾性,為了驗證SV模型對現階段我國股市的擬合效果,擬進行基于MCMC仿真的厚尾SV模型的貝葉斯參數估計,研究以上證綜指為代表的金融時間序列的波動特征.

2厚尾SV模型結構

重復以上步驟進行N次迭代,直到Markov鏈達到平穩狀態.在Gibbs抽樣的初始階段,參數的初始值設定對隨機數的生產有較大的影響,此時Markov鏈是非平穩的,所以在估計模型參數時,通常去掉最初的M個非隨機數,對剩下的NM個抽樣數據進行模型參數的后驗分布統計推斷.

4估計結果和分析

4.1樣本數據和統計特征

2015年開始,中國股市再次表現強勁,然而受多種因素影響,上證綜指又從2015年6月的5 300多點跌至2016年5月的2 800多點,期間又經歷了2016年年初的熔斷機制事件,短短一年多時間,中國股市就經歷了史無前例的大牛市和超級熊市,股票價格波動劇烈,這表明我國股市還存在非常多的問題.因此本文使用的數據包括2013年5月~2016年6月的上證指數歷史收盤價,樣本容量為752,涵蓋了本輪牛市之前、期間、之后的數據,以分析中國股市的波動特征.收益率的計算本文均采用對數收益率方法,并繪制出對數收益率的時序圖和直方圖,見圖1.同時,利用QQ圖對上證指數的統計特征進行分析(見圖2).

通過分析,發現上證指數實際數據的峰度比正態分布數據的峰度要高,腰部較瘦,尾部較厚,并且直方圖并不是完全對稱的,而是略有偏斜.從Q-Q圖中可以很明顯的看出上證指數和指數的收益率分布在收益和損失兩端均偏離直線,因而表現出明顯的厚尾特征,也就是出現異常值的頻率比正態分布的要高.因此再次驗證了中國股市尖峰厚尾特性.

4.2參數估計結果和分析

本文使用MCMC仿真方法對厚尾SV模型進行貝葉斯參數估計,首先對每個參數進行 1 000次迭代,進行退火,以保證參數的收斂性.然后舍棄原來的迭代,再進行10 000次的迭代對模型進行模擬仿真的過程.圖3給出了厚尾SV模型參數相應的后驗分布密度函數仿真結果,參數估計結果見表1.

由圖3可知,對于厚尾SV模型的參數,其后驗分布密度圖基本上是對稱的,說明這些參數的貝葉斯估計值與真實值非常接近,誤差很小.但是對于參數τ,其后驗密度函數都呈現出右偏趨勢,說明這些參數的樣本中存在一些偏大的異常點,使得它們的貝葉斯估計值比真實值要大,因此參數τ可能會被高估.同樣得,參數φ的后驗密度函數呈偏左趨勢,說明參數中存在一些偏小的異常點,使得它們的貝葉斯估計值比真實值要小,故參數φ可能會被低估.

雖然厚尾SV模型的某些參數的貝葉斯估計值可能會偏高或偏低,但是整體看來,模型各個參數的后驗分布密度都具有非常明顯的單峰特征,說明利用后驗均值對模型參數進行估計的誤差是非常小的.因此,綜合對厚尾SV模型參數的樣本軌跡圖以及后驗分布密度圖的分析可知:對厚尾SV模型參數進行貝葉斯估計是合理的,并且估計結果是有效的.

結合模型參數的貝葉斯估計情況,首先可以看出SVT模型參數的估計結果是比較精確的,各參數的MCMC誤差相對于標準差都要小很多,再一次驗證了對厚尾SV模型參數進行貝葉斯估計的合理性.并且在程序運行的時間也較短,表明算法的精確度和效率是比較好的.同時可以得到以下結論:厚尾SV模型的厚尾成分參數ω估計值為16.1,且MC誤差為0.239 7,表明上證綜指的收益率不服從正態分布,具有明顯的厚尾特征,此結論與前面對QQ圖的分析結果是一致的;厚尾SV模型的波動持續性值φ為0.860 4,這說明上證指數具有較為明顯的波動持續性,這也與在實際生活中的感受相吻合:樣本數據涵蓋了2013年~2016年的上證指數收益率,期間整個資本市場經歷了多輪較大起伏的波動,且一個大的波動之后往往跟著另一個波動.SVT模型在模擬波動持續性這一波動特點上的具有良好的擬合效果.

5總結

本文針對厚尾SV模型進行了貝葉斯分析,分析了模型的結構特征,對模型的參數進行了貝葉斯統計推斷,設計了模型參數估計的Gibbs的抽樣算法.在對中國股市的波動性進行實證研究時,選取了近一輪股市波動前中后三個不同階段的數據,以更加全面地了解我國股市的波動特征,并以此為例來檢驗厚尾SV模型在新興資本市場當中的擬合效果.結合對上證指數的統計分析以及MCMC抽樣方法中參數的樣本軌跡收斂性,本文認為,在股市經歷較大幅度波動時,厚尾SV模型仍然能夠比較準確地描述中國股市的波動性特征.

參考文獻

[1]Engel R F. Automatic conditional heteroscedasticity with estimation of the variance of the united kingdom inflation [J].Econometrica, 1982, 50(4):987-1007.

[2]Taylor S J. Modelling financial time series [M].Hoboken: John Wiley,1986.

[3]Harvey A, Shephard N. Estimation of an asymmetryic stochastic volatility model for asset returns [J].Journal of Business and Economic Statistics,1996,14(4):429-434.

[4]郝利, 朱慧明. 貝葉斯金融隨機波動模型及應用[M].北京:經濟管理出版社, 2015.

[5]于冉春. 基于MCMC貝葉斯方法的隨機波動率模型實證研究[D].上海:上海師范大學商學院. 2014.

[6]Dimitrakopoulos S. Semiparametric Bayesian inference for timevarying parameter regression modelswith stochastic volatility [J].Economics Letters. 2017,150(1):10-14.

[7]Milan M, Jan P, Tomá S. Oncalibration of stochastic and fractional stochastic volatility models [J].European Journal of Operational Research. 2016,254(3):1036-1046.

[8]黃超. 基于貝葉斯跳躍厚尾隨機波動模型的中國股市波動性研究[D]. 長沙:湖南大學工商管理學院. 2010.

[9]Breidt F J, Crato N, Lima P. The detection andestimation of long memory in stochastic volatility[J].Journal of Econometrics,1998,83(1):325-348.

[10]劉鳳芹,吳喜之. 隨機波動模型參數估計的新算法及其在上海股市的實證[J].系統工程理論與實踐, 2006, 26(4):27-31.

[11]朱慧明, 李鋒, 楊錦明. 基于MCMC模擬的貝葉斯厚尾金融隨機波動模型分析[J].運籌與管理. 2007, 16(4):111-115.

[12]吳鑫育,馬超群,汪壽陽. 隨機波動率模型的參數估計及對中國股市的實證[J].系統工程理論與實踐. 2014,34(1):35-44.

[13]Kim S,Shephard C.Stochastic volatility:likelihood inference and comparison with ARCH models[J].Review of Economics Studies, 1998,224(65):361-393.

主站蜘蛛池模板: 花莲市| 香河县| 内江市| 临湘市| 西乡县| 武川县| 珲春市| 阿克| 莎车县| 三河市| 友谊县| 乐安县| 齐河县| 成武县| 聊城市| 潞城市| 南充市| 湘潭县| 济源市| 文登市| 平阳县| 朝阳市| 华坪县| 普定县| 三台县| 卢氏县| 无为县| 饶河县| 南溪县| 郓城县| 玛沁县| 河源市| 吉安县| 化德县| 仲巴县| 定陶县| 丰原市| 宾川县| 武平县| 景东| 武冈市|