加權(quán)幾何平均數(shù)(加權(quán)平均數(shù)和幾何平均數(shù))
統(tǒng)計(jì)的必備知識
統(tǒng)計(jì)分為兩類,描述性統(tǒng)計(jì)和推斷性統(tǒng)計(jì)。
名詞解釋:描述性統(tǒng)計(jì)
描述性統(tǒng)計(jì)(descriptive statistics),主要用于描述和擴(kuò)大數(shù)據(jù)集合的重要統(tǒng)計(jì)特性。
名詞解釋:推斷統(tǒng)計(jì)
推斷統(tǒng)計(jì)(inferential statistics)主要研究如何根據(jù)小數(shù)據(jù)集合(樣本)的統(tǒng)計(jì)特征去推斷大數(shù)據(jù)集合的特征。
比如我們知道很多人講身邊越來越多人離婚了,然后得出一個(gè)結(jié)論現(xiàn)在離婚率高,這就是一個(gè)很經(jīng)典的推斷統(tǒng)計(jì)。根據(jù)身邊的樣本推斷出總體特征。當(dāng)然,雖然這個(gè)結(jié)論有待商榷,但是由身邊現(xiàn)象到全部情況的確是我們的一種習(xí)慣思維,也有些認(rèn)知偏差的意味在里頭。
所以有了統(tǒng)計(jì),自然就有了概率和頻率。而一般我們所說的頻數(shù)又叫絕對頻率(abosulute frequency),指總體中各個(gè)觀測值落在不同區(qū)間的次數(shù)。
而頻數(shù)(絕對頻率)除以總頻數(shù),就得到了相對頻率(realative frequency)。
比如抽了20次紙牌,其中抽中2次A。那么頻數(shù)或絕對頻率即為2,頻率即為10%。(吐槽一下:還是中學(xué)時(shí)候講的頻數(shù)和頻率比較順,CFA里的定義太拗口。)
統(tǒng)計(jì)的度量
對集中程度的度量,一般用的是眾數(shù)、中位數(shù)和平均數(shù)。
名詞解釋:算術(shù)平均數(shù)
算術(shù)平均數(shù)(arithemetic mean)最簡單,就是所有觀測值加總再除以觀測值的個(gè)數(shù)。
算術(shù)平均數(shù)的特性:所有觀測值點(diǎn)到算術(shù)平均數(shù)的距離之和為零;它非常容易受極值影響。
名詞解釋:加權(quán)平均數(shù)
加權(quán)平均數(shù)(weighted mean)就是給不同觀測值配上不同權(quán)重,然后求得平均值。
可以說,算術(shù)平均數(shù)就是加權(quán)平均數(shù)中所有觀測值權(quán)重均為1的特殊形態(tài)。
名詞解釋:幾何平均數(shù)
幾何平均數(shù)(egeometric mean)是對各變量值的連乘積開項(xiàng)數(shù)次方根,最常用的情景就是某投資若干年時(shí)間內(nèi)的平均收益率。
名詞解釋:調(diào)和平均數(shù)
調(diào)和平均數(shù)(harmonic mean)較為少見,又稱為倒平均數(shù),是各變量倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。比較常用的例子,是計(jì)算同樣價(jià)格總額下,多只股票一段時(shí)間內(nèi)的平均購買成本。
在數(shù)學(xué)上來講,調(diào)和平均數(shù)≤幾何平均數(shù)≤算術(shù)平均數(shù)。

除了平均數(shù)平均數(shù),往往還需要了解眾數(shù)和中位數(shù),以減少極值的影響,或能更直觀觀察大數(shù)分布。
同時(shí),可能經(jīng)常會用到的還有分位數(shù),比如四分位(quartile),五分位(quintile),十分位(decile)和百分位(percentile)。
說完了對集中程度的度量,自然要談對離散程度的度量。一般而言,對集中程度的度量代表了收益預(yù)估,而對離散程度的度量代表了風(fēng)險(xiǎn)判斷。

首先是平均絕對離差(mean absolute deviation,MAD),是個(gè)觀測數(shù)與其算術(shù)平均數(shù)之間絕對距離之和的平均值。該值越小,說明數(shù)據(jù)越集中,離散程度也越小。
而MAD中的絕對值換成平方,即可得到方差(variance)的表達(dá)式。方差開平方,就會得到標(biāo)準(zhǔn)差(standard deviation)。
然后熱衷于折騰的金融從業(yè)人員還不滿足于此,弄出了半方差(semi-variance)和目標(biāo)半方差(target semi-variance),專門用來衡量下行風(fēng)險(xiǎn)。

顧名思義,收益率曲線對稱分布時(shí),半方差是方差的一半。不對稱分布時(shí),則需要計(jì)算均值以下數(shù)據(jù)的方差。
偏離分布描述
切比雪夫不等式是說,對于任意一組觀測值,假設(shè)k為大于1的任意常數(shù),則單個(gè)觀測值落在均值周圍k個(gè)標(biāo)準(zhǔn)差之內(nèi)的概率不小于(1-1/k**2)。
名詞解釋:變異系數(shù)
變異系數(shù)(coefficient of variation,CV)用來衡量觀測值相對變異程度的一個(gè)指標(biāo),來源于標(biāo)準(zhǔn)差與平均值的比值。
同時(shí),它也等于波動幅度除以均值,因此可以用來衡量1單位預(yù)期收益所承擔(dān)的風(fēng)險(xiǎn)。
名詞解釋:偏度
偏度(skewness)用來衡量統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向和偏斜程度的指標(biāo),反映了統(tǒng)計(jì)數(shù)據(jù)非對稱分布的程度,在數(shù)據(jù)表上看,就是函數(shù)曲線尾部的相對長度。
其中右偏態(tài)為右邊尾部比左邊長,其中眾數(shù)<中位數(shù)<算術(shù)平均數(shù)。房價(jià)、收入等數(shù)據(jù)一般呈右偏態(tài)。
而相對應(yīng)的,左偏態(tài)則是算術(shù)平均數(shù)<中位數(shù)<眾數(shù),比如收益率等數(shù)據(jù)一般呈左偏態(tài)較多。
峰度(kurtosis)用來衡量統(tǒng)計(jì)數(shù)據(jù)分布在其平均值處峰值高低的指標(biāo)。如尖峰(leptokurtic)伴隨著肥尾(fat tail),而低峰(platykurtic)則伴隨著瘦尾(thin tail)。
作者:baidianfeng365本文地址:http://lkxg.cn/bdf/22205.html發(fā)布于 2023-12-25
文章轉(zhuǎn)載或復(fù)制請以超鏈接形式并注明出處白癜風(fēng)知識網(wǎng)