加權(quán)幾何平均數(shù)(加權(quán)平均數(shù)和幾何平均數(shù))

摘要: 統(tǒng)計(jì)的必備知識統(tǒng)計(jì)分為兩類,描述性統(tǒng)計(jì)和推斷性統(tǒng)計(jì)。名詞解釋:描述性統(tǒng)計(jì)描述性統(tǒng)計(jì)(descriptive statistics),主要用于描述和擴(kuò)大數(shù)據(jù)集合的重要統(tǒng)計(jì)特性。名詞解...

統(tǒng)計(jì)的必備知識

統(tǒng)計(jì)分為兩類,描述性統(tǒng)計(jì)和推斷性統(tǒng)計(jì)。

名詞解釋:描述性統(tǒng)計(jì)

描述性統(tǒng)計(jì)(descriptive statistics),主要用于描述和擴(kuò)大數(shù)據(jù)集合的重要統(tǒng)計(jì)特性。

名詞解釋:推斷統(tǒng)計(jì)

推斷統(tǒng)計(jì)(inferential statistics)主要研究如何根據(jù)小數(shù)據(jù)集合(樣本)的統(tǒng)計(jì)特征去推斷大數(shù)據(jù)集合的特征。

比如我們知道很多人講身邊越來越多人離婚了,然后得出一個(gè)結(jié)論現(xiàn)在離婚率高,這就是一個(gè)很經(jīng)典的推斷統(tǒng)計(jì)。根據(jù)身邊的樣本推斷出總體特征。當(dāng)然,雖然這個(gè)結(jié)論有待商榷,但是由身邊現(xiàn)象到全部情況的確是我們的一種習(xí)慣思維,也有些認(rèn)知偏差的意味在里頭。

所以有了統(tǒng)計(jì),自然就有了概率和頻率。而一般我們所說的頻數(shù)又叫絕對頻率(abosulute frequency),指總體中各個(gè)觀測值落在不同區(qū)間的次數(shù)。

而頻數(shù)(絕對頻率)除以總頻數(shù),就得到了相對頻率(realative frequency)。

比如抽了20次紙牌,其中抽中2次A。那么頻數(shù)或絕對頻率即為2,頻率即為10%。(吐槽一下:還是中學(xué)時(shí)候講的頻數(shù)和頻率比較順,CFA里的定義太拗口。)


統(tǒng)計(jì)的度量

對集中程度的度量,一般用的是眾數(shù)、中位數(shù)和平均數(shù)。

名詞解釋:算術(shù)平均數(shù)

算術(shù)平均數(shù)(arithemetic mean)最簡單,就是所有觀測值加總再除以觀測值的個(gè)數(shù)。

算術(shù)平均數(shù)的特性:所有觀測值點(diǎn)到算術(shù)平均數(shù)的距離之和為零;它非常容易受極值影響。

名詞解釋:加權(quán)平均數(shù)

加權(quán)平均數(shù)(weighted mean)就是給不同觀測值配上不同權(quán)重,然后求得平均值。

可以說,算術(shù)平均數(shù)就是加權(quán)平均數(shù)中所有觀測值權(quán)重均為1的特殊形態(tài)。

名詞解釋:幾何平均數(shù)

幾何平均數(shù)(egeometric mean)是對各變量值的連乘積開項(xiàng)數(shù)次方根,最常用的情景就是某投資若干年時(shí)間內(nèi)的平均收益率。

名詞解釋:調(diào)和平均數(shù)

調(diào)和平均數(shù)(harmonic mean)較為少見,又稱為倒平均數(shù),是各變量倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。比較常用的例子,是計(jì)算同樣價(jià)格總額下,多只股票一段時(shí)間內(nèi)的平均購買成本。

在數(shù)學(xué)上來講,調(diào)和平均數(shù)≤幾何平均數(shù)≤算術(shù)平均數(shù)。

「CFA學(xué)習(xí)筆記」金融理論的數(shù)學(xué)基礎(chǔ):定量分析(二)


除了平均數(shù)平均數(shù),往往還需要了解眾數(shù)和中位數(shù),以減少極值的影響,或能更直觀觀察大數(shù)分布。

同時(shí),可能經(jīng)常會用到的還有分位數(shù),比如四分位(quartile),五分位(quintile),十分位(decile)和百分位(percentile)。

說完了對集中程度的度量,自然要談對離散程度的度量。一般而言,對集中程度的度量代表了收益預(yù)估,而對離散程度的度量代表了風(fēng)險(xiǎn)判斷。

「CFA學(xué)習(xí)筆記」金融理論的數(shù)學(xué)基礎(chǔ):定量分析(二)


首先是平均絕對離差(mean absolute deviation,MAD),是個(gè)觀測數(shù)與其算術(shù)平均數(shù)之間絕對距離之和的平均值。該值越小,說明數(shù)據(jù)越集中,離散程度也越小。

而MAD中的絕對值換成平方,即可得到方差(variance)的表達(dá)式。方差開平方,就會得到標(biāo)準(zhǔn)差(standard deviation)。

然后熱衷于折騰的金融從業(yè)人員還不滿足于此,弄出了半方差(semi-variance)和目標(biāo)半方差(target semi-variance),專門用來衡量下行風(fēng)險(xiǎn)。

「CFA學(xué)習(xí)筆記」金融理論的數(shù)學(xué)基礎(chǔ):定量分析(二)


顧名思義,收益率曲線對稱分布時(shí),半方差是方差的一半。不對稱分布時(shí),則需要計(jì)算均值以下數(shù)據(jù)的方差。


偏離分布描述

切比雪夫不等式是說,對于任意一組觀測值,假設(shè)k為大于1的任意常數(shù),則單個(gè)觀測值落在均值周圍k個(gè)標(biāo)準(zhǔn)差之內(nèi)的概率不小于(1-1/k**2)。

名詞解釋:變異系數(shù)

變異系數(shù)(coefficient of variation,CV)用來衡量觀測值相對變異程度的一個(gè)指標(biāo),來源于標(biāo)準(zhǔn)差與平均值的比值。

同時(shí),它也等于波動幅度除以均值,因此可以用來衡量1單位預(yù)期收益所承擔(dān)的風(fēng)險(xiǎn)。

名詞解釋:偏度

偏度(skewness)用來衡量統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向和偏斜程度的指標(biāo),反映了統(tǒng)計(jì)數(shù)據(jù)非對稱分布的程度,在數(shù)據(jù)表上看,就是函數(shù)曲線尾部的相對長度。

其中右偏態(tài)為右邊尾部比左邊長,其中眾數(shù)<中位數(shù)<算術(shù)平均數(shù)。房價(jià)、收入等數(shù)據(jù)一般呈右偏態(tài)。

而相對應(yīng)的,左偏態(tài)則是算術(shù)平均數(shù)<中位數(shù)<眾數(shù),比如收益率等數(shù)據(jù)一般呈左偏態(tài)較多。

峰度(kurtosis)用來衡量統(tǒng)計(jì)數(shù)據(jù)分布在其平均值處峰值高低的指標(biāo)。如尖峰(leptokurtic)伴隨著肥尾(fat tail),而低峰(platykurtic)則伴隨著瘦尾(thin tail)。