中央極限定理 (central limit theorem)之用均勻分布(uniform distribution)模擬常態分布(normal distribution)

中央極限定理 (central limit theorem)指的是只要從任何一個分布取出樣本後平均，樣本數量越多，這個平均會越接近常態分布(normal distribution)。

數學證明可參考：中央極限定理(central limit theorem )證明

中央極限定理好用的地方在模擬現實生活中的很多現象，就算不確定某個事件的機率分布，只要取其平均，就可以用常態分布模擬。

舉例來說，股價可以用對數常態分布(log-normal distribution)來模擬，也就是說，股票報酬可以用常態分布模擬。

假設從某個數據庫，隨機選取4個樣本叫做X1、X2、X3、X4，然後將樣本平均，也就是(X1 + X2 + X3 + X4) / 4 = Xi，然後不斷重複選取4個樣本取平均，Xi會遵循常態分布；其平均值(mean)就是原數據庫的平均值，標準差(standard deviation)就是原數據庫的標準差除以每次樣本數開根號(根號4 = 2)。

電腦應用

中央極限定理其中一個應用就是可以用別的已知分布模型來模擬常態分布，舉例來說程式語言javascript沒有用常態分布取得隨機參數的方式。

但是可以藉由javascript原生產製的數據，藉由平均樣本來模擬。

舉例來說，我可以用javascript產至1000組範圍0到10的隨機數字，再從其中選5個數字作為樣本，然後看看樣本平均(為了方便做圖，皆四捨五入)是否遵循常態分布。

回到「工具」頁面

javascript程式碼分享

有需要用js來產生常態分布樣本的人可以參考這邊的程式碼。

首先設定常態分步的標準差及平均值，得到相對應均勻分布的上下限：

假設常態分步的平均值為x，標準差為y
則相對應的均勻分布的上下限分別為：上限則為x+y*√12/2，上限則為x-y*√12/2。
有了均勻分布的上下限，就可以求得其散步範圍 (range)，也就是上限減去下限： y*√12。
假設要模擬的常態分步平均值為10，標準差為20，則程式碼如下：

randomvariable及為平均值為10，標準差為20的常態分步變數。

function getram(mean,sd,n){
var mean = mean;
var sd = sd;
var n= n;
var a = mean - Math.sqrt(n)*sd*Math.sqrt(12)/2;
var b = mean + Math.sqrt(n)* sd*Math.sqrt(12)/2;
var range = b - a;
var randomvariable;
var seeds = [];
for(i=0;i<=n;i++){
var x = a + Math.random()*range;
seeds.push(x);
}
randomvariable = seeds.reduce(myFunc)/n;

function myFunc(total, num) {
  return total + num;
}
return randomvariable;
}

留言

這個網誌中的熱門文章

母體變異數(population variance)、樣本變異數(sample variance)及自由度(degrees of freedom)

母體指的是所有的數據，樣本指的是從母體抽樣的數據，舉例來說，一個班級有40人，它們的身高，40個身高數據，若只針對這個班，就是母體，但是，卻只是代表全校學生身高的一部分，也就是樣本。回到「機率統計」頁面樣本平均數(mean)不是母體平均數，樣本變異數(variance)也不是母體變異數，一個班40個人身高的平均數很難剛好是全校學生的身高平均數。一個班40個人的身高變異數也不會是全校學生的身高變異數。變異數計算母體變異數的定義如下：而樣本變異數的定義如下：奇怪的地方平均數雖然樣本平均數不是母體平均數，不過，如果不斷重複從同一個母體抽樣平均，會得到一個近似母體平均數的數字。舉例來說，從一個學校所有學生中，不斷隨機選出40個學生取平均數，再將這些平均數平均，結果會接近直接算全校學生的身高平均數。也就是說樣本平均數的期望值就是母體平均數：變異數樣本變異數跟母體變異數就沒這麼單純了。奇怪的地方是，為什麼樣本變異數公式的除術是n-1，而不是像平均數計算一樣用n？為何樣本變異數要除的是(n-1)？除數為n的話，變異數會太小如果樣本變異數的除數是n，樣本變異數就會常常比母體變異數小。為什麼呢？因為，樣本是從母體抽取的，抽樣的數據算出平均，並且抽樣的數據會相對的接近抽樣的平均，總不會剛好抽出的樣本平均數剛好是母體平均數，且樣本數據離樣本平均數就像母體數據離母體平均數一樣分散吧？假設母體數據為0-99的整數，共100個數據，從中選出10個數字，然後計算樣本的平均數，分別用n及n-1當作除數算出變異數，連續執行200次，並將200個樣本平均數及200個樣本變異數平均。也就是取得樣本平均數及樣本變異數的期望值，結果如下：母體平均數 = 49.5 ...

Blogger文章在Google搜尋引擎找不到，怎麼辦？

剛開始經營部落格，最令人不解及懊惱的其中一件事就是為什麼我的文章發布了，在Google搜尋引擎不管怎麼搜尋都找不到；文章找不到就沒辦法建立自然流量了。回到「部落格經營血淚史」頁面 Google Search Console無法為Blogger建立索引，出現伺服器錯誤(5XX)⇨ 這是因為Google搜尋引擎還沒將新的文章或網頁放進去索引(index)裡。可以用手動的方式，將新文章或網頁加入Goolge搜尋引擎索引裡。首先，在Google搜尋「google search console」。進去後，輸入網站網址如下圖，兩者選其一。輸入網站網址並點點擊「繼續後」後，選擇「前往資源」。視窗上側，找到「檢查XXX中的任何網址」，輸入要加入Google搜尋引擎索引的網頁(文章)網址。如果該網頁不在Google搜尋引擎索引內，結果會出現「網址不在 Google 服務中」，這時需點擊「要求建立索引」。這樣就完成了；大概過4-6天就會編入Google搜尋引擎索引了，不過，不需要一直重新提出建立索引的要求，因為這樣不會比較快編入索引。如何提交Blogger Sitemap？到Google Search Console的Sitemap，填入落格網址並加上 /sitemap.xml ，舉例來說，我的部落格就是https://quanist.blogspot.com/sitemap.xml，送出即可。送出之後要等大約10分鐘，正常來說就會從「Couldn't fetch 」轉為顯示「成功」。如何提交Blogger Atom Sitemap？文章數少於500篇：到Google Search Console的Sitemap，填入部落格網址並加上 /atom.xml?redirect=false&start-index=1&max-results=500 ，舉例來說，我的部落格就是https://quanist.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500，送出即可。文章數少於1000篇：到Google Search Cons...

【美式口音訓練】連音(word linking)

美式英文發音大部分都不是一字字念出來的，一句話通常都會有連音，而連音的發生的狀況有很多，以下一一介紹。回到「英文口說訓練」頁面子音結尾搭配母音開頭這是最容易理解的連音發式。這種連音方式發生在一個字以子音結尾，下一個字則以母音開頭。舉例來說， turn on the light - tur non the light turn off the light - tur noff the light come again another day - cu magay nu nuther day Yes, I do - Yes sIai do 母音結尾搭配母音開頭這種連音方式發生在一個字以母子音結尾如ow、o，這個連音方式比較容易被忽略，舉例來說 How are you - how ware you：are 的前面要加 w 的音 No, I don't - No wI don't：I 的前面要加 w 的音 I ate it - I yate it：I 結尾有一個 y 的音 I will wear it - I'll wear rit 子音結尾搭配子音開頭算是相當困難的連音，或者說不算是連音，但是遇到兩個子音連在一起，都要記得發出來 month - mo n th：n 跟 th 都要發 recognize - re kgnize：k 跟g 都要發，美國人聽得出來子音同化(assimilation) 子音同化發生相似子音被另一個子音取代，舉例來說 Handbag - hanmbag：nd 後面接 b，所以很可以用 m 取代。有無聲子音轉換 I have to go -I haft go：v 變成 f I have to go to the bathroom - I haft go dthe bathroom：v 變成 f、to the 變成 d the 不該使用連音的時候如果在說話時要特別強調一個字，這個字前後就不要連音，可以稍微停頓，把這個字念清楚。回到「英文口說訓練」頁面

台股個股(ETF)日報酬及其標準差計算機

以下為台股個股(ETF)日報酬及其標準差計算機：填入臺灣證券交易所個股 (ETF) CSV數據計算您選擇的標的的平均日報酬為： % 日報酬標準差為： % 使用方式 1.到臺灣證券交易所每日收盤價網頁。 2.輸入欲查詢股票代號及月分。 3.點選下載CSV。 3.開啟CSV，複製日期跟股價資訊，最後一個逗點不要。 3.貼近本計算機文字方塊內，點選計算即可。 3.如果要多重月份資料，只要下在多個CSV檔案，複製貼上計算機文字方塊即可，記得逗點不要重複，且最後一個逗點要刪除。

VTI跟SPY誰比較好？

VTI比較好，VTI追蹤的是美國整體市場指數，而SPY追蹤的是標普500指數。為什麼VTI比較好？隨機選擇兩者報酬率，VTI贏過SPY的機率概略為93.3%，且波動率也沒有比較大。詳情請使用這個工具。 VTI及SPY報酬分析以下報酬率資料皆已將股利30%的稅算入，也就是兩者的股利都有扣30%。資料時間為2001/6/15至2022/6/17。報酬分布兩者標準差概同。夏普值分析以每年252天交易日計算，並扣除股利30%。 SPY平均年報酬為10.308%，標準差為17.068，平均值除以標準差為0.604，無風險利率以2%計算，夏普值為0.487。來源： Mean Return, Return Standard Deviation and Shape Ratio for SPY VTI平均年報酬為11.405%，標準差為18.234，平均值除以標準差為0.625，無風險利率以2%計算，夏普值為0.516。來源： Mean Return, Return Standard Deviation and Shape Ratio for VTI SPY VTI 結論 VTI投資勝率大幅贏過SPY。 VTI波動度比SPY稍微大。

LQD 與 TLT 風險報酬比較

現在美國 10 年期公債殖利率站上 4%，算是站在近 20 年來的高水位，因此我有大筆買進的衝動，不過，經過一系列研究，美國長年期公債在殖利率上升時，風險還是蠻高的，我就轉向研究公司債。今天我研究的 ETF 是 LQD，iShares iBoxx $ Inv Grade Corporate Bond ETF，也就是投資級公司債的代表。比較標的是 TLT，原因是 TLT 算是長債的代表，而且歷史平均報酬率容易勝過短債，適合用作與 LQD 相比，作為投資參考。首先，先來技術分析。 LQD 上次低點在 2020/10/14 的 100.38 附近，與目前的 105.01 相差 4.612%。 TLT 上次低點在 2022/11/4 的 94.22 附近，與目前的 95.16相差 1%。技術上技術上，兩者都在近 10年低點，技術上算是有吸引力。殖利率上升時，公司債的表現 TLT 2003-05-23 到 2004-05-21 跌了 10.254% TLT 2009-01-06 到 2010-01-05 跌了 16.364% 這段期間美國 30 年期公債殖利率從 3.04% 漲到 3.74%，漲了 0.7%。 TLT 2012-11-14 到 2013-11-13 跌了 15.701% 這段期間美國 30 年期公債殖利率從 2.73% 漲到 3.83%，漲了 1.1%。 TLT 2016-07-29 到 2017-07-28 跌了 10.307% 這段期間美國 30 年期公債殖利率從 2.18% 漲到 2.89%，漲了 0.71%。 TLT 2021-11-18 到 2023-8-15 跌了 32.695% 這段期間美國 30 年期公債殖利率從 1.97% 漲到 4.35%，漲了 2.38%。結論 LQD 現在也很便宜，在公債殖利率還有可能持續上漲狀況下，表現可能勝過公債。

短線操作賺大錢之賭徒破產理論(gambler's ruin)

短線操作依據各項技術指標、籌碼及消息分析，短期內執行買進及賣出交易，方向看的準勢必賺大錢，方向看不準勢必賠大錢。依據統計學裡的賭徒破產理論，短線操作勝率如果只是50%的話非常危險。賭徒破產理論(gambler's ruin) 賭徒破產理論通常指的是：一個賭本有限的賭徒跟一個賭本無限的賭徒不斷互賭，即使兩者勝率一樣都是50%，時間只要夠久，賭博次數只要夠多，賭本有限的賭徒一定會破產。數學公式證明：賭徒破產理論(Gambler's ruin)機率公式證明為什麼呢？假設A跟B賭錢，彼此勝率皆為50%，賭輸的人要給賭贏的人1塊錢，賭到一方破產為止。假設他們彼此都持有1元，A破產的機率有多少？恰恰好是50%，因為賭一局定勝負。如果B贏了A的1塊錢，A破產；不過，B破產的機率跟A一樣，因為B也是只有1塊錢，第1局輸了就沒了。假設現在A有1塊錢B有2塊錢呢？在第1局A就破產的機率還是50%，因為他只有1塊錢，有50%的機率會輸，然而，B破產機率就比較低，他有2塊錢，無論如何都不會在第1局就破產。假設現在A有1塊錢B有3塊錢呢？以此類推，只要B的錢比較多，A就是比較容易破產。因此，投資人短線操作的交易對像如果資金豐厚，那就很危險了事實上，只要賭博次數夠多，兩人勝率一樣，一定會有一人破產，因為兩人的資金加起來假設是n元，遲早會出現其中一方連續贏n局，並贏得所有資金，導致另一方破產，賭局就會結束；雖然機率很低，只要賭博次數夠多就會發生。風險管控也是這個概念。賭徒破產理論機率計算可至本站「工具」頁面計算：工具。勝率如果大於50% 操作短線如果勝率沒有大於50%的話相當危險，容易賠光光。所以要練到勝率超過50%。可以試試看下面這個每秒賭40局1元的模擬器。賭博模擬器勝率: % 賭本： 10 賭！重置結論股票技術面、籌碼面及基本面分析需要彼此配合使用，才能得到比較完善的投資結論，舉例來說，2020年爆發全球新冠肺炎疫情危機時，台灣加權指數跌破10年線，在技術分析上是個買點，不過，歷史上也有跌破10年線之後繼續跌的例子，需要搭配分析美國聯準會將聯邦基準利率降至0%到0.25%等因素，綜合分析才能得到自己滿意的分析結果。十年線操作經歷，可參考： https://quanist.blogspot....

什麼是「自由流通量(public float)」及「流通股(shares outstanding)」?

自由流通量(public float)及流通股(shares outstanding)常常用於指數編撰的參考數據，例如美國的標普500指數就有限制其成分股公司的股票「自由流通量(public float)」占「流通股(shares outstanding)」至少10%。那什麼是「自由流通量(public float)」及「流通股(shares outstanding)」呢? 回到「金融分析」頁面自由流通量表示流通股中不被某些機構，如政府或股票本身的公司，長期持有的股票。流通股流通股指的是所有在市場上可以購買到的股票；當公司為了增資(籌錢)而發行更多的股票來賣時，流通股會增加，反之，若公司為了減資買回庫藏股時，流通股會減少。回到「金融分析」頁面本文參考「Investopedia」，https://www.investopedia.com/terms/o/outstandingshares.asp，James Chen，2021/5/1

富時全球全市場指數(FTSE Global All Cap Index)是什麼？有追蹤它的ETF嗎？

富時全球全市場指數(FTSE Global All Cap Index)是英國富時羅素(FTSE Russell)在2003年建立的，目的是為了代表全球成熟市場及新興市場小、中、大型股的報酬，成分股公司總計超過9,000家。相關ETF 追蹤富時全球全市場指數其中一支的ETF是Vanguard Total World Stock ETF(VT)，這支ETF也常常被拿來跟追蹤另外一支全球市場指數MSCI ACWI的iShares MSCI ACWI ETF(ACWI)比較。可參考： MSCI ACWI指數是什麼？有追蹤它的ETF嗎？比較項目總開銷比特點 VT 0.08% 成分股包括小型股 ACWI 0.33% 無

Quanist 理財智

搜尋此網誌