作者:羅伯.麥修斯(Robert Matthews)
譯者:高英哲
出版社:大牌出版
「平均律告訴我們,當我們知道(或有預感自己在處理涉及機率的事件時),不應著重在事件本身,而是要注意相對頻率,也就是每個事件各自的出現次數占總次數的比例。」
◆◆◆
「解讀看似「隨機」的事件時,不要自動假設它們為獨立事件。世界上有許多事件並非獨立事件;若假設它們是獨立事件,機率的估計結果有時會極其誤導。」
📝 買到一盒好幾顆雙蛋黃的蛋。
◆◆◆
「1970年代,加拿大麥克馬斯特大學(McMaster University)心理學家諾曼·金斯伯格(Norman Ginsburg)曾經有項研究是要求受測者隨機寫下100個連續數字。大多數受測者都能寫出毫無規則的數列,只出現少數幾個重複,連號或是任何模式。換句話說,受測者都會盡其所能確保每個數字都有『公平機會』,出現在這串毫無模式可言的數列中。但這項測試也正好反映出,受測者對於隨機性的根本誤解。」
◆◆◆
「根據表現做決策時,對於非凡的表現要特別當心。根據定義,非凡的表現就是不具代表性的資料。拜回歸平均數非凡的均等效應所賜,非凡的表現特別容易以失望告終。」
◆◆◆
「研討會上發表的聲明不值一顧,等發表在重要期刊時再說。即使真的發表,也請切記,這是值得關注的必要條件,不是充分條件。頂尖期刊也可能(確實也曾經)出現無稽之談。」
◆◆◆
「馬克斯普朗克人類發展研究所的史蒂芬.荷索(Stefan Herzog)跟拉夫.荷威格(Ralph Hertwig),想出一個能達成這個目標的技巧:辯證拔靴法(dialectical bootstrapping)。幸好這項技巧的內涵,比它的名稱簡單。
首先,不管要預測什麼事,隨便找個想法,做初步的猜測,並記下來。現在想像有人說你這個猜測不對,接著思考哪裡可能出錯,哪裡假設可能不正確,如果改變這些假設,有何影響?預測結果會因此變高或變低?然後根據你對問題的新見解,再次估計。荷索跟荷威格有個卓越的發現:一般來說,兩個猜測的平均值,比任一個別的猜測值,更接近真正的答案。」
◆◆◆
玩越久、越多次,優勢就會漸漸倒向莊家,因為賭場就是這樣設計的,所以減少玩的次數,然後見好就收:「你若帶了100英鎊去賭場,決定在輪盤上試手氣。視生意狀況而定,輪盤一小時大概可以玩30到40次。如果你一注10鎊,花15分鐘賭完,至少不輸不贏的機率會略高於一注5鎊玩半小時。因為一注10鎊只需10次,一注5鎊要玩20次,曝露在莊家優勢下的時間若能減半,就能把在輸光前贏得50鎊利潤的機率,從三分之一提高到大約一半。若你賭10把押紅或押黑,就數學上來說,至少不輸不贏的機率超過一半,還有將近三分之一的機率可以賺到錢,而且你百分之百可以說,你玩輪盤時完全知道自己在幹嘛。」
◆◆◆
或然率的奇特表述:「運彩賭徒下注是為了贏錢(至少理論上是),因此傳統上,他們不以或然率描述事件機率,而是說下注贏了之後能有多少利潤。舉例來說,他們不說某匹馬有22%的機率勝出,而是說某匹馬『2賠7』(7 to 2),意思是每下注2鎊,賭贏的利潤是7鎊。若要把『X賠Y』的賠率換算成以百分比顯示的或然率,就用x除以X+Y,再乘以100。對於高或然率的事件,賭徒會說這事件『3賠1』(3 to 1),意思是每下注3鎊,只有1鎊的利潤。若要把這些賠率換算成百分比,也是套用同樣的公式,如『3賠1』就是75%。」
「不過,博彩公司貼出的實際賠率不會是4賠6,而是接近「一半一半」,意即有50%的機率勝出。義如其字,一半一半的賠率是你每下注4鎊,贏了就給你4鎊。這比4賠6的彩金吝嗇多了。換句話說,這樣的賭博報酬對賭客並不公平,而中間的差額就到博彩公司的口袋。任何認為博彩公司的賠率,準確反映事件發生機率的人,完全落入博彩公司的陷阱。博彩公司貼出的賠率,相當於賭場假裝公平的賭金,事實上完全不是那麼一回事——而中間的差額,就是他們的獲利邊際(有時稱為『莊家優勢』或『抽頭』),經常達到20%以上。」
◆◆◆
「在不確定性下做任何決定,首先要問一個問題:可能的結果是什麼?回答這個問題的基本方法,出自17世紀卓越的法國大學者、率先研究或然率理論的帕斯卡(Blaise Pascal)。這個方法如此強大,卻極為簡單:對不確定事件的預期結果,可藉由結果乘以發生的實際機率做為評量。例如,有個賭注贏得100鎊的機率是20%,這100鎊是賭注的結果;根據帕斯卡的主張,我們對這個賭注的預期結果,是100鎊乘以20%(發生機率),即期望值20鎊。就這麼簡單,但有道理嗎?畢竟我們實際上得到的,不是100鎊,就是一毛也沒有,永遠不可能是20鎊。當然,只有賭了才知道是哪一種結果,但到了那個時候,恐怕有點為時晚矣。」
「我們也要面對輸的可能,而輪的風險高 80%。因此,我們現在再應用一次帕斯卡法則,看輸的結果如何。我們顯然不希望預期損失超過預期利得,因為這意味著長期來說會輸錢。在這個例子中,我們可以做的是不要拿太多錢冒險,以免輸掉的80%,超過預期會贏的錢,也就是20鎊。這表示拿去冒險的賭金不能超過25鎊(25 × 80% = 20)。」
◆◆◆
延長保固:「有間超市收費99鎊,提供價值349鎊的新電視五年保固。付99鎊買五年心安,似乎不算很多,然而若從期望值理論來看,你可能會再想一想。電視故障的『期望損失』,就是這台電視的成本乘以故障機率。我們不知道故障機率是多少,不過我們知道,期望值不應該超過我們被要求支付的99鎊保險費,因為這麼一來,我們就等於是為電視機故障的風險過度投保。因此,電視的保固費,只有低於349鎊乘以壞掉風險時,才值得購買;換算一下,這等於說電視在五年內壞掉的風險,至少是99/349(約28%)。你若覺得這個電視機故障機率合理,那就可以買保固。不過,你可能想先了解真正的故障率是多少:《買哪個好?》(英國消費者協會發行的雜誌)查過了,實際的故障率僅5%。比起99鎊保險費對應的合理最低故障率,這實在低太多了吧?現在,我們也可以算出合理的保險費:349鎊乘以5%的故障率,也就是約18鎊,僅僅只是99鎊的一小部分。」
「同樣的基本觀念,也可以用在評估購買遺失險或竊盜險:合理保費大約等於裝置價值乘以遺失或竊盜的機率。這時候就值得查一下犯罪統計數據,而保費只要超過該裝置價值的幾個百分點,就是不折不扣的剝削。即使沒有確切的數據,也可以用個人經驗評估風險。某件事未曾發生在你身上,光是這個事實就已經透露非常多事情。只要做點計算就會發現,儘管某事件有N次機會發生,卻始終沒有發生的話,那麼你可以很有把握,該事件發生的頻率不會超過3/N。因此舉例來說,倘若在過去五年內,你擁有N個東西,卻從未遺失過任何一件,那麼如果未來情境類似,你使用新裝置卻遺失的機率,很可能低於3/N。如果擁有大約幾十項物品,那麼3/N約等於10%,因此為未來五年的遺失或竊盜風險所付的合理保費,就不應該超過物品價格的10%,也就是每年保費大約是購買價格的2%。」
「買房屋險或是海外醫療險,卻是另外一回事。你可能認為出國幾天生病的風險很低,根本不值得付20鎊的保費;但是住院費與送返國門的成本,隨便就超過這個數目一萬倍。當賭輸的代價是欲哭無淚的20萬鎊帳單時,你真的能信心滿滿地賭這些倒楣事發生的機率低於1/10000嗎?
這裡點出保險以及一般決策的關鍵事實:事情完全取決於背景架構。你若很窮,即使是保費合理,也可能超出你的負擔;無論你有多理性,你只能賭自己運氣夠強。另一方面,有錢人實際上可能願意付出比合理水準更高的保費,只因為錢對他們來說比較不算什麼。」
📝要考慮賭輸的後果。
◆◆◆
「我們可以利用帕斯卡原則,成為自己的保險人;」
「只要將事物的價值乘以逢厄的風險,算出合理的保費,然後分期將『保費』提撥到一個『沉沒基金』(sinking fund,亦即只存不提)。此外,我們也可以一次提撥原本要繳給保險公司的保費(保證比你需要用到的還多)。無論用哪種方式,若是碰上災厄,我們都有保障;若平安無事,我們也有了一筆還不錯的儲蓄。」
◆◆◆
「假設謠傳屬實的機率是P,那麼謠傳為假的機率就是1-P(因為這兩種結果裡一定有一個為真,因此機率加起來必須等於1)。所以按兵不動的期望後果,就等於 -10P + 7 (1-P);搬家的期望後果,則等於2P + (1-P)。把這兩個期望後果中間畫上等號,就能算出P高於哪個值的時候,搬家會導致比較正面的後果。我們因此發現,倘若謠傳屬實的機率超過1/3,搬家就比較有道理。」
◆◆◆
概似比:「例如,倘若在篩檢結果出爐前,認為某位病人罹患乳癌的機率僅5%,就等於把對罹患乳癌機會的最初看法設定為0.05。假設篩檢方法在有乳癌的情況下,得到陽性反應的或然率是80%,而沒有乳癌卻得到陽性反應的機率(「假警報率」)是20%,那麼這項篩檢的概似比就是0.8/0.2=4。貝氏定理告訴我們,篩檢結果呈陽性反應,我們對病人罹患癌症的相信程度,應該從最初的0.05提升到4倍,因此更新後的機會是0.2。把這轉換成或然率,就表示有17%的機率罹患乳癌,因此儘管篩檢結果呈陽性,還是有83%的機率並沒有罹癌。」
概似比(這個比率表示證據的強度)= (Pr(假設你相信的是為真,而觀察到的證據))/(Pr(假設你相信的事並非事實,卻觀察到證據))
◆◆◆
「如抽到一張紅色撲克牌是方塊的或然率(50%),等於抽到一張方塊撲克牌是紅色的或然率(100%)。在把證據轉化成見解時,若是不慎把條件或然率倒反過來,正是釀成大災難的最好方法。」
📝 抽到一張方塊,可以100%確定是紅色,但不表示抽到紅色也可以100%確定是方塊。
◆◆◆
「Pr(有罪下自白)必須大於Pr(無罪下自白)講得更直白點,我們必須有把握,一個罪犯自白的機率,大於無罪者自白的機率。這當然是個可以爭議的問題,而這正是關鍵所在:我們顯然不能斷定這個條件舉案皆然。」
「貝氏定理的重點,在於要對這兩種或然率加上限制:因為事實上很難保證,事情一定是其中的哪一種狀況。只需稍微想一下,就會發現某些類型的犯罪,可能會出現完全相反的情況。」例如:訓練有素的職業殺手或恐怖份子,他們自白的機率很可能遠低於無辜者。「根據貝氏定理,職業殺手開口自白的機率,光和無辜者一樣是不夠的,必須更可能開口自白,才能在這個案例中成為判定有罪的有用證據。」
◆◆◆
「若要評估證據的份量,我們還需要知道偽陽性率,而偽陽性率必須低於真陽性率才行」
Pr(有腦瘤時,一直頭痛)
或然率約為50%到60%。
這時,你可能會輕易認為「反之亦然」,即:
Pr(一直犯頭痛的情況下,結果是罹患腦瘤)
或然率也約為50%到60%。
運用完整的貝氏定理,可以得知:
頭痛時,罹患腦瘤的機率 = LR x 罹患腦瘤的機率
LR = (Pr(罹患腦瘤,一直犯頭痛))/(Pr(沒有罹患腦瘤,一直犯頭痛))
「現在我們不必杞人憂天,原因有二。首先,也是最重要的,腦瘤很罕見,每年幾千人才有一個確診,因此患腦瘤的事前或然率非常低。不過,若如此低的事前機率,被非常高的LR 拉高的話,那我們就有理由要擔心。我們已有一半計算LR所需的資訊:若罹患腦瘤,有50%到60%的機率會頭痛。幸好這只是LR公式的分子;我們還得知道若沒有罹患腦瘤,犯頭痛的或然率是多少。由於頭痛是非常普遍的現象,或然率相當高,因此LR不會太高。總結來說,低事前機率加上普普的LR,因此頭痛是因為罹患腦瘤的機率很低。」
◆◆◆
工具:Bayesian Credibility Analysis,該頁面允許根據當前知識評估臨床試驗結果的可信度。
◆◆◆
「『貝氏推論引擎』能告訴我們,必須要對資料具有多少事前相信程度,才能產生具有說服力的結論。我們只需決定一件事:我們是否認為那樣的事前相信程度確實合理?我們可能會覺得那實在荒謬,這時我們完全有理由認為,新研究發現沒有說服力。相反地,若我們覺得結果符合自己的想法,就同樣有理由可以聲稱,新研究發現有其道理。這整個過程都很透明,符合民主精神,而且也是量化標準」
◆◆◆
「中位數的定義是資料對半切分後出現的值:因此,所有的量測結果,有50%低於中位數,另外50%高於中位數。遵循鐘形曲線的資料,中位數正好等於平均值」
「以『你拿的比較少有限公司』為例,實際上根本沒有人拿到平均薪水,因為肥貓的薪資高得不像話,拉高了平均薪資,但平均薪卻毫無意義可言;反觀中位數薪資,只有普普的25000英鎊。一般來說,中位數遠低於平均數,表示分配往較低值嚴重偏態;平均數會被偏離值高而誤導,在這裡,偏離值就是肥貓的薪資。」
◆◆◆
「最小平方法(method of least squares),或稱線性迴歸法(linear regression),雖然這個名字也沒有比較好懂。基本上,這個方法就是在一堆亂無章法的資料裡畫出一條直線,但這條線並非隨便畫的,它是一條最適線。『最適』的精確定義偏技術性,不過基本而言,若要如右頁圖般畫一條盡可能貼近最多資料點的線,它必須精確符合某些數學條件。」
「用線性迴歸法在資料中尋找關聯性,最根本的問題一如尋找相關性:資料本身到底有無任何關聯,都還很難說!」
◆◆◆
1990年,哈利.馬可維茲(Harry Markowitz)獲頒諾貝爾經濟學獎。「他寫下來的方程式,成為如今稱為現代投資組合理論(Modern Portfolio Theory, MPT)的基礎。就表面上看來,現代投資組合理論達成了某種奇蹟:把投資組合裡各項資產的歷史資料輸入其中,就能顯示應持有的最佳資產組合。」
「即使是業餘投資人,只要檢視某些資產的過往績效,找出報酬、相關係數及風險(以報酬的變異數衡量),就能借力於現代投資組合理論。」只要將各項數字輸入方程式,就能夠得出「各項資產所需百分比,以建立分散化、風險降至最低、同時報酬還不錯的最佳化投資組合。」
不過,無數投資人越想越不對勁,「現代投資組合理論雖然證實了分散化投資的價值所在,卻引發更多問題。」像是,該用變異數還是或然率來量測風險?輸入的數字直接取平均值嗎?還是取特定時間區間的數值?「更糟的是,當在你身處金融危機,最需要資產分散化走勢時,偏偏投資人的從眾心理經常使負相關資產同步走跌。」
「面對這種種挑戰,許多投資人發現很難信任現代投資組合理論的數學原理,就連馬可維茲本人也不例外。就在他研發出這套理論後不久,他也得建立自己的退休帳戶投資組合。他理應分析各項資產的績效記錄,計算出最佳組合;然而他卻發覺自己無法面對這樣做可能會出錯的後果,於是就單純地把一半的錢放在股票,另一半放在債券。」
XDDD