2024年7月27日 星期六

機率思考:大數據時代,不犯錯的決斷武器


作者:羅伯.麥修斯(Robert Matthews)
譯者:高英哲
出版社:大牌出版


「平均律告訴我們,當我們知道(或有預感自己在處理涉及機率的事件時),不應著重在事件本身,而是要注意相對頻率,也就是每個事件各自的出現次數占總次數的比例。」

◆◆◆

「解讀看似「隨機」的事件時,不要自動假設它們為獨立事件。世界上有許多事件並非獨立事件;若假設它們是獨立事件,機率的估計結果有時會極其誤導。」

📝 買到一盒好幾顆雙蛋黃的蛋。

◆◆◆

「1970年代,加拿大麥克馬斯特大學(McMaster University)心理學家諾曼·金斯伯格(Norman Ginsburg)曾經有項研究是要求受測者隨機寫下100個連續數字。大多數受測者都能寫出毫無規則的數列,只出現少數幾個重複,連號或是任何模式。換句話說,受測者都會盡其所能確保每個數字都有『公平機會』,出現在這串毫無模式可言的數列中。但這項測試也正好反映出,受測者對於隨機性的根本誤解。」

◆◆◆

「根據表現做決策時,對於非凡的表現要特別當心。根據定義,非凡的表現就是不具代表性的資料。拜回歸平均數非凡的均等效應所賜,非凡的表現特別容易以失望告終。」

◆◆◆

「研討會上發表的聲明不值一顧,等發表在重要期刊時再說。即使真的發表,也請切記,這是值得關注的必要條件,不是充分條件。頂尖期刊也可能(確實也曾經)出現無稽之談。」

◆◆◆

「馬克斯普朗克人類發展研究所的史蒂芬.荷索(Stefan Herzog)跟拉夫.荷威格(Ralph Hertwig),想出一個能達成這個目標的技巧:辯證拔靴法(dialectical bootstrapping)。幸好這項技巧的內涵,比它的名稱簡單。

首先,不管要預測什麼事,隨便找個想法,做初步的猜測,並記下來。現在想像有人說你這個猜測不對,接著思考哪裡可能出錯,哪裡假設可能不正確,如果改變這些假設,有何影響?預測結果會因此變高或變低?然後根據你對問題的新見解,再次估計。荷索跟荷威格有個卓越的發現:一般來說,兩個猜測的平均值,比任一個別的猜測值,更接近真正的答案。」

◆◆◆

玩越久、越多次,優勢就會漸漸倒向莊家,因為賭場就是這樣設計的,所以減少玩的次數,然後見好就收:「你若帶了100英鎊去賭場,決定在輪盤上試手氣。視生意狀況而定,輪盤一小時大概可以玩30到40次。如果你一注10鎊,花15分鐘賭完,至少不輸不贏的機率會略高於一注5鎊玩半小時。因為一注10鎊只需10次,一注5鎊要玩20次,曝露在莊家優勢下的時間若能減半,就能把在輸光前贏得50鎊利潤的機率,從三分之一提高到大約一半。若你賭10把押紅或押黑,就數學上來說,至少不輸不贏的機率超過一半,還有將近三分之一的機率可以賺到錢,而且你百分之百可以說,你玩輪盤時完全知道自己在幹嘛。」

◆◆◆

或然率的奇特表述:「運彩賭徒下注是為了贏錢(至少理論上是),因此傳統上,他們不以或然率描述事件機率,而是說下注贏了之後能有多少利潤。舉例來說,他們不說某匹馬有22%的機率勝出,而是說某匹馬『2賠7』(7 to 2),意思是每下注2鎊,賭贏的利潤是7鎊。若要把『X賠Y』的賠率換算成以百分比顯示的或然率,就用x除以X+Y,再乘以100。對於高或然率的事件,賭徒會說這事件『3賠1』(3 to 1),意思是每下注3鎊,只有1鎊的利潤。若要把這些賠率換算成百分比,也是套用同樣的公式,如『3賠1』就是75%。」

「不過,博彩公司貼出的實際賠率不會是4賠6,而是接近「一半一半」,意即有50%的機率勝出。義如其字,一半一半的賠率是你每下注4鎊,贏了就給你4鎊。這比4賠6的彩金吝嗇多了。換句話說,這樣的賭博報酬對賭客並不公平,而中間的差額就到博彩公司的口袋。任何認為博彩公司的賠率,準確反映事件發生機率的人,完全落入博彩公司的陷阱。博彩公司貼出的賠率,相當於賭場假裝公平的賭金,事實上完全不是那麼一回事——而中間的差額,就是他們的獲利邊際(有時稱為『莊家優勢』或『抽頭』),經常達到20%以上。」

◆◆◆

在不確定性下做任何決定,首先要問一個問題:可能的結果是什麼?回答這個問題的基本方法,出自17世紀卓越的法國大學者、率先研究或然率理論的帕斯卡(Blaise Pascal)。這個方法如此強大,卻極為簡單:對不確定事件的預期結果,可藉由結果乘以發生的實際機率做為評量。例如,有個賭注贏得100鎊的機率是20%,這100鎊是賭注的結果;根據帕斯卡的主張,我們對這個賭注的預期結果,是100鎊乘以20%(發生機率),即期望值20鎊。就這麼簡單,但有道理嗎?畢竟我們實際上得到的,不是100鎊,就是一毛也沒有,永遠不可能是20鎊。當然,只有賭了才知道是哪一種結果,但到了那個時候,恐怕有點為時晚矣。」

「我們也要面對輸的可能,而輪的風險高 80%。因此,我們現在再應用一次帕斯卡法則,看輸的結果如何。我們顯然不希望預期損失超過預期利得,因為這意味著長期來說會輸錢。在這個例子中,我們可以做的是不要拿太多錢冒險,以免輸掉的80%,超過預期會贏的錢,也就是20鎊。這表示拿去冒險的賭金不能超過25鎊(25 × 80% = 20)。」

◆◆◆

延長保固:「有間超市收費99鎊,提供價值349鎊的新電視五年保固。付99鎊買五年心安,似乎不算很多,然而若從期望值理論來看,你可能會再想一想。電視故障的『期望損失』,就是這台電視的成本乘以故障機率。我們不知道故障機率是多少,不過我們知道,期望值不應該超過我們被要求支付的99鎊保險費,因為這麼一來,我們就等於是為電視機故障的風險過度投保。因此,電視的保固費,只有低於349鎊乘以壞掉風險時,才值得購買;換算一下,這等於說電視在五年內壞掉的風險,至少是99/349(約28%)。你若覺得這個電視機故障機率合理,那就可以買保固。不過,你可能想先了解真正的故障率是多少:《買哪個好?》(英國消費者協會發行的雜誌)查過了,實際的故障率僅5%。比起99鎊保險費對應的合理最低故障率,這實在低太多了吧?現在,我們也可以算出合理的保險費:349鎊乘以5%的故障率,也就是約18鎊,僅僅只是99鎊的一小部分。」

「同樣的基本觀念,也可以用在評估購買遺失險或竊盜險:合理保費大約等於裝置價值乘以遺失或竊盜的機率。這時候就值得查一下犯罪統計數據,而保費只要超過該裝置價值的幾個百分點,就是不折不扣的剝削。即使沒有確切的數據,也可以用個人經驗評估風險。某件事未曾發生在你身上,光是這個事實就已經透露非常多事情。只要做點計算就會發現,儘管某事件有N次機會發生,卻始終沒有發生的話,那麼你可以很有把握,該事件發生的頻率不會超過3/N。因此舉例來說,倘若在過去五年內,你擁有N個東西,卻從未遺失過任何一件,那麼如果未來情境類似,你使用新裝置卻遺失的機率,很可能低於3/N。如果擁有大約幾十項物品,那麼3/N約等於10%,因此為未來五年的遺失或竊盜風險所付的合理保費,就不應該超過物品價格的10%,也就是每年保費大約是購買價格的2%。」

「買房屋險或是海外醫療險,卻是另外一回事。你可能認為出國幾天生病的風險很低,根本不值得付20鎊的保費;但是住院費與送返國門的成本,隨便就超過這個數目一萬倍。當賭輸的代價是欲哭無淚的20萬鎊帳單時,你真的能信心滿滿地賭這些倒楣事發生的機率低於1/10000嗎?

這裡點出保險以及一般決策的關鍵事實:事情完全取決於背景架構。你若很窮,即使是保費合理,也可能超出你的負擔;無論你有多理性,你只能賭自己運氣夠強。另一方面,有錢人實際上可能願意付出比合理水準更高的保費,只因為錢對他們來說比較不算什麼。」

📝要考慮賭輸的後果。

◆◆◆

「我們可以利用帕斯卡原則,成為自己的保險人;」

「只要將事物的價值乘以逢厄的風險,算出合理的保費,然後分期將『保費』提撥到一個『沉沒基金』(sinking fund,亦即只存不提)。此外,我們也可以一次提撥原本要繳給保險公司的保費(保證比你需要用到的還多)。無論用哪種方式,若是碰上災厄,我們都有保障;若平安無事,我們也有了一筆還不錯的儲蓄。」

◆◆◆

「假設謠傳屬實的機率是P,那麼謠傳為假的機率就是1-P(因為這兩種結果裡一定有一個為真,因此機率加起來必須等於1)。所以按兵不動的期望後果,就等於 -10P + 7 (1-P);搬家的期望後果,則等於2P + (1-P)。把這兩個期望後果中間畫上等號,就能算出P高於哪個值的時候,搬家會導致比較正面的後果。我們因此發現,倘若謠傳屬實的機率超過1/3,搬家就比較有道理。」

◆◆◆

概似比:「例如,倘若在篩檢結果出爐前,認為某位病人罹患乳癌的機率僅5%,就等於把對罹患乳癌機會的最初看法設定為0.05。假設篩檢方法在有乳癌的情況下,得到陽性反應的或然率是80%,而沒有乳癌卻得到陽性反應的機率(「假警報率」)是20%,那麼這項篩檢的概似比就是0.8/0.2=4。貝氏定理告訴我們,篩檢結果呈陽性反應,我們對病人罹患癌症的相信程度,應該從最初的0.05提升到4倍,因此更新後的機會是0.2。把這轉換成或然率,就表示有17%的機率罹患乳癌,因此儘管篩檢結果呈陽性,還是有83%的機率並沒有罹癌。」

概似比(這個比率表示證據的強度)= (Pr⁡(假設你相信的是為真,而觀察到的證據))/(Pr⁡(假設你相信的事並非事實,卻觀察到證據))

◆◆◆

「如抽到一張紅色撲克牌是方塊的或然率(50%),等於抽到一張方塊撲克牌是紅色的或然率(100%)。在把證據轉化成見解時,若是不慎把條件或然率倒反過來,正是釀成大災難的最好方法。」

📝 抽到一張方塊,可以100%確定是紅色,但不表示抽到紅色也可以100%確定是方塊。

◆◆◆

「Pr(有罪下自白)必須大於Pr(無罪下自白)講得更直白點,我們必須有把握,一個罪犯自白的機率,大於無罪者自白的機率。這當然是個可以爭議的問題,而這正是關鍵所在:我們顯然不能斷定這個條件舉案皆然。」

「貝氏定理的重點,在於要對這兩種或然率加上限制:因為事實上很難保證,事情一定是其中的哪一種狀況。只需稍微想一下,就會發現某些類型的犯罪,可能會出現完全相反的情況。」例如:訓練有素的職業殺手或恐怖份子,他們自白的機率很可能遠低於無辜者。「根據貝氏定理,職業殺手開口自白的機率,光和無辜者一樣是不夠的,必須更可能開口自白,才能在這個案例中成為判定有罪的有用證據。」

◆◆◆

「若要評估證據的份量,我們還需要知道偽陽性率,而偽陽性率必須低於真陽性率才行」

Pr(有腦瘤時,一直頭痛)
或然率約為50%到60%。

這時,你可能會輕易認為「反之亦然」,即:

Pr(一直犯頭痛的情況下,結果是罹患腦瘤)
或然率也約為50%到60%。

運用完整的貝氏定理,可以得知:

頭痛時,罹患腦瘤的機率 = LR x 罹患腦瘤的機率

LR = (Pr⁡(罹患腦瘤,一直犯頭痛))/(Pr⁡(沒有罹患腦瘤,一直犯頭痛))

「現在我們不必杞人憂天,原因有二。首先,也是最重要的,腦瘤很罕見,每年幾千人才有一個確診,因此患腦瘤的事前或然率非常低。不過,若如此低的事前機率,被非常高的LR 拉高的話,那我們就有理由要擔心。我們已有一半計算LR所需的資訊:若罹患腦瘤,有50%到60%的機率會頭痛。幸好這只是LR公式的分子;我們還得知道若沒有罹患腦瘤,犯頭痛的或然率是多少。由於頭痛是非常普遍的現象,或然率相當高,因此LR不會太高。總結來說,低事前機率加上普普的LR,因此頭痛是因為罹患腦瘤的機率很低。」

◆◆◆

工具:Bayesian Credibility Analysis,該頁面允許根據當前知識評估臨床試驗結果的可信度。

◆◆◆

「『貝氏推論引擎』能告訴我們,必須要對資料具有多少事前相信程度,才能產生具有說服力的結論。我們只需決定一件事:我們是否認為那樣的事前相信程度確實合理?我們可能會覺得那實在荒謬,這時我們完全有理由認為,新研究發現沒有說服力。相反地,若我們覺得結果符合自己的想法,就同樣有理由可以聲稱,新研究發現有其道理。這整個過程都很透明,符合民主精神,而且也是量化標準」

◆◆◆

「中位數的定義是資料對半切分後出現的值:因此,所有的量測結果,有50%低於中位數,另外50%高於中位數。遵循鐘形曲線的資料,中位數正好等於平均值」

「以『你拿的比較少有限公司』為例,實際上根本沒有人拿到平均薪水,因為肥貓的薪資高得不像話,拉高了平均薪資,但平均薪卻毫無意義可言;反觀中位數薪資,只有普普的25000英鎊。一般來說,中位數遠低於平均數,表示分配往較低值嚴重偏態;平均數會被偏離值高而誤導,在這裡,偏離值就是肥貓的薪資。」

◆◆◆

「最小平方法(method of least squares),或稱線性迴歸法(linear regression),雖然這個名字也沒有比較好懂。基本上,這個方法就是在一堆亂無章法的資料裡畫出一條直線,但這條線並非隨便畫的,它是一條最適線。『最適』的精確定義偏技術性,不過基本而言,若要如右頁圖般畫一條盡可能貼近最多資料點的線,它必須精確符合某些數學條件。」

「用線性迴歸法在資料中尋找關聯性,最根本的問題一如尋找相關性:資料本身到底有無任何關聯,都還很難說!」

◆◆◆

1990年,哈利.馬可維茲(Harry Markowitz)獲頒諾貝爾經濟學獎。「他寫下來的方程式,成為如今稱為現代投資組合理論(Modern Portfolio Theory, MPT)的基礎。就表面上看來,現代投資組合理論達成了某種奇蹟:把投資組合裡各項資產的歷史資料輸入其中,就能顯示應持有的最佳資產組合。」

「即使是業餘投資人,只要檢視某些資產的過往績效,找出報酬、相關係數及風險(以報酬的變異數衡量),就能借力於現代投資組合理論。」只要將各項數字輸入方程式,就能夠得出「各項資產所需百分比,以建立分散化、風險降至最低、同時報酬還不錯的最佳化投資組合。」

不過,無數投資人越想越不對勁,「現代投資組合理論雖然證實了分散化投資的價值所在,卻引發更多問題。」像是,該用變異數還是或然率來量測風險?輸入的數字直接取平均值嗎?還是取特定時間區間的數值?「更糟的是,當在你身處金融危機,最需要資產分散化走勢時,偏偏投資人的從眾心理經常使負相關資產同步走跌。」

「面對這種種挑戰,許多投資人發現很難信任現代投資組合理論的數學原理,就連馬可維茲本人也不例外。就在他研發出這套理論後不久,他也得建立自己的退休帳戶投資組合。他理應分析各項資產的績效記錄,計算出最佳組合;然而他卻發覺自己無法面對這樣做可能會出錯的後果,於是就單純地把一半的錢放在股票,另一半放在債券。」

XDDD

2024年7月23日 星期二

角豆莢偷走了巧克力?:60堂煎煮炒炸的化學課


作者:羅伯特.沃克
譯者:邱文寶
出版社:臉譜


「另外魚肉會變得較不透明,那是因為光線無法穿透緊密結合交聯的蛋白質分子(同樣情形發生在蛋白的蛋白質上:煮過的蛋白會從透明變成不透明的白色)。」

◆◆◆

「而所謂『治療浴』這種萬靈藥,無法像墨水進入吸墨紙般穿透我們的皮膚。不過這項事實還是無法停止藥膏、鎮痛軟膏製造商,宣稱他們能提供『深度穿透性止痛力』或類似效果的廣告詞。這些產品造成皮膚不適,於是身體會增加該處血液循環以試圖改善這種不適,因此皮膚會感到些許灼熱。

既然談到誇大療效的議題,這裡我也附帶一提,磁場的確會穿透人體,不過又怎樣?那些縫上磁鐵的墊子或包巾所宣稱的療效,簡直就是鬼扯。」

「在此大聲疾呼反對庸醫騙術的目的,是想強調浸泡『商品』的作法,效果只侷限於表面,」「浸泡作法,即使將肉去皮,也無法深入將味道傳送到整塊肉中。因此浸泡只是表面現象。」「不過,牛腹脅肉這類帶有纖維組織的肉品,可提供纖維間的毛細管讓醃汁流過,特別是當肉以銳利的角度,沿紋理切成小片時。」

「與一般人的認知相反,若我們想以叉子穿刺肉,產生的穿孔在作為醃汁流入的通道上不僅徒勞無功,甚至還會出現反效果。刺穿的傷口會因肉本身的彈性而幾乎立即閉合。除此之外,這些潛在通道可能在稍後,因為烹飪高溫將肉收縮,而成為汁液流失的通道。不過浸泡前,切割或劃開肉塊,確實能強化口味,因為能暴露更多的浸泡表面積。」

◆◆◆

攝氏與華氏溫度轉換法:

1. 你想轉換的度數(不管是華氏或攝氏)加上40。
2. 將結果乘上或除以1.8(華氏總是比相對的攝氏溫度大,所以攝氏轉華氏就乘1.8;華氏轉攝氏就除1.8)。
3. 再減40。

◆◆◆

「底下是熱與溫度之間的差別:一鍋熱湯可能會有特定的溫度,也就是說,它可能每盎斯含有特定的熱量。當你從鍋中起一湯匙的湯,匙中的湯溫度與鍋中的湯溫度相同,不過匙內所含的熱量要少許多,因為湯匙裡的湯少上許多。」

◆◆◆

「溶解(dissolving):糖在咖啡中與鹽在湯中所發生的並非熔化而是溶解。溶解源自拉丁文的dissolvere,意思是分解。固態糖與鹽的晶體結構的確分解或碎裂,而其產生的微粒(分子或離子)會自由地在水分子間游走。在水中,糖和鹽不會像被熱液化時那樣熔成塊,而是成為看不見的溶解形式:在溶液中。」

2024年7月13日 星期六

非理性繁榮:股市。瘋狂。警世預言家


作者:羅伯.席勒(Robert J. Shiller)
譯者:黃嘉斌
出版社:寰宇


  • 把最近發生的這些事件,擺在更長的歷史架構上觀察。
  • 目前狀況究竟是新發生的現象,還是過去已經有許多案例?
  • 住宅價格是否如同許多秉持繁榮心態的人所說的,存在穩定而強勁的長期上升趨勢?或這一切只是他們的想像?

◆◆◆

「大部分人會認為,可能影響將來就業收入的壞消息,以及可能造成不確定性的壞消息,都應該造成股票價格的下跌,而不是上漲,但經濟學理論的看法卻剛好相反。」「我們或許可以稱此為『鐵達尼號救生圈理論』。乘客如果發現船隻即將沉沒,則任何會浮的東西,包括救生圈、桌椅等都會突然變得非常有價值,但價值提升並不是因為這些東西的物理性質改變。同樣的,當人擔憂自己的收入無法穩定或持續,而且又沒有太多理想的投資機會食,他們可能就會開始追逐既有的長期投資工具,希望未雨綢繆,多儲蓄一點錢,以備將來不時之需。他們可能沒辦法多做實質的儲蓄。即使他們認為這些資產目前的價格已經偏高,將來可能虧損,但還是繼續持有。」

◆◆◆

「根據故事而建立的論述極具力道,因為這類陳述總是把成功投資表達成控制自身內在衝動的過程,而不是把當前狀況放置到歷史中去考慮,令讀者忘卻當時面臨的特殊市場價格水準。」「群眾往往讚賞那些無視於行情波動,耐心慢慢賺錢的人。這也是很多暢銷書刻畫的影像,其中最著名的著作包括湯瑪斯.史丹利與威廉.丹科所著的《原來有錢人都這麼做》」。

◆◆◆

「事實上,我們在泡沫行情發展過程中看到的狂熱現象,即表示了群眾普遍上並未認知泡沫現象的存在。人們如果認為價格上漲只是一種從眾行為,將在未來某個時候突然中止,則我很難想像這一切有什麼值得興奮的。」

◆◆◆

「群眾全神關注投資,將創造無比的誘因,吸引這類專家投身金融管理行業。一旦這些等同於專業魔術師(騙人的專家)的人幫我們經營企業,或擔任房地產經紀人,我們就不應該期待會看到真實的東西。」

◆◆◆

「市場冒現了一些蔚為風潮的商業雜誌,不是因為讀者需求,而是因為這類公司(只打算靠新潮的概念吸引投資人的科技公司)需要在雜誌上刊登廣告,作為他們操作手段的一部分;有些雜誌後來也關門大吉了。」

◆◆◆

我們或許可以稱投機性泡沫為自然產生的龐氏騙局,這場騙局沒有主導者負責操控,所以發展比較不規則,也比較不誇張;但是,一旦自然產生的故事發揮推動力,有時候局勢發展確實就跟龐氏騙局一樣。」

📝 大家一窩蜂投入市場,先進市場的人賺走後面的人投入的錢,一直持續下去,價格不斷推高,最後進市場的人因為沒有後續的人進來,於是就賺不到錢了。

◆◆◆

「『投資組合保險』一詞用得並不恰當,因為該策略實際上只是賣出股票的計畫。雖然引用貌似高深的複雜數學模型,實際上不過只是一套教你如何在股價下跌時賣出股票並逃離市場的程序。」「所以,即使採用投資組合保險策略,投資人也不過是做著他們原本就自然會做的事情,只是增添一些數學精確性和周詳計畫罷了。」

◆◆◆

「所以,雖然證據並不完美,卻也顯示五年期的重大走勢(無論漲跌)通常會迎來隨後五年的反轉。」

◆◆◆

「判斷股價水準時,近期價格可能是最有效的定錨因素。由於投資人普遍採用這種定錨因素,所以昨天與今天的股價經常相當接近。」

◆◆◆

「某支股票的價格變動可能對另一支股票的價格變動產生定錨作用;某支股票的本益比也可能對另一支股票的本益比產生定錨作用。這類定錨效應有助於解釋個別股票經常出現的類似走勢,因此也解釋了股價指數所呈現的劇烈波動——股價指數成分股的平均化並不能有效緩和價格波動,這即是原因所在。」

◆◆◆

「另外,相較於相同產業但企業總部設立在不同國家的股票,企業總部設在相同國家而隸屬不同產業的股票,股價往往更傾向於呈現類似走勢,然而一般人總是以為公司基本面應該更受到產業類別而不是總部位置的影響;這個有異於一般人預期的現象,原因也在於定錨效應。」

📝 為何?

◆◆◆

「定錨作用也可以協助解釋掛牌交易的房地產投資信託基金的表現為何更像股票,而不是其實際持有的房地產資產價值。」

◆◆◆

「後見之明的偏差,經常會讓世界看起來更具可預測性。」

📝 現在會失誤,都是因為當初沒注意到某件事,如果注意到那件事,就不會失誤了。

◆◆◆

「處在不確定情況下,人們的判斷會參考自己熟悉的型態,假定未來型態會類似於過去發生的型態,卻經常沒有考慮這些型態發生的理由,或形態重複發生的機率。這種人類判斷的異常現象,稱為『代表性捷思法』(representativeness heuristic)」。

  • 價格本益比偏高的股票,表現通常相對不佳
  • 淨值比偏高的股票表現通常也不佳
  • 股價存在某種形式的回歸均值現象(或折返較長期的歷史價格)——漲多者會下跌,跌多者會上漲

◆◆◆

「價值投資策略的根本精神,是要抽離價值高估的個別股票,而不是在整體市場顯得價值高估時脫離市場。」

◆◆◆

「這種簡單的智慧——股息相對於我們支付的股價如果偏低,通常就不是買進股票的好時機——實際上是受到歷史資料肯定的。」

◆◆◆