作者:薩爾斯伯格
譯者:葉偉文
出版社:天下文化
「由於統計量是隨機的,因此問單獨一個統計量的值有多準確是沒什麽意義的;同樣的,討論單獨一個量測值有多準確,也沒有任何意義。我們需要的準則,必須以統計量的機率分布爲根據,就像皮爾生所說的,一組量測必須從它們的機率分布,而非觀測值本身的觀點來估計。」
◆◆◆
「假設(或顯著性)檢定是一種正式的統計程序,是在『待檢驗的假設爲眞』的假設下,去計算觀測到的結果的機率;當觀測結果發生的機率很小,我們就說原先的假設不成立。這裡很重要的一點是,假設檢定是一種否定(棄卻)某個假設的工具。在前面所舉的例子裡,待檢驗的假設是:這位女士只是靠猜的。假設檢定的目的不是讓我們肯定(接受)某個假設,就算與該假設有關的機率非常大也不行。」
◆◆◆
「長期來說,統計學家如果總是計算95%的信賴區間,他將發現,相關參數的眞値落在所求區間的機會,是總次數的95%。請注意,對尼曼而言,與信賴區間有關的機率,並不是我們『答對』的機率,而是統計學家使用某種方法、經過長時間之後,做出正確陳述的頻率。這個數字與目前的估計值有多『正確』,根本扯不上關係。」
◆◆◆
「假設有兩事件在一段時間內發生,就像先洗牌,再發出五張玩梭哈的牌,這時我們就稱這兩個事件分別爲『前』(before)與『後』(after)。說後面事件發生的機率以前面事件爲條件,是有意義而且說得通的;如果牌沒有洗好,當然會影響玩家得到一對A的機率。貝氏發現也可以反過來,計算在後面的事件已發生的條件下,前面事件發生的機率,這實在很詭異,也沒什麼道理。就像玩家已經拿到一對A之後,再來看看整副牌裡有四張A的機率是多少,或是已知一個病人罹患了肺癌,再回過頭計算他是癮君子的機率,或者是已經知道有個叫史密斯的人得到唯一的大獎,然後用這件事去看州立彩券公不公平。」
◆◆◆
1980年,賓州的三哩島核能發電廠發生事故。「這些指示燈當中有很多警告燈,其中幾個在以前曾經發出假的警告,因此在當時,操作員有個先入爲主的成見,認爲當他們看見一個新出現的警告燈亮時,就先當它是假的信號。結果,即使當警告燈的型態及相關的指示器都一致顯示反應爐的水位過低時,他們還是置之不理。這就是因爲他們的先前主觀(事前機率)太強烈了,所以雖有新的數據,也無法使事後機率產生多大的改變。」
◆◆◆
「所以,隨機樣本既比便利樣本更好,也比判斷樣本好。其中的原因,倒不是隨機樣本能保證得到正確的結果,而是由於它能計算出一個範圍,而正確答案落在這個範圍裡的機率很高。」
◆◆◆
「假定我們接受假設(或顯著性)檢定的觀念,大家都同意若一個現實假設的機率很低,那麼就可以決定棄卻(reject)這個假設。爲了容易說明,我們先設萬分之一(0.0001)的機率算很小。現在,我們安排一個公平的彩券,共賣出一萬個號碼,並考慮下面這個假設:1號彩券中大獎。這個假設的機率是萬分之一,因此我們棄卻這個假設。接著再考慮第二個假設:2號彩券會中大獎;同樣的,此假設的機率也是萬分之一,因此也被棄卻。所以我們可以用同樣的方式,棄卻每一個彩券號碼中大獎的類似假設。依照邏輯規則,若A不爲眞,B不爲眞,C也不爲眞,則A、B、C三者的聯集也不爲眞;也就是說,按照邏輯規則,若每一張彩券都不會中獎,那麼就沒有彩券會中獎。」
◆◆◆
「依據機率觀點所得到的決定是不合邏輯的,邏輯與機率論點相互矛盾。費雪靠著設計良好的實驗,利用顯著性檢定來使科學歸納推理合理化,但柯漢提出的悖論顯示,這種歸納推理其實是不合邏輯的。至於康菲爾德發現抽菸會導致肺癌,理由是來自許多研究累積下來的證據,但在這些研究當中,除非你假設抽菸會致癌,否則所有的研究結果都是極不可能發生的。這麼說,相信抽菸會致癌是不合邏輯的嗎?」
◆◆◆
「在邏輯上,對的命題和錯的命題是截然不同的,但在機率論的觀念裡,有些命題只是『有可能』或『幾乎』是對的,所造成的一點點不確定性,就足以讓我們無法把實質蘊含的冷酷精確性,應用到因果關係上。」