2011/01/01

骰子、硬幣與多基因遺傳

學生在上數學課的時候,都會學到不斷拋擲公平骰子的話,最後骰子各個數字出現的次數會很相似。

一個公平的骰子共有六個面,每個面出現的機會都是 1/6。拋擲的次數不多時某個數字可能比較常出現,但是拋擲的次數變多了之後,每個面出現的次數就會很接近 1/6。

但是課本中講的到底是不是真的呢?老師上課時大概也沒有時間讓同學拋擲骰子做統計,所以很難確認課本內容的真假。

拋擲一枚公平的骰子

不過沒關係,我們可以利用 Excel 模擬出公平骰子,再讓 Excel 執行骰子拋擲的結果。因為是利用電腦模擬的,所以要拋擲個幾千、上萬次都沒問題。

我們先拿一顆骰子拋擲 6000 次,看看結果如何吧!

從底下的圖片裡可以看到,骰子投擲的前 12 次中,1 出現了 1 次;2 出現 2 次;3 出現 4 次;4 出現 2 次;5 出現 3 次;6 出現 0 次。除了 2 & 4 這兩個數字,其他數字出現的機率都不等於 1/6。不過當我們把骰子丟 6000 次時,每個數字出現的次數就都很接近 1/6 (1000 次),(從這裡下載 Excel 原始檔進行測試,按一下 F9 鍵就會重新再丟 6000 次。可以看看是不是每次都有類似的結果。)

公平骰子擲 6000 次時各數字出現次數
圖、公平骰子擲 6000 次時各數字出現次數

再來,我們拿兩個相同的骰子來投擲 9000 次(選擇 6000 次、9000 次沒什麼特別意義,祇是單純想到這兩個數字),看看結果會如何吧!

兩顆骰子產生的組合變化

ㄟ,丟兩顆骰子的結果我們可以得到 2,3,4,5,6,7,8,9,10,11,12 等 11 種數字組合,將每種數字組合的出現次數畫個圖來表示的話,會發現兩端的 2 & 12 出現的次數最少;從兩端往中間靠隴時,出現的次數漸次增加,到最中間的 7 出現次數最多。

兩顆骰子一起投擲 9000 次的次數統計
圖、兩顆骰子一起投擲 9000 次的次數統計

為什麼 2、12 出現的次數會最少,7 會最多呢?我們來看一下用兩顆骰子時哪些情況下會丟出 2;哪些情況會丟出 7 吧!

表、丟兩個骰子可以得到的數值清單

  1點 2點 3點 4點 5點 6點
1點 2 3 4 5 6 7
2點 3 4 5 6 7 8
3點 4 5 6 7 8 9
4點 5 6 7 8 9 10
5點 6 7 8 9 10 11
6點 7 8 9 10 11 12

從上表我們可以發現丟兩顆骰子時共有 36 種可能性,其中祇有兩顆骰子都丟出 1 點的情況才會得到 2。所以丟出 2 的情況祇佔 36 種可能性中的 1 種,機率 1/36。如果我們以 (第一顆骰子的值, 第二顆骰子的值) 來表示骰子丟出的值,要丟出 2 的情況就祇有 (1,1) 才會發生;要丟出 12 祇有 (6,6) 的這種狀況才會得到 12。

相反的,要得到 7 就簡單多了,(1,6) 可以得到 7;(2,5) & (5,2) 也都可以得到 7,所以丟兩顆骰子出現 7 的機會大的多。

也就是說,祇有一顆骰子時,六個面的出現機率都是一樣的;而有了兩顆骰子時,開始出現各種不同組合變化,而使某些情況的組合方式較多、比較容易出現

那麼丟兩顆骰子時,總和為某個數字的機率有多少呢?我們來列表清算(*驚嚇*)一下:

表、丟兩顆骰子各種數字組合的出現機率

            (6,1)          
          (5,1) (5,2) (6,2)        
        (4,1) (4,2) (4,3) (5,3) (6,3)      
      (3,1) (3,2) (3,3) (3,4) (4,4) (5,4) (6,4)    
    (2,1) (2,2) (2,3) (2,4) (2,5) (3,5) (4,5) (5,5) (6,5)  
  (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
點數 2 3 4 5 6 7 8 9 10 11 12
機率 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

從上表可以發現,這個表格的樣子與前面把兩個骰子拋擲 9000 次的圖看起來很像。當我們把每個數字總和的可能情況列出來之後,就可以理解為什麼 2 & 12 的出現率最低,而 7 的出現率最高了:2 & 12 的出現率最低,是因為它們都祇擁有一種組合的可能;7 的可能組合種類最多 (六種),因此它的出現機會也最高。

『老師,老師,你用電腦模擬的好沒感覺喔,我很想自己試著丟看看,驗證你說的是不是真的。可是我們家沒有骰子,我爸應該也不會讓我買骰子吧,那怎麼辦呢?』

沒有關係,沒有骰子,但你總會有硬幣吧?我們可以丟硬幣後統計正反面出現結果來看看是不是一樣得到上面的圖形。

不過,硬幣祇有正反兩面,祇丟兩個硬幣的話不夠有趣。要玩就玩大一點,我們一次丟個六枚硬幣,來看看硬幣的結果會怎樣!

六枚硬幣響叮噹,叮叮叮叮叮噹

我們先準備六枚硬幣,每枚硬幣上寫上編號,然後將出現正面的結果記為 1,出現反面記為 0,這樣子我們會比較好記錄。比方說第一枚硬幣出現正面,其他五枚都是反面的話,就記為 (1,0,0,0,0,0);全都正面 (1,1,1,1,1,1);全都反面 (0,0,0,0,0,0)。

因為六枚硬幣拋擲結果共有 64 種 ( 26 ),記錄起來手會很痠 XD 記錄完後,我們將出現正面的結果統計一下,會發現在這 64 種結果中正面總數其實祇有 7 種,分別是出現 6 次正面、5 次、4 次、3、2、1,以及 0 次。

猜猜看丟六枚硬幣時,出現幾次正面的情形會最多?猜不到?來來來,我們把這 7 種狀況排成一列:

0123456

這樣的提示夠了嗎?你猜的出來了嗎?對,就像前面丟骰子的結果一樣,越中間的出現的機會越多,所以丟六枚硬幣時,出現三個正面的次數是最多的。因為我沒辦法在部落格上直接丟硬幣給你看,所以,我一樣是用 Excel 來模擬丟硬幣的結果。

丟六枚硬幣 10000 次時正面出現的次數統計
圖、丟六枚硬幣 10000 次時正面出現的次數統計

常態分布與鐘形曲線

上圖是用 Excel 模擬丟六枚硬幣 10000 次得到的結果,我們再一次看到兩端出現的最少、越往中央靠隴出現的次數越多,且最中央的項目出現次數最多的圖形了。也就是說在這種狀況下,我們很難遇到六枚硬幣都是正面 (1,1,1,1,1,1) 或是六枚都是背面 (0,0,0,0,0,0) 的結果,我們最容易遇到的是丟出 6 枚硬幣,其中 3 枚正面、3 枚背面。

這種極端值很少而中間值很多,而且每個類別連續的情況,我們稱之為『常態分布』。如果我們把前圖的長條圖頂點用線條連接起來,連起來的線條外形很像一個鐘,所以又可稱為『鐘形曲線』。

鐘形曲線
圖、鐘形曲線

在常態分布 (鐘形曲線) 的情況下我們較少遇到極端值,比較容易遇到中庸的傢伙。這種常態分布的狀況普遍存在於各個地方,比方說我們人類的膚色 & 身高就都屬於常態分布。

人類膚色與身高的常態分布

為什麼人類的膚色 & 身高會是常態分布呢?為什麼豌豆的高矮不是連續的常態分布,而是祇有高、矮兩種狀況呢?

想不出來?提示你,想一想前面提到的骰子 & 硬幣吧!

是的,豌豆的莖高祇有高矮兩種性狀的原因,是因為它的性狀由一對基因控制;而人類的膚色 & 身高呈現常態分布的原因就是這兩種性狀都是由多對基因控制,所以會有各種組合變化。

人類的膚色由三對基因控制,ㄟ,假設是 A、B、C 這三對基因好了,這三對基因的顯性為深色膚色,隱性為淺膚色,而且,擁有越多的顯性遺傳因子,膚色就越深,比方說 AABBCC 就會比 AaBBCC 膚色深;AABBCC 的膚色最深,aabbcc 的膚色最淺。

如果我們不用 ABC 表示,而以 1 表示顯性,用 0 表示隱性,所以膚色最淺的 aabbcc 表示為 (0,0,0,0,0,0),擁有 0 個顯性遺傳因子;膚色最深的 AABBCC 可以表示為 (1,1,1,1,1,1),一共有 6 個顯性遺傳因子,人類膚色的等級由淺至深可以分為 0123456 等 7 個等級。

ㄟ,這不是與前面 6 枚硬幣的例子一樣了嗎?

是啊,沒錯啊!要不然為什麼要讓你用 6 枚硬幣做練習,而不用 3 枚、4 枚 或 5 枚呢?這就是要為現在鋪梗啊,夠心機吧?學生是一種神奇的生物,但老師是一種心機重的生物!!:D

人類膚色分布
圖、人類膚色分布

不過我們還是回到我們的 ABC 三對基因吧!為了更清楚人類膚色分布,請你把底下的表格完成,看看膚色基因可以有哪些排列組合,各造成什麼樣的膚色:

表、人類各種膚色基因組合

        AABbcc      
               
               
               
               
        AabbCC      
               
               
               
               
  aabbcc aabbCc aabbCC aaBbCC aaBBCC AaBBCC AABBCC
膚色 超白 中偏白 中偏黑 超黑

 

外星來的訪客

因為人類的膚色是常態分布,所以如果今天有一個外星人來地球上做研究,他把地球人從 1 號編號到 60 億號,然後任意挑選其中幾個號碼的人出來觀察他們的膚色,這個外星人會發現他所抽中的人類中,黃皮膚的人會最多。而且運氣好的話,這些被抽中的人還可以一起在吧檯喝飲料聊天!

『等等,等等,等等!老師,你說的有問題!現在是黃種人最多沒錯,但是黑人的數量也很多啊!你到非洲去看,都是黑人比較多啊!而且他們的人口比歐美來的多,所以這個外星人如果從地球上任意抽選幾個人出來,可能黑人佔的比例也很高啊。』

呣,沒錯,雖然我們計算基因比例時發現黑人應該佔很低的人口比例,但是基因的表現會同時受到先天 & 後天的影響,而且一些環境條件也會對各種不同的膚色做出天擇而影響各地區的膚色人口比例。Nina Jablonski 說:『我們現在有 NASA (美國太空總署),可以知道全球各地紫外線分布的情形,以及其對人類膚色分布的影響。』

所以,外星訪客會找到很多黑人,這不是我們計算錯誤,而是紫外線搞的鬼啊!:P

參考資料:

  1. 圖解 Polya 計數法
  2. 機率: 化永恆於須臾的資訊表示法
  3. 從高矮看遺傳教學 -- 多基因遺傳教學記錄
  4. 多對基因所決定的遺傳特徵

Technorati : , , , , , , , , , , , ,

4 則留言:

  1. 人的身高在每個族群中,都呈現常態分佈的現象,同一族群的人有高有矮,中間的最多。
    但人的膚色,則是每個族群內部幾乎都是相同顏色,同一族群的每個人膚色幾乎都一樣。只有在族群之上,有白人、黑人、黃種人等之分。將人的膚色,以常態分佈來解釋,有待考慮。

    回覆刪除
  2. 您問的問題好棒喔,我希望我回答的正確 ^^a

    基因漂變講基因的分布會受到隨機原因的影響;比方說某些小島的居民都是色盲,因為第一批到達這個小島的祖先患有色盲,因而造成整個小島的居民日後都患有色盲。

    以色盲這個例子而言,『第一批到達者都是色盲』這是隨機因素,非色盲患者的船可能在途中翻覆了,而不是因為色盲基因有助於在海上生存的結果。

    但是深色膚色對於紫外線有較強的抵抗力,所以某些地區膚色深、某些地區膚色淺不是隨機的因素影響 (基因漂變),而是經過天擇後的結果啊!:)

    人的膚色是 3 對基因控制的;身高是 10 對基因控制。所以膚色 *理論上* 也是會常態分布,但是生物的實際生活環境影響了膚色的分布。

    就像,雖然我們的身高是常態分布,但是在籃球隊這個特殊的環境中,恐怕每個人的身高都趨近於一致。如果單看籃球隊,可能很難相信身高是常態分布的結果,但母群體放大時,常態分布就出現了。

    祇是,膚色的母群體就算是以整個地球來看,還是有偏向,因為整個地球的紫外線分布不均勻,所以膚色分布也就不均勻了。

    回覆刪除
  3. 老師以機率分布來說明多基因遺傳講解得很好!

    不過最後一個部分關於膚色的全球分布,除了genetic drift之外,還需考慮全球人類是否隨機通婚(random mating)。隨機通婚是造成多基因遺傳的結果成為趨進常態分布的重要推力,但實際上由於地理、人種、語言、文化的種種阻隔,造成全球人口並非很隨機的通婚,所以就全球的觀點來看,膚色的分布可能不會呈常態分布。

    另外,老師的回答提到紫外線的分布,在這個膚色的例子或許可以不用考慮這個變項,只要用未曬過太陽前的膚色來表示就好了,否則問題會趨於複雜。

    回覆刪除
  4. 老師以機率分布來說明多基因遺傳講解得很好!

    不過最後一個部分關於膚色的全球分布,除了genetic drift之外,還需考慮全球人類是否隨機通婚(random mating)。隨機通婚是造成多基因遺傳的結果成為趨進常態分布的重要推力,但實際上由於地理、人種、語言、文化的種種阻隔,造成全球人口並非很隨機的通婚,所以就全球的觀點來看,膚色的分布可能不會呈常態分布。

    另外,老師的回答提到紫外線的分布,在這個膚色的例子或許可以不用考慮這個變項,只要用未曬過太陽前的膚色來表示就好了,否則問題會趨於複雜。

    回覆刪除