2011/11/14

讓資料更容易解讀的 Gapminder

Hans Rosling 是瑞典公衛系教授,他開發一套叫做 Gapminder 的軟體,可以把各國的長期統計資料轉化為美麗的動態圖表。

平常看統計數字時,最害怕的就是難以找到這些冷冰冰的數字中隱含的意義,但是 Gapminder 將資料依年份轉換為可見的圖表,而且同時呈現不同國家的資料,方便我們比較、解釋。看看 Hans Rosling 的演講 & 他如何利用 Gapminder 進行演示就知道這套軟體強悍之處了。

好消息是,Gapminder 是免費使用的軟體,祇要從它的網站下載安裝,就能夠使用 Gapminder 內附的資料,發掘相關的問題。

Gapminder 相關訊息

網站:www.gapminder.org
用途:統計圖表

Gapminder 安裝

連上 Gapminder 的網站可以看到 Hans Rosling 教授用他的背影歡迎我們的到來……點選 Downloads 就可以進入 Gapminder 的下載、安裝頁面。

進入 Gapminder Downloads 頁面
圖、進入 Gapminder Downloads 頁面

在下載頁面中,點選 『Click here to learn more & install』選項就可以開始進行安裝。

點擊安裝連結
圖、點擊安裝連結

在接下來的畫面點擊『Install Now』再一次確認現在就要安裝 Gapminder。

立即安裝 Gapminder
圖、立即安裝 Gapminder

不過安裝 Gapminder 之前,必須先裝好 Adobe AIR。如果之前沒有裝過,則會出現一個小小的畫面詢問我們是不是要安裝 Adobe AIR?不裝不行啊,所以當然就點選『是』,先行安裝 Adobo AIR。

安裝 Adobo AIR
圖、安裝 Adobo AIR

Adobo AIR 裝好後,會自動進入下一步,準備進行 Gapminder 的安裝。

準備安裝 Gapminder
圖、準備安裝 Gapminder

又要再確認一次……安裝吧!安裝吧!不要再問我了。

確認安裝 Gapminder
圖、確認安裝 Gapminder

接著選擇要把程式安裝到哪個地方去,如果沒有特殊需求的話,選擇內定值就可以了。

選擇程式的安裝位置
圖、選擇程式的安裝位置

設定好安裝位置後,祇要再同意使用條款,就可以正式安裝 Gapminder 了。

同意 Gapminder 的使用條款
圖、同意 Gapminder 的使用條款

開始使用 Gapminder

Gapminder 並不龐大,一兩分鐘之內就可以安裝完成。裝好第一次使用時,會出現一個歡迎畫面,按一下畫面上的 Start 按鈕即可使用 Gapminder。

開始使用 Gapminder
圖、開始使用 Gapminder

Gapminder 內附各國歷年統計資料,要以圖表觀看這些統計資料的話,選擇 Open Gapminder World 選項就可以開啟圖表視窗。

開啟統計圖表
圖、開啟統計圖表

開啟統計圖表後,可以看到許多小泡泡在畫面中。這每一個小泡泡代表一個國家,泡泡的大小則與該國總人口有關。如果好奇某個泡泡到底有多少人的話,右下角有個小小的比例尺可以參考 (也可以在 Map 畫面觀看各國人口成長。)

因為 Gapminder 用的是長期追蹤資料庫,所以它的統計數字都有多年數據。點擊左下角 Play,就能以動態方式呈現歷年的資料變化。

Gapminder 的泡泡統計圖表
圖、Gapminder 的泡泡統計圖表

識字率與人均 GDP 是否有相關性?

Gapminder 含有各式各樣的統計數字,無聊的話可以拿不同的數字畫圖表,也是一件滿有趣的事。當然這不能做為『因果關係』的推論,但是可以看看不同組資料間是否具有相關性。

比方說,我很想知道國民識字率與該國人均 GDP 是否具有相關,所以我就從 Gapminder 內附數據中找出這兩類資料畫圖表。

首先,我在 X 軸選擇 Education ==> Literacy ==> 15 and above,查看 15 歲以上國民識字率的統計資料。

X 軸選擇國民識字率
圖、X 軸選擇國民識字率

另外選擇 Economy ==> Income ==> GDP,將其設定為 Y 軸。

Y 軸選擇人均 GDP
圖、Y 軸選擇人均 GDP

接著按下 Play 後,就可以看到各國國民識字率與人均 GDP 的逐年變化。可以看得出來國民識字率越高,人均 GDP 也越高。

也許是國民教育程度提昇後,可以從事較高收入的工作,因而提高了 GDP;也可能是反過來,因為 GDP 的提昇,讓國民有辦法獲得更好的教育,而提昇其識字率。當然也有可能是某個我們未知的因素同時影響了這兩個觀察類別。因此 Gapminder 呈現的祇是相關性,而非因果關係。

各國國民識字率與人均 GDP 歷年變化
圖、各國國民識字率與人均 GDP 歷年變化

如果對於某個國家特別有興趣,可以在右手邊的國家清單中進行勾選,這個國家的資料就會在畫面上留下軌跡,方便比較。

比方說,我們對隔壁國家有些興趣,想知道隔壁的變化,就在清單中勾選 China,它的軌跡就會保留下來,方便觀察。

設定中國為觀察對象
圖、設定中國為觀察對象

勾選好要觀察的對象後,按下 Play,泡泡的移動軌跡變得清晰易懂。明顯可知中國從 1982 年有資料記錄開始,國民識字率 & 人均 GDP 都呈現上揚趨勢。尤其 2000 年之後,中國的識字率 & 人均 GDP 均大幅上升。

保留變化的軌跡,方便觀察比較
圖、保留變化的軌跡,方便觀察比較

思考遊戲

因為 Gapminder 擁有多國、多年、多向度的資料,因此可以用來做為思考遊戲的工具。

比方說我在看各國每 10 萬人中謀殺者的比例時,發現 1990-1994 這幾年間,俄國的謀殺者上升為 1990 年之前的三倍,原本每 10 萬人祇有 10 個謀殺者,至 1994 年每 10 萬人有 31 人涉入謀殺。同一時間,新加坡每 10 萬人祇有 0.54 位謀殺者,相較之下,那一時期的俄國真的是動盪不安。

1994 年俄國行兇者是 1990 年的三倍
圖、1994 年俄國行兇者是 1990 年的三倍

問題來了:究竟是什麼原因造成那個時期的蘇俄行兇者暴增三倍?數字已經告訴我們有這個結果了,但是原因呢?你有答案嗎?

Technorati : , , , , , ,

1 則留言:

  1. 底下是針對俄國兇殺案大增一事,我與小 P 老師的對話記錄:

    Pong Cheng:
    會不會是一二次世界大戰?
    還是烏克蘭大饑荒



    Yukie Chen:
    不是啦!;)

    因為 Gapminder 記錄的是 1990 年之後的資料,所以沒有一、二戰那麼早啦!烏克蘭大饑荒是 1930 年代的事,也早了點。

    我很好奇的是 1990 年代,俄國怎麼會兇殺案爆增三倍。還得看看蘇聯其他國家有什麼大事。



    Pong Cheng:
    喔喔,你說的是兇殺案... :p 我一直看到平均壽命那邊去



    Yukie Chen:
    從 1990 年開始,俄國的兇殺開始變高。

    從每 10 萬人 10 個兇手開始增加,到 1994 年達到最高點,每 10 萬人 30 個兇手,之後逐年下降。

    到 1997 年降到每 10 萬人 20 個兇手,然後又開始跳升,在 2001 年又返回每 10 萬人 30 個兇手的高峰。

    2002 年開始下降,到 2005 年降為每 10 萬人有 20 個兇手。2005 年之後就沒有記錄,不知道現今如何。

    這份資料裡面沒有我們比較熟悉的台灣資料,也沒有美國、日本、德國、法國可以比較。

    有中國的,但是中國的資料我不太相信。

    勉強拿個希臘來比較好了。希臘的殺人兇手一直都是在 10 人/10萬人 以下。新加坡是 0.54。

    所以那個時候的俄國真的是動盪不安啊。




    Yukie Chen:
    蘇聯解體從 1990年3月11日立陶宛脫離蘇聯開始,至 1991年12月16日哈薩克離開為止。

    時間點符合。

    所以,或許是因為蘇聯解體,社會不穩定造成 1990 年代初期兇殺案大增的原因?

    回覆刪除