2010年3月5日 星期五

促進中文資料產出的幾項建議

美國有一位叫做湯姆‧克蘭西 (Tom Clancy) 的房地產股票保險公司職員,在工作之餘爬梳美國政府及軍方的公開文件,推敲其中的關聯性,利用這些資訊再加上自己的想像力寫成了一本海軍潛艦小說《獵殺紅色十月號》。小說在 1984 年出版,馬上獲得廣大讀者的喜愛。

由於小說內容十分詳盡,美國軍方還因此介入調查是否有軍方機密外洩。調查結果證明,一輩子沒當過兵的湯姆‧克蘭西祇是靠著公開可得的資訊及努力不懈的整理工夫就寫出了這一本細節詳實的作品。

2003 年,丹‧布朗 (Dan Brown) 寫的《達文西密碼》引起轟動,丹‧布朗將達文西的作品串連起來,加入謀殺、宗教、破譯謎題等元素,組成了一本動人的小說。

許多人批評《達文西密碼》用的資料有些是誤導讀者,或根本是虛構的,但撇開這些問題不談,《達文西密碼》確實是一本有趣、引人入勝的小說。

台灣的環境不利文化產出

台灣有沒有可能在哪一天也出現像《達文西密碼》、《獵殺紅色十月號》的小說呢?

我覺得以目前的狀況,台灣要出現這樣一本小說並不容易。寫這樣的小說需要查閱許多的資料、比對許多的圖片,因此,資料與素材越容易取得,越容易寫出內容豐富的小說。

面臨問題
  1. 可用的中文資源少
  2. 政府單位授權方式有問題
  3. 政府單位的資源未能良好整合

但台灣的資料民眾難以企及。這樣的結果是,在台灣要寫出一本像『達文西密碼』一樣的小說是很不容易的。當國外的作者祇要上網查查資料就可以得到足夠的素材時,台灣的資料卻常鎖在深宮中,祇有少數學者能夠接觸。

要寫出一本像『獵殺紅色十月號』一樣的小說就更困難了。湯姆‧克蘭西當初祇以美國軍方公開的資料就寫出了這一本膾炙人口的小說,但台灣連一般資料都難以碰觸,更不提軍方的資料了。所以這樣的小說在台灣難以出現。

除此之外,在網路興盛,全民均得以在網路上擁有一個發表的空間時,有些人發現想寫點什麼卻找不到相關的資料與素材,造成網路上可獲得的中文資料量進展相對慢很多。

當然,網路上中文資料量少、網友寫作量不多可能是眾多原因所造成,資料難以取得、素材的缺乏祇是其中之一,但如果能改善這個問題,就越有可能促進網路上中文訊息的產出。

現今許多中文資料、素材都在政府單位之中,如果能促成公部門將這些資料開放出來,就可以大幅改善中文資料不足的窘境。那麼公部門擁有哪些資源呢?

  1. 圖家圖書館裡有許多發行超過 50 年的書,那都是沒有智慧財產權問題的,可以提供所有人使用。
  2. 公部門每年的出版品。如農委會、中研院、工研院、科博館、美術館……各個單位每年都會利用全民繳納的稅金出版書籍、文件
  3. 公共電視台、國立空中大學錄製的電視節目
  4. 教育廣播電台播放的廣播節目
  5. 公部門各單位製作的各類型短片
  6. ……

上述的資源如果都能開放出來,對於整個中文資料、素材的提供不祇是數量上可以增加許多,質的部份也可以有大幅改進,所以是可以有一些方向來針對資料少的問題進行努力的。

不過,要如何釋出這些資源?讓各單位各自開發平台釋出嗎?釋出後要以什麼方式授權提供全民使用呢?

先談授權的部份吧。

公部門 (美術館、科博館、工研院、中研院……) 用納稅人的錢進行出版,所以必須將資料回歸全民使用,任何資料均應以創用 CC 授權提供所有人使用 (在台灣著作權人不得放棄著作權利,所以用創用 CC 授權是折衷的辦法)。

教育部國語推行委員會的網站為例,它說需要申請才可以連結是不應該的,畢竟這是全民委託國語推行委員會架設這個網站,所以教育部的這個網站不但要提供連結,還應將所有資料都以創用 CC 授權,讓全民得以下載使用,不得聲稱國語推行委員會擁有這些資料的著作權。

目前數位典藏與數位學習成果入口網彙整了一些以創用 CC 授權的資料,但是這些資料呈現另一個問題:各個單位自行架設平台上傳資料,但資源並未良好整合,或是格式不通,甚至祇能使用 IE 瀏覽器,民眾使用仍然不方便。

之前台中市教育局請廠商建置平台放置台中市媒體競賽得獎影片,但是該網站的影片格式較特別,需安裝特殊解碼器才可觀看,偏偏該解碼器與大家常用的 K-Lite code 又相衝突,因此使用上極端不便。

所以公部門釋出資源時,我不建議由各單位自行架設平台,除了架設不易、維護困難,資料的格式也太紛亂而不易使用。

書籍資料委請 Google 掃瞄上網

國圖擁有許多書籍資源,如果能促成國家圖書館與 Google 合作,將發行超過 50 年,已經沒有智慧財產權問題的書籍全部掃瞄上網,這就可以彌補中文資源不足的缺撼。

從兩年前開始,Google 就積極的與美國的大學合作,將各大學中的藏書掃瞄上網,並將這些書籍提供所有人使用。

雖然多數人可以獲得的書籍資源變多了,但 Google 的這個舉動卻引起法國的不安。法國方面的想法是,一旦 Google 將英文資料大量上網,相對的就稀釋了法文資料在網路上的比例,各國網民上網查資料時看到的多數資料是以英文呈現的,這對法國文化的推行將是一大挑戰。

為了平衡英、法文資料在網路上的比例,法國也與 Google 簽署協議,由 Google 幫助法國進行資料數位化。

英文書籍上網後,使得英文這個強勢文化更加強盛、其他語文受擠壓而衰退的問題當然不是祇有法國會面臨,網路上中文資料的不足也會使華文文化更加衰退,所以我們應該學習法國,積極與 Google 達成協議,委託他們代為掃瞄書籍上網。

為什麼選擇 Google?不由國圖自己掃瞄?那不是圖利特定廠商嗎?

目前 Google 還是搜尋界的龍頭老大,祇要進了 Google 的資料庫中,資料可以非常容易的檢索。

比方說我想要查詢《教育:必要的乌托邦》這本書中有『教育』這兩個字的頁面,我祇要該書頁面中輸入『教育』二字進行檢索,Google 就幫我把所有資料都找出來

由國圖自己掃瞄費事又無法達到這樣的效果,辛苦了老半天,沒有人能找到資料,所以還是請 Google 幫忙掃瞄比較省事。之後資料的維護、資料搜尋技術亦由 Google 進行,國圖員工不會增加工作量。

影片檔案置於 Youtube

隨著影音視訊設備的普及,影片檔案在這幾年數量也越來越多,例如數位典藏與數位學習成果入口網中就收集有不少影片,但是這些影片的尺寸較小,使用不易,而且這些影片存放的伺服器需要專人維護,網路線路頻寬需要另外租用,維護費不少。

如果公部門的這些影片都上傳至最大的影片網站 Youtube,就不需要編列龐大的維護費,而且 Youtube 的影片祇要有瀏覽器都可觀看,不需安裝特殊解碼器;要上傳高品質的影片也非常方便。

利用 Youtube 的好處是:它的觀賞群眾多,可以有效傳遞資訊;它也提供了一些工具,可以加字幕、甚或是做成互動式影片。比方說香港觀光局做的介紹影片,就是一個互動式影片。

如果我們數位典藏資料放在 Youtube,那麼眾多的網友有許多素材可以運用,也許就會有人做出互動式的遊戲幫忙宣傳。例如利用文化收藏相關影片設計一個大地尋寶遊戲,甚至做成一個像卡門‧聖地牙哥這樣的解謎遊戲,那對於資源的使用、台灣的整體形象都會有加分的作用。由各個單位自行開發平台放置影片就少了這樣的運用方式,觀賞者也相對少了許多。

由於 Youtube 的觀賞者眾多,美國白宮在 Youtube 上就開設一個頻道,將白宮內演講、各類事務影片都放到 Youtube 供全民觀賞、再運用,美國政府的作法值得我們學習。

如果一定要自己架設平台,那麼建議使用 osTube,對於 osTube 研發、修改的成果還可以迴饋給研發團隊。

目前有許多學校利用 osTube 架設校內影音平台,學校使用 osTube 的優點是影片長度不限,放在 Youtube 上最多祇能 10 分鐘,而 osTube 影片沒有長度限制。

雖然 osTube 有這樣的優勢,但我還是建議使用 Youtube,因為它的閱聽人最多,可以最有效的傳播。另外,Youtube 上點閱率最高的影片通常不足 3 分鐘,太長的影片閱聽人沒有耐心觀賞。所以 10 分鐘的長度足夠了。如果真的超過 10 分鐘,就將影片切成幾個部份上傳,再以播放清單串接起來即可

(2012.12.07 補 ps: 現在 Youtube 不限上傳的時間了,所以自己建 osTube 祇有『在校內傳輸速度快』的優點了。)

提供全民資源,並向世界發聲

目前台灣上網的資源少,且分散在各個單位自建的平台中。因為資源太分散,多數民眾不知道有資源存在,不知道要引用、連結,進一步造成搜尋引擎給予這些平台較低的評比,搜尋時被排在比較後面的頁面,資源難有被看見的機會。

如果公部門善用 Google 已經建立起來的資源,將書籍、影片放到 Google 的系統中,搜尋時容易被看見,資源的利用率大幅提昇。

除了便利全民使用之外,這也是一個向世界發聲的方法。祇要將上傳至 Youtube 的影片都附上英文字幕,就給了全世界認識我們的一個新管道,一舉數得!希望公部門能參考,往這個方向開始努力啊!

附註:

  1. 前幾天寫了『拾荒老人與比爾蓋茲』這篇文章後,整個農曆過年期間都覺得很丟臉 (我寫那什麼文章啊?),一直想將文章重新寫過。
     
    我平常跟實習老師說:『不要擔心麻煩我,請多來找練習試教。我要在短短的 15 分鐘內發現你的問題,再提出有用的建議、甚至是將你的教學流程整個重新安排,這對我是一個很好的訓練,我很享受這個過程,一點都不會麻煩到我。』
     
    『你教那什麼爛書,學生聽得懂才有鬼,啪(丟筆)』,要這樣的批評誰都會做,但是要提出有用的建議就難多了。
     
    『我想,如果把你的 XX 部份提到前面來講,先講 XX,再來講述 YY,這樣的教學內容會比較符合邏輯,學生比較容易理解。』這是我聽試教後給實習老師的常見建議,一方面希望讓實習教師在試教後能有些收獲藉以精進教學,一方面也是訓練自己給建議的能力。
     
    把『給建議、不批評』這項自我要求拿來檢核『拾荒老人與比爾蓋茲』那篇文章就真的丟臉死了,一點積極的建議也沒有,世間除了多了一篇碎碎唸的廢文之外,一點幫助也沒有,所以,我又重寫了一次。
     
  2. 網友 sponge 關於創用 CC 的討論討論二
     
  3. 如何讓電子書內容可以大量誕生?

Technorati :