2011年8月7日 星期日

台灣關鍵事實 Q&A:(5)關鍵事實的「關鍵」

就統計資料的 visualization 而言,Hans Rosling 如果不是最出色的,至少應該是最有名的。而他之所以出色,一部份原因是他願意花時間去構想活潑、有趣的呈現方式,另一個同樣重要的原因是:他有人口統計的專業背景,知道如何呈現統計資料的「意義(significance)」。

其實,我在訓練博、碩士生的過程中,最後一道程序就是「data presentation」。一個好的研究成果,如何只用有限的頁數和圖表去呈現一至兩年研究工作的結論?一本理工 學院的碩士論文通常可以有40~60頁,20~40張圖;但一篇學術期刊論文通常只能有20頁(A4,double space),2~4張圖。要把20~40張圖的資訊壓縮在2~4張圖裡,關鍵於「去蕪存菁」:選擇最佳的變數(X-axis variable, Y-axis variable and the size of circles),來突顯出所有數據整合起來最關鍵的意義。

譬如,在 Wealth & Health of Nations( income vs life expectancy) 這一張圖裡,核心意義是:「收入的改善會延長壽命」。

妳需要先有這想法,才會去設計出這兩個軸。但是,如果只有這兩個軸而忽略不同年份的數據有不同意義,妳可能會把所有年份資料重疊地畫在一張圖上而看不出前述關係,也可能任選數年的資料重疊地畫在一張圖上而看不出前述關係。但是 Hans Rosling 把時間軸給設計成動態軸,所以你可以在動態展示的過程中發現有兩個關鍵年份:
(1)1900年以前,大部分國家是所得增加而壽命沒有增加(35歲以下);
(2)1900開始到1950之間,所有國家在所得達到4000美元時壽命開始直線上升;
(3)1950以後,不管所得多少,全世界的壽命都在上升。
這三個時段各有不同的全球社會機制,譬如第三個階段低度開發國家的壽命延長可能來自於富國的救援以及全球醫藥、教育與科技的擴散。

 很多時候意義的呈現關鍵在於變數的選擇。在「Stop call them "developing countries"」這一張圖裡,關鍵在於橫軸變數與縱軸變數的選擇。他們都有人口統計的意義藏在背後。

回到台灣,來看看中科三期的意義。如果單純把中科三期跟被徵收農地的農戶一起放到新聞鏡頭上(一種 visulization),妳馬上會聯想:「國家 vs 個人」、「工業發展 vs 零星農地」並得出結論:「公益 vs 私利」。這樣反中科就變成無理性。

但是,如果把相關資訊全部彙整在一起,圖像(意義)就會被徹底轉變(顛覆):
 (1)把中科三、四期的產業內容挖出來(可以的話含廠商),(2)蒐集中部閒置的工業區土地,分析中科三、四期跟這些土地具有替代性,會擠壓這些工業區的利用率,以及周邊社區發展機會,因此要求首先利用這些閒置工業區(3)分析中科真正的經濟價值,我預期主要的是降低廠商營運成本,但卻增加國家開發成本,與舊工業區爭發展,壓迫舊工業區的發展。預期結論:國家總體工業發展略有成長,但抵不上國家的投資成本,因而是犧牲納稅人的錢,舊工業區的發展,以及農業與農田,目的只在降低少數廠商的成本,增加他們的短期利潤。

藉此把反中科的訴求從「環保」、「農業」擴大到「壓迫舊工業區的成長」、「國家重複投資」、「亂用納稅人的前」、「為少數財團的利益犧牲多數人的福祉」。
 
當資訊被匯聚後,我們會發現反中科不再是「零星小農反對國家發展(與讀者的利益)」,而是國家的不當政策浪費所有納稅人的錢(與讀者的利益)去圖利少數財團(讀者痛恨的對象)。

「關鍵數據」的關鍵在於:妳如何用有限的字數和圖片,呈現出最關鍵(影響的人最多且幅度最大、最長遠)的意義(significances)。

最重要的不是數字(figures),也不是圖片(figures),而是介於期間彙整資料與呈現資料(設計軸線與變數)的巧思。關鍵在作為寫手的「妳」!