資料科學 ───Data Science
海量資料 (Big data) 是由 IBM 在 2010 年觀察到並提出的概念名詞,其特色是 : 龐大、即時性及多樣性。由於目前資訊技術發達 3C產品普及,資訊很容易被轉換為數位資料而被儲存下來。這些資料包括文字、影像及聲音等,再加上網路發達,資料傳輸容易,在電腦上就可立即搜尋及使用這些資料,因而產生海量資料這種現象。在這些龐大複雜資料下,常有特定模式隱藏於其中運作。處裡海量資料之目的及方法,就是找出這些隱藏模式並加以運用,這方法即為資料科學 (data science)。 舉個例子 ~ 在 2009 年 Nature 期刊上發表一篇預測 influenza 流行的研究著作。值得注意的是,作者並非生物學家,而是一位 Google 工程師。他利用 Google 搜尋引擎中每週 influenza-like illness 相關字數目頻率變化與 influenza 疫情流行做統計,發現兩者間有高度相關 (r=0.85)。利用這模式就可成功預測 influenza 之流行,這是一個生物醫學海量資料分析的例子。 Example