就生產力4.0的概念來說,物聯網(IOT) + 智慧機器人(IR) + 大數據(Big Data) 是智慧工廠的三個重點要素,所以我們將大數據這個議題放在生產力4.0這個主題下來討論。
由於大數據太夯了,許多人患了朱敬一說的「大數據瞎掰症候群」(其舉雪隧塞車之問題分析為例)。台灣有一些人,什麼都不懂卻又不讀書,大搖大擺地講錯話、做錯的判斷, 甚至推動錯的政策。
定義大數據:
- 大數據是由巨型的資料集合 (dataset) 所組成,其大小由兆元組 (TB) 到十兆億不等 (PB)。
- 大數據是大量、高速、及 / 或多變的資訊資產,它需要新型的處理方式去促成更強的決策能力、洞察力與最佳化處理。
- 大數據有其三種性質,稱為 3V,分別為資料量 (Volume),資料產生速度 (Velocity),以及資料多變性 (Variety)。更精確來說,大數據是無法在一定時間內由人工收集,管理,整合與判讀的巨型資料,而在這總量資料下分別比對各總小型資料組合以期在其中獲得資訊,辨認趨勢進而預測。
台灣的老闆、高階主管們,你公司的數據一天的 3V 有多少?殺雞真該用牛刀?不論要不要使用牛刀,真正有多少台灣人了解刀工?也就是基本的機器學習與數據探勘技術?我們都知道 BigData 很重要,政府該做的是動手改革高教體系培養資料科學家。