大資料分析苦手不用怕，資料科學愛好者年會帶你Hadoop做中學

新聞

從8月20日開始，在中央研究院展開為期4天的2015年資料科學愛好者年會，相較2014年第一屆活動，今年不只多了2天，而且增加了更多做中學的工作坊，第一天打頭陣的工作坊，分別是Hadoop/Spark快速體驗營、R語言資料分析上手課程以及地圖資料視覺化課程。

其中Hadoop/Spark快速體驗營，是要參與者做中學，直接在現場實作，學習利用Hadoop分析資料。現為東森信息科技大數據顧問的趙國仁表示，之所以有這個工作坊，緣起於他去中國參加了BDTC（Big Data Technology Conference），看到中國在大資料技術的發展已有一定的成熟度。應用的範疇不再僅是軟體面，還整合了硬體以及系統面，學界以及業界在人才與研究成果有良好的接軌。他說，中國最近在開源社群也有很積極的進展，甚至提交的大資料Kylin提案也被Apache基金會接受，成為正式專案，而這也是臺灣沒有的紀錄。

有鑑於此，趙國仁想透過舉辦工作坊的形式，從最基本大資料教育做起，傳遞相關的技術知識。他說，這個工作坊籌備超過3個月。在之前還先舉辦了幹部營事先訓練了多位助教。

中華郵政專員許勝淵說，要處理大資料的問題，最困難的階段就是入門，因為有太多相關的工具需要了解。像是這次有用到Hadoop、Hive、Hue、Impala等都是企業要做大資料分析時，可能會使用到的工具，不過要搞懂這些Hadoop Family之間的關係以及各自的功能就要花一番心力。

Hadoop相關工具非常多，中華郵政專員許勝淵說，要運用Hadoop來處理大資料，最困難的是入門，因為得花不少時間才能了解這些工具間的關係和各自功能。

這次工作坊教學結束後有一個小測驗，要參加者分組實作一天所學，分析MovieLens的電影資料集，算出每個職業最愛的電影前5名，結束後發結業證書。而學員主要實機練習的工具，是用微軟Azure的Hortonworks與AWS EC2的Hadoop。Hadoop/Spark快速體驗營的參加者，除了工程師外，還有許多非技術人參與，因此講師也仔細講解，從開啟虛擬機器匯入資料到分析，每個指令ㄧ步一步說明和練習。

大資料分析苦手不用怕，資料科學愛好者年會帶你Hadoop做中學

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本