進擊!Big Data分析實務
教師: 王貞淑

2016/10/10 ~ 2016/12/04
8小時/8週 (報名結束)

摘要

大數據資料時代來臨,如何從巨量雜訊中,掌握隱藏於其中的重要訊息,並將其應用於生活環境中,是值得深入探究的議題。本課程「進擊!Big Data分析實務」以深入淺出的方式及多元的實際演練,搭配資料分析軟體的輔助,促使學習者能輕鬆地在龐大的資料情況下,也能瞭解基本觀念及方法,並運用於各種領域或工作場所等。
Keyword:大數據分析、資料處理、資料分析軟體應用。

課程目標

本課程主要學習目標是期許學習者除了能掌握Big Data的基礎概念外,完成此課程後,更能認識並熟悉「資料處理」、「資料分析軟體應用」及「解讀分析結果」等能力。

授課教師

%E6%95%99%E5%B8%AB%E5%9C%96%E7%89%87.jpg

目前任職:國立臺北科技大學資訊與財金管理系副教授。

學  歷:國立政治大學資訊管理博士。

研究領域:人工智慧與資訊科技應用研究、巨量資料分析與平行運算、知識管理與策略發展、網路管理、創新與創業。

課程進度表

第1週:Big Data告訴你特色與數據分析工具

第2週:集群模式分析

第3週:分類模式分析

第4週:關聯模式分析

第5週:進階集群模式分析

第6週:進階分類模式分析

第7週:進階關聯模式分析

第8週:數據分析工具Mahout與反思Big Data

課程內容

本門課程帶領學習者認識Big Data之基本意涵與特色,主要介紹三種不同的模式分析方法,包括集群 (Cluster)、分類 (Classification) 與關聯(Association)等,並特別地將其再區分為「入門初階」與「專業進階」兩種學習程度區別,皆含分析模式與演算法操作練習,學習者可以視自己的學習需求,選擇並安排適合自己修習進度的課程單元。此外,更講述三種不同的分析工具 (R、Weka、Mahout) 於實例。最後,進行大數據的偏誤反思,瞭解巨量資料不是萬靈丹,仍然會有一些上限與挑戰。

上課形式

本課程分為八個主要單元,每個單元將由數個小單元所組成。

而每個小單元將提供一段 5~10 分鐘的視頻教學影片供學習者學習。

評量方式將配合每週課程內容提供單元隨堂測驗,以幫助學習者快速確認是否瞭解上課內容,另安排作業、測驗與議題討論用以考核學習成果,考核標準請參見「評分標準說明」。

評分標準

本課程評分標準著重於資料分析實際操作練習,是以課堂作業、單元測驗與討論區之議題討論成績為計算依據,總成績共 100 分,各評分項目配分方式為了符合課程需求及公平性,相關修正將再行公告。

  • 議題討論30%

評分方向以:提問(分享)合理性及建設性、回應內容正確性、獲得推薦數及回應數。評比項目以兩部分為主。

1.「獲得推薦數及回應數」:

係應用「同儕互評」機制而來,學習者可直接使用平台的「推薦」功能,直接對認同的內容進行正向評比,同時可使用「回覆」功能,表達個人評論、心得或分享資訊 。

2.學習者個人發佈相關議題:

由教師及助教針對學習者分享資料或提出問題的合理性及建設性、議題回應的正確性及積極性進行評分。

  • 週作業55%

評分階段主要依各週次難易程度進行1至2個實際操作型作業,可區分為兩部分。

(1) 第1至4週:作業以「基礎」相關模式演算分析實作題型為主。

(2) 第5至7週:作業以「進階」相關模式演算分析實作題型為主。

  • 隨堂測驗15%:針對回答的正確性進行評分。每單元進行相關測驗複習。

通過標準


課程及格標準:60分滿分:100分

先修科目或先備能力

具基本計算機概論與資料庫之相關知識。(例如:知悉將資料透過 Microsoft Excel 等資料統計試算表軟體進行新增、修改、查詢、刪除等匯整排序處理,以掌握資料內容點燃巨量資料價值的關鍵。)

學習對象:

1. 修習數位邏輯、邏輯設計等基礎課程者。

2. 就讀或從事財務金融、資訊工程、系統分析、工業工程管理產業者。

3. 參加國家考試、入學考試等

建議參考書目

本課程提供上課講義,不需額外購買教科書。學習者仍可參考坊間書局或以下推薦之資料分析相關書籍,以獲得更豐富及更深入的學習內容。

  • Nate Silver,蘇子堯/譯(2013),「精準預測:如何從巨量雜訊中,看出重要的訊息?」,三采。
  • Mark Buchanan,葉偉文/譯(2007),「隱藏的邏輯:掌握群眾行為的不敗公式」,天下文化。
  • Ian Ayres, 張美惠/譯 (2008), 「什麼都能算,什麼都不奇怪」,時報出版
  • John E. Kelly III, Steve Hamm, (2014) 陳以禮/譯, 「智科科技」,天下文化。
  • Thomas H. Davenport (2014), 江裕真/譯,「大數據@工作力」,天下文化。
  • Christian Rudder, 林俊宏/譯 (2016),「我們是誰?大數據下的行為觀察」,馬可孛羅。
  • David Weinberger, 王年愷/譯 (2012), 「Too Big To Know」,貓頭鷹。
  • Victor Mayer-Schonberger, Kenneth Cukier (2013), 林俊宏/譯,「大數據」,天下文化。
  • Paul Teetor, 張夏真/譯 (2014), 「R錦囊妙計」,O’REILLY。
  • 袁梅宇 (2015), 「王者歸來:WEKA機器學習與大數據聖經」,佳魁。
  • 李仁鐘 (2015), 「應用R語言於資料分析:從機器學習、資料探勘到巨量資料」,松崗。
  • Jiawei Han, Micheline Kamber, Jian Pei, 郝沛毅, 李御璽, 黃嘉彥/編譯 (2014), 「資料探勘」,高立圖書/ Elsevier Taiwan LLC。
  • Thomas Gilovich, 林力敏/譯 (2015), 「康乃爾最經典的思考邏輯課」,先覺。

常見問答集

  1. 問:此課程完成後是否提供相關證書?
    答:是。總成績超過 (含) 60分者,可獲得「修課通過證明」。

  2. 問:此課程是否會提供上課投影片?
    答:是。本課程相關投影片與教材皆可於下載專區獲得學習。

  3. 問:此課程是否有特定的應用領域?
    答:否。本課程所教授之內容為基礎資料分析之概念與應用,課程中以不同的模式分析方法,包括集群、分類、關聯等,透過Weka、R、Mahout 等資料分析軟體與框架進行實務演練,以作為範例來說明如何應用,使學習者能將其模式廣泛地應用於各領域中。