進擊!Big Data分析實務(2018春季班)
Teacher: 王貞淑
公務人員MOOC     

2018/03/12 ~ 2018/05/06
8 Hour/8 Week (Course is Time End)

Summary

大數據資料時代來臨,如何從巨量雜訊中,掌握隱藏於其中的重要訊息,並將其應用於生活環境中,是值得深入探究的議題。
本課程「進擊!Big Data分析實務(2018春季班)」承襲前一課程「進擊!Big Data分析實務」之精神與迴響,再次開設本門課程,同樣以深入淺出的方式及多元的實際演練,搭配資料分析軟體的輔助,促使學習者能輕鬆地在龐大的資料情況下,也能瞭解基本觀念及方法,並運用於各種領域或工作場所等。
Keyword:大數據分析、資料處理、資料分析軟體應用。

Course Object

本課程主要學習目標是期許學習者除了能掌握Big Data的基礎概念外,完成此課程後,更能認識並熟悉「資料處理」、「資料分析軟體應用」及「解讀分析結果」等能力。

Course Teacher Intro

download.php?id=247&area=teacherfiles

王貞淑老師

目前任職:國立臺北科技大學資訊與財金管理系副教授。

學  歷:國立政治大學資訊管理博士。

研究領域:人工智慧與資訊科技應用研究、巨量資料分析與平行運算、知識管理與策略發展、網路管理、創新與創業。

Course Schedule

第1週:Big Data告訴你特色與數據分析工具

第2週:集群模式分析

第3週:分類模式分析

第4週:關聯模式分析

第5週:進階集群模式分析

第6週:進階分類模式分析

第7週:進階關聯模式分析

第8週:反思Big Data

Course Content

本門課程帶領學習者認識Big Data之基本意涵與特色,主要介紹三種不同的模式分析方法,包括集群 (Cluster)、分類 (Classification) 與關聯(Association)等,並特別地將其再區分為「入門初階」與「專業進階」兩種學習程度區別,皆含分析模式與演算法操作練習,學習者可以視自己的學習需求,選擇並安排適合自己修習進度的課程單元。

此外,更講述兩種不同的分析工具 (R、Weka)於實例。最後,進行大數據的偏誤反思,了解巨量資料不是萬靈丹,仍然會有一些上限與挑戰。

Course Mode

本課程分為八個主要單元,每個單元將由數個小單元所組成。

而每個小單元將提供一段2~13分鐘的視頻教學影片。

配合每週課程內容提供隨堂測驗,以幫助學習者快速確認是否瞭解上課內容,另安排週作業、隨堂測驗、週次議題討論與期末專案等用以考核學習成果,考核標準請參見「評分標準說明」。

Course Grade

本課程評分標準著重於資料分析實際操作練習,是以課堂作業、單元測驗、討論區之議題討論與期末小專案實作成績為計算依據,總成績共 100 分,各評分項目配分方式符合課程需求及公平性。

  • 週作業 42% (前七週次作業)

評分階段主要依各週次難易程度進行1至2個實際操作型作業,可區分為兩部分。

(1) 第1至4週:作業以「基礎」相關模式演算分析實作題型為主。

(2) 第5至7週:作業以「進階」相關模式演算分析實作題型為主。

  • 隨堂測驗 10% (各課程單元小測驗)

針對回答的正確性進行評分。每單元進行相關測驗複習。

  • 議題討論 15% (每一週次討論議題)

評分方向以:提問(分享)合理性及建設性、回應內容正確性等,由教師及助教針對學習者分享資料或提出問題的合理性及建設性、議題回應的正確性及積極性進行評分。

  • 期末測驗 33% (第八週期末小專案)

請完成一資料分析小專案,邁向資料分析科學家之路吧!

→ 自由選定一資料集(課程使用除外)、任一模式演算方法進行資料分析。

→ 上傳內容可包含文字檔描述 (選定資料集原因、欲分析之目標等)、資料集、模型架構、使用模式方法、結果解讀等,但不拘限。

Grade Required


Course grade pass:60Grade Memo:max grade 100 point

Course Ability

具備基本資料處理之相關知識即可。

Course Suggest

本課程提供上課講義,不需額外購買教科書。學習者仍可參考坊間書局或以下推薦之資料分析相關書籍,以獲得更豐富及更深入的學習內容。

l   Nate Silver,蘇子堯/譯(2013),「精準預測:如何從巨量雜訊中,看出重要的訊息?」,三采。

l   Mark Buchanan,葉偉文/譯(2007),「隱藏的邏輯:掌握群眾行為的不敗公式」,天下文化。

l   Ian Ayres, 張美惠/譯 (2008), 「什麼都能算,什麼都不奇怪」,時報出版

l   John E. Kelly III, Steve Hamm, (2014) 陳以禮/譯, 「智科科技」,天下文化。

l   Thomas H. Davenport (2014), 江裕真/譯,「大數據@工作力」,天下文化。

l   Christian Rudder, 林俊宏/譯 (2016),「我們是誰?大數據下的行為觀察」,馬可孛羅。

l   David Weinberger, 王年愷/譯 (2012), 「Too Big To Know」,貓頭鷹。

l   Victor Mayer-Schonberger, Kenneth Cukier (2013), 林俊宏/譯,「大數據」,天下文化。

l   Paul Teetor, 張夏真/譯 (2014), 「R錦囊妙計」,O’REILLY。

l   袁梅宇 (2015), 「王者歸來:WEKA機器學習與大數據聖經」,佳魁。

l   李仁鐘 (2015), 「應用R語言於資料分析:從機器學習、資料探勘到巨量資料」,松崗。

l   Jiawei Han, Micheline Kamber, Jian Pei, 郝沛毅, 李御璽, 黃嘉彥/編譯 (2014), 「資料探勘」,高立圖書/ Elsevier Taiwan LLC。

Thomas Gilovich, 林力敏/譯 (2015), 「康乃爾最經典的思考邏輯課」,先覺。

Course Q&A

  1. 問:此課程完成後是否提供相關證書?
    答:是。總成績超過 (含) 60分者,可獲得「修課通過證明」。

  2. 問:此課程是否會提供上課投影片?
    答:是。本課程相關投影片與教材皆可於下載專區獲得學習。

  3. 問:此課程是否有特定的應用領域?
    答:否。本課程所教授之內容為基礎資料分析之概念與應用,課程中以不同的模式分析方法,包括集群、分類、關聯等,透過Weka、R、Mahout 等資料分析軟體與框架進行實務演練,以作為範例來說明如何應用,使學習者能將其模式廣泛地應用於各領域中。