使用開源工具即時上手資料科學

2016/09/29 ~ 2021/12/31
3小時/5週 (已經開始)

摘要

資料科學家工作臺(Data Scientist Workbench,簡稱為DSWB)是一個IBM推出的免費平臺,把資料科學家所需要的最有名的免費開源(open source)工具都聚集在雲端,讓我們能夠省去安裝個別軟體的步驟,直接在平臺上進行資料彙整、以視覺化方式呈現、探索、分析、建模、甚至建構應用程式(app)。在這門課程中,我們將會學習如何利用資料科學家工作臺做以下的事情:

  • 用My Data 管理資料

  • 用OpenRefine準備資料

  • 運用工具對資料進行分析,例如:

    • 使用Jupyter Notebooks 以互動的方式對資料進行分析

    • 使用Zeppelin Notebooks 以互動的方式對資料進行分析

    • 在RStudio IDE 的環境中撰寫與執行R語言的程式

    • 在Seahorse中創建或是上傳工作流

課程目標

本課程適合所有有興趣使用資料科學的開源工具的學習者,使學員能學習使用IBM提供給資料科學家的免費工作台---Data Scientist Workbench (DSWB),以能夠快速進入資料科學的世界。

授課教師

IBM Cognitive Class

課程進度表

第1週:Data Science Workbench 介紹

第2週:Jupyter Notebooks 介紹

第3週:Zeppelin Notebooks 介紹

第4週:RStudio IDE 介紹

第5週:Seahorse 介紹

第6週:Final Exam 期末考

課程內容

Module 1: Data Science Workbench介紹

Video 1 – 甚麼是資料科學家工作臺? (3:45)      

Video 2 – DSWB 功能介紹(4:45)

Video 3 – 建立一個DSWB 的帳號 (1:10)            

Video 4 – 使用My Data 來管理資料(3:20)    

Video 5 – 使用OpenRefine 來準備資料 (2:00)        

Module 2: Jupyter Notebooks 介紹    

Video 1 – 甚麼是Jupyter Notebooks?  (2:20)         

Video 2 – 開始使用Jupyter  (4:30)       

Video 3 – 在Jupyter中的資料與Notebooks   (3:07)       

Video 4 – 分享你的Jupyter Notebooks 與 data  (2:35)      

Video 5 –在Jupyter Notebooks中的 Apache Spark   (2:00)        

Module 3: Zeppelin Notebooks 介紹       

Video 1 – 甚麼是Zeppelin Notebooks?  (2:30)       

Video 2 – 在Zeppelin 上使用Scala (3:00)        

Video 3 – 開始使用Zeppelin (5:35)      

Video 4 – 管理你在 Zeppelin 中的解譯器(3:00)

Video 5 – 在Zeppelin Notebooks中的Apache Spark   (3:00)    

Module 4: RStudio IDE  介紹    

Video 1 – 甚麼是RStudio IDE? (1:45)       

Video 2 – 在RStudio IDE中上傳檔案、安裝套件與資源庫  (3:10)

Video 3 – 開始使用RStudio IDE (4:08)       

Video 4 – RStudio 的Environment 與 History (3:00)

Video 5 – 在RStudio IDE 中使用Apache Spark (3:30)           

Module 5: Seahorse  介紹

Video 1 – 甚麼是Seahorse? (2:10)

Video 2 – 概觀Seahorse的特性(1:30)

Video 3 – 在DSWB中使用Seahorse (1:45)

Video 4 – 在DSWB中建立與上傳Seahorse Workflows (4:40)

Video 5 – 在DSWB中輸出與複製Seahorse Examples (4:00)

課程總結 (3:50)

評分標準

  • 平時測驗50%
  • 期末測驗50%

通過標準


課程及格標準:60分滿分:100分

先修科目或先備能力

本課程無須背景知識,適合所有對資料科學有興趣的學習者修習

建議參考書目

‘Getting Started with Data Science’ Publisher: IBM Press; 1 edition (Dec 13 2015) Print. Author: Murtaza Haider 

常見問答集

【線上修課證明當您修習完成IBM Cognitive Class系列課程後,您可以透過填寫google表單或者email向ewant申請修課通過證明,方法請見註1​。

【BDU 徽章】學員通過某些課程(課程資訊中會載明)或通過一個微學程後,可另外獲得由 Cognitive Class 在皮爾森系統 Acclaim Pearson VUE 建置核發的徽章。(註2)

註1: 至google表單(https://goo.gl/forms/cSVSpN0NmgkivmWt1)填寫您在ewant上的帳號作業成績截圖,若為海外人士,可寄信至yen.nctu@g2.nctu.edu.tw申請,將於每周四18:00統一發出修課通過證明。

註2: 當您取得課程通過證明之後,ewant平台固定於每周四 18:00 將取得證明的學員帳號及信箱傳遞給 Cognitive Class 進行徽章申請,徽章將透過 CC 與 Pearson VUE Acclaim 合作的認證系統,統一核發至您的註冊信箱。

其它

  • 課程皆為自學課程,每個單元皆附有線上作業。

  • 每年的一月及七月,還會有此微學程的全國實體認證考試(認證身份後的考試,須另外報名繳費),通過實體考試後,即可取得由IBM 認可的微學程通過證書。