使用開源工具即時上手資料科學

2016/09/29 ~ 2021/12/31
3小時/5週 (已經開始)

摘要

資料科學家工作臺(Data Scientist Workbench,簡稱為DSWB)是一個IBM推出的免費平臺,把資料科學家所需要的最有名的免費開源(open source)工具都聚集在雲端,讓我們能夠省去安裝個別軟體的步驟,直接在平臺上進行資料彙整、以視覺化方式呈現、探索、分析、建模、甚至建構應用程式(app)。在這門課程中,我們將會學習如何利用資料科學家工作臺做以下的事情:

  • 用My Data 管理資料

  • 用OpenRefine準備資料

  • 運用工具對資料進行分析,例如:

    • 使用Jupyter Notebooks 以互動的方式對資料進行分析

    • 使用Zeppelin Notebooks 以互動的方式對資料進行分析

    • 在RStudio IDE 的環境中撰寫與執行R語言的程式

    • 在Seahorse中創建或是上傳工作流

課程目標

本課程適合所有有興趣使用資料科學的開源工具的學習者,使學員能學習使用IBM提供給資料科學家的免費工作台---Data Scientist Workbench (DSWB),以能夠快速進入資料科學的世界。

授課教師

IBM Big data university

課程進度表

第1週:Data Science Workbench 介紹

第2週:Jupyter Notebooks 介紹

第3週:Zeppelin Notebooks 介紹

第4週:RStudio IDE 介紹

第5週:Seahorse 介紹

第6週:Final Exam 期末考

課程內容

Module 1: Data Science Workbench介紹

Video 1 – 甚麼是資料科學家工作臺? (3:45)      

Video 2 – DSWB 功能介紹(4:45)

Video 3 – 建立一個DSWB 的帳號 (1:10)            

Video 4 – 使用My Data 來管理資料(3:20)    

Video 5 – 使用OpenRefine 來準備資料 (2:00)        

Module 2: Jupyter Notebooks 介紹    

Video 1 – 甚麼是Jupyter Notebooks?  (2:20)         

Video 2 – 開始使用Jupyter  (4:30)       

Video 3 – 在Jupyter中的資料與Notebooks   (3:07)       

Video 4 – 分享你的Jupyter Notebooks 與 data  (2:35)      

Video 5 –在Jupyter Notebooks中的 Apache Spark   (2:00)        

Module 3: Zeppelin Notebooks 介紹       

Video 1 – 甚麼是Zeppelin Notebooks?  (2:30)       

Video 2 – 在Zeppelin 上使用Scala (3:00)        

Video 3 – 開始使用Zeppelin (5:35)      

Video 4 – 管理你在 Zeppelin 中的解譯器(3:00)

Video 5 – 在Zeppelin Notebooks中的Apache Spark   (3:00)    

Module 4: RStudio IDE  介紹    

Video 1 – 甚麼是RStudio IDE? (1:45)       

Video 2 – 在RStudio IDE中上傳檔案、安裝套件與資源庫  (3:10)

Video 3 – 開始使用RStudio IDE (4:08)       

Video 4 – RStudio 的Environment 與 History (3:00)

Video 5 – 在RStudio IDE 中使用Apache Spark (3:30)           

Module 5: Seahorse  介紹

Video 1 – 甚麼是Seahorse? (2:10)

Video 2 – 概觀Seahorse的特性(1:30)

Video 3 – 在DSWB中使用Seahorse (1:45)

Video 4 – 在DSWB中建立與上傳Seahorse Workflows (4:40)

Video 5 – 在DSWB中輸出與複製Seahorse Examples (4:00)

課程總結 (3:50)

評分標準

日後說明

通過標準


課程及格標準:60分滿分:100分

先修科目或先備能力

本課程無須背景知識,適合所有對資料科學有興趣的學習者修習

建議參考書目

‘Getting Started with Data Science’ Publisher: IBM Press; 1 edition (Dec 13 2015) Print. Author: Murtaza Haider 

常見問答集

【線上修課證明當您修習完成IBM Big Data University 系列課程後,您可以透過 email 方式向 ewant 申請修課通過證明,方法請見註1​。

【BDU 徽章】學員通過某些課程(課程資訊中會載明)或通過一個微學程後,可另外獲得由 Big Data University 在皮爾森系統 Acclaim Pearson VUE 建置核發的徽章。(註2)

註1: 將您在 ewant 上的帳號及作業成績截圖發給李小姐,信箱 yen.nctu@g2.nctu.edu.tw,預計每周四下班前統一發出證書。

註2: 申請徽章的方式: 當您取得課程通過證明之後,ewant 平台固定於每周四 17:00 將取得證明的學員帳號及信箱傳遞給 Big Data University 進行徽章申請,徽章將透過 BDU 與 Pearson VUE Acclaim 合作的認證系統統一核發至您的註冊信箱。

其它

  • 課程皆為自學課程,每個單元皆附有線上作業。
  • 接下來還會規劃此微學程的全國實體認證考試(認證身份後的考試, 須另外報名繳費),通過實體考試後,即可取得由IBM 認可的微學程通過證書。