FM-使用开源工具即时上手数据科学
2016/09/29 ~ 2023/12/31
3时数/5周次 (已经开始)

概要

随到随学!Let's have fun with this MOOC: FM-使用开源工具即时上手数据科学!

(本课程影音、讲义随时开放,课程中无授课教师与助教参与,也不开放测验、讨论区、与证书等功能。)

数据科学家工作台(Data Scientist Workbench,简称为DSWB)是一个IBM推出的免费平台,把数据科学家所需要的最有名的免费开源(open source)工具都聚集在云端,让我们能够省去安装个别软件的步骤,直接在平台上进行数据汇整、以可视化方式呈现、探索、分析、建模、甚至建构应用程序(app)。在这门课程中,我们将会学习如何利用数据科学家工作台做以下的事情:

  • 用My Data 管理数据

  • 用OpenRefine准备数据

  • 运用工具对数据进行分析,例如:

    • 使用Jupyter Notebooks 以交互的方式对数据进行分析

    • 使用Zeppelin Notebooks 以交互的方式对数据进行分析

    • 在RStudio IDE 的环境中撰写与运行R语言的程序

    • 在Seahorse中创建或是上传工作流

课程目标

本課程適合所有有興趣使用資料科學的開源工具的學習者,使學員能學習使用IBM提供給資料科學家的免費工作台---Data Scientist Workbench (DSWB),以能夠快速進入資料科學的世界。

授课教师

IBM Cognitive Class

课程进度表

1 Section:Data Science Workbench 介绍

2 Section:Jupyter Notebooks 介绍

3 Section:Zeppelin Notebooks 介绍

4 Section:RStudio IDE 介绍

5 Section:Seahorse 介绍

6 Section:Final Exam 期末考

课程内容

Module 1: Data Science Workbench介绍

Video 1 – 甚么是数据科学家工作台? (3:45)      

Video 2 – DSWB 功能介绍(4:45)

Video 3 – 创建一个DSWB 的帐号 (1:10)            

Video 4 – 使用My Data 来管理数据(3:20)    

Video 5 – 使用OpenRefine 来准备数据 (2:00)        

Module 2: Jupyter Notebooks 介绍    

Video 1 – 甚么是Jupyter Notebooks?  (2:20)         

Video 2 – 开始使用Jupyter  (4:30)       

Video 3 – 在Jupyter中的数据与Notebooks   (3:07)       

Video 4 – 分享你的Jupyter Notebooks 与 data  (2:35)      

Video 5 –在Jupyter Notebooks中的 Apache Spark   (2:00)        

Module 3: Zeppelin Notebooks 介绍       

Video 1 – 甚么是Zeppelin Notebooks?  (2:30)       

Video 2 – 在Zeppelin 上使用Scala (3:00)        

Video 3 – 开始使用Zeppelin (5:35)      

Video 4 – 管理你在 Zeppelin 中的解译器(3:00)

Video 5 – 在Zeppelin Notebooks中的Apache Spark   (3:00)    

Module 4: RStudio IDE  介绍    

Video 1 – 甚么是RStudio IDE? (1:45)       

Video 2 – 在RStudio IDE中上传文件、安装套件与资源库  (3:10)

Video 3 – 开始使用RStudio IDE (4:08)       

Video 4 – RStudio 的Environment 与 History (3:00)

Video 5 – 在RStudio IDE 中使用Apache Spark (3:30)           

Module 5: Seahorse  介绍

Video 1 – 甚么是Seahorse? (2:10)

Video 2 – 概观Seahorse的特性(1:30)

Video 3 – 在DSWB中使用Seahorse (1:45)

Video 4 – 在DSWB中创建与上传Seahorse Workflows (4:40)

Video 5 – 在DSWB中输出与复制Seahorse Examples (4:00)

课程总结 (3:50)

评分标准

  • 本課程不開放證書

通过标准


课程及格标准:100分满分:100分

先修科目或先备能力

本課程無須背景知識,適合所有對資料科學有興趣的學習者修習

建议参考书目

‘Getting Started with Data Science’ Publisher: IBM Press; 1 edition (Dec 13 2015) Print. Author: Murtaza Haider 

常见问答集

【線上修課證明IBM 認知學堂現已不授權ewant修課用戶進行證書申請。如欲取得證書,方法請見備註​。

【CC 徽章】IBM 認知學堂現已不授權ewant修課用戶進行徽章申請。若學員希望獲得徽章,建議前往主要官網註冊、修課,即可經由系統自動核發徽章。(備註

備註:認知學堂主要網站(https://cognitiveclass.ai)完成課程後,可取得免費之證書。若通過某些特定課程之後,可額外獲得徽章,徽章將透過 CC 與 Pearson VUE Acclaim 合作的認證系統,即時核發至您的註冊信箱。

其它

  • 課程皆為自學課程,每個單元皆附有線上作業。