进击!Big Data分析实务(2018春季班)
教师: 王貞淑

2018/03/12 ~ 2018/05/06
8小时/8周 (报名结束)

概要

大数据资料时代来临,如何从巨量杂讯中,掌握隐藏于其中的重要讯息,并将其应用于生活环境中,是值得深入探究的议题。
本课程「进击!Big Data分析实务(2018春季班)」承袭前一课程「进击!Big Data分析实务」之精神与回响,再次开设本门课程,同样以深入浅出的方式及多元的实际演练,搭配资料分析软体的辅助,促使学习者能轻松地在庞大的资料情况下,也能了解基本观念及方法,并运用于各种领域或工作场所等。
Keyword:大数据分析、资料处理、资料分析软体应用。

课程目标

本课程主要学习目标是期许学习者除了能掌握Big Data的基础概念外,完成此课程后,更能认识并熟悉「资料处理」、「资料分析软体应用」及「解读分析结果」等能力。

授课教师

download.php?id=247&area=teacherfiles

王贞淑老师

目前任职:国立台北科技大学资讯与财金管理系副教授。

学  历:国立政治大学资讯管理博士。

研究领域:人工智慧与资讯科技应用研究、巨量资料分析与平行运算、知识管理与策略发展、网路管理、创新与创业。

课程进度表

第1周:Big Data告诉你特色与数据分析工具

第2周:集群模式分析

第3周:分类模式分析

第4周:关联模式分析

第5周:进阶集群模式分析

第6周:进阶分类模式分析

第7周:进阶关联模式分析

第8周:反思Big Data

课程内容

本门课程带领学习者认识Big Data之基本意涵与特色,主要介绍三种不同的模式分析方法,包括集群 (Cluster)、分类 (Classification) 与关联(Association)等,并特别地将其再区分为「入门初阶」与「专业进阶」两种学习程度区别,皆含分析模式与演算法操作练习,学习者可以视自己的学习需求,选择并安排适合自己修习进度的课程单元。

此外,更讲述两种不同的分析工具 (R、Weka)于实例。最后,进行大数据的偏误反思,了解巨量资料不是万灵丹,仍然会有一些上限与挑战。

上课形式

本课程分为八个主要单元,每个单元将由数个小单元所组成。

而每个小单元将提供一段2~13分钟的视频教学影片。

配合每周课程内容提供随堂测验,以帮助学习者快速确认是否了解上课内容,另安排周作业、随堂测验、周次议题讨论与期末专案等用以考核学习成果,考核标准请参见「评分标准说明」。

评分标准

本课程评分标准著重于资料分析实际操作练习,是以课堂作业、单元测验、讨论区之议题讨论与期末小专案实作成绩为计算依据,总成绩共 100 分,各评分项目配分方式符合课程需求及公平性。

  • 周作业 42% (前七周次作业)

评分阶段主要依各周次难易程度进行1至2个实际操作型作业,可区分为两部分。

(1) 第1至4周:作业以「基础」相关模式演算分析实作题型为主。

(2) 第5至7周:作业以「进阶」相关模式演算分析实作题型为主。

  • 随堂测验 10% (各课程单元小测验)

针对回答的正确性进行评分。每单元进行相关测验复习。

  • 议题讨论 15% (每一周次讨论议题)

评分方向以:提问(分享)合理性及建设性、回应内容正确性等,由教师及助教针对学习者分享资料或提出问题的合理性及建设性、议题回应的正确性及积极性进行评分。

  • 期末测验 33% (第八周期末小专案)

请完成一资料分析小专案,迈向资料分析科学家之路吧!

→ 自由选定一资料集(课程使用除外)、任一模式演算方法进行资料分析。

→ 上传内容可包含文字档描述 (选定资料集原因、欲分析之目标等)、资料集、模型架构、使用模式方法、结果解读等,但不拘限。

通过标准


课程及格标准:60分满分:100分

先修科目或先备能力

具备基本资料处理之相关知识即可。

建议参考书目

本课程提供上课讲义,不需额外购买教科书。学习者仍可参考坊间书局或以下推荐之资料分析相关书籍,以获得更丰富及更深入的学习内容。

l   Nate Silver,苏子尧/译(2013),「精准预测:如何从巨量杂讯中,看出重要的讯息?」,三采。

l   Mark Buchanan,叶伟文/译(2007),「隐藏的逻辑:掌握群众行为的不败公式」,天下文化。

l   Ian Ayres, 张美惠/译 (2008), 「什么都能算,什么都不奇怪」,时报出版

l   John E. Kelly III, Steve Hamm, (2014) 陈以礼/译, 「智科科技」,天下文化。

l   Thomas H. Davenport (2014), 江裕真/译,「大数据@工作力」,天下文化。

l   Christian Rudder, 林俊宏/译 (2016),「我们是谁?大数据下的行为观察」,马可孛罗。

l   David Weinberger, 王年恺/译 (2012), 「Too Big To Know」,猫头鹰。

l   Victor Mayer-Schonberger, Kenneth Cukier (2013), 林俊宏/译,「大数据」,天下文化。

l   Paul Teetor, 张夏真/译 (2014), 「R锦囊妙计」,O’REILLY。

l   袁梅宇 (2015), 「王者归来:WEKA机器学习与大数据圣经」,佳魁。

l   李仁钟 (2015), 「应用R语言于资料分析:从机器学习、资料探勘到巨量资料」,松岗。

l   Jiawei Han, Micheline Kamber, Jian Pei, 郝沛毅, 李御玺, 黄嘉彦/编译 (2014), 「资料探勘」,高立图书/ Elsevier Taiwan LLC。

Thomas Gilovich, 林力敏/译 (2015), 「康乃尔最经典的思考逻辑课」,先觉。

常见问答集

  1. 问:此课程完成后是否提供相关证书?
    答:是。总成绩超过 (含) 60分者,可获得「修课通过证明」。

  2. 问:此课程是否会提供上课投影片?
    答:是。本课程相关投影片与教材皆可于下载专区获得学习。

  3. 问:此课程是否有特定的应用领域?
    答:否。本课程所教授之内容为基础资料分析之概念与应用,课程中以不同的模式分析方法,包括集群、分类、关联等,透过Weka、R、Mahout 等资料分析软体与框架进行实务演练,以作为范例来说明如何应用,使学习者能将其模式广泛地应用于各领域中。