Peixun.net > 现场班 > 数据挖掘 > R数据挖掘与机器学习

R数据挖掘与机器学习

课时:0 | 22人学习 分享 收藏
以实际案例引入,深入浅出地讲解如何使用R语言进行数据挖掘和机器学习,让学员不仅掌握R语言的使用,更重要的是学会数据挖掘和机器学习的思想、原理和方法。
学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。

上课信息

上课时间: 2018年1月21-25日 (五天)
上午9:00-12:00; 下午2:00-5:00; 答疑

上课地点: 北京市海淀区厂洼街3号丹龙大厦B座三层

R数据挖掘与机器学习

R数据挖掘与机器学习-初级班

第1讲(3小时)R语言入门

目标:掌握R语言的基本用法

1.R语言介绍

2.编辑软件Rstudio使用

3.R程序包的载入与使用

4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)

第2讲(3小时)数据读写, R基本编程

目标:掌握用R编写函数和数据的读写

1.R数据读入与读出(读入txt、xls、SPSS、SAS、stata以及数据库文件)

2.R函数编写

3.R的条件与循环函数

4.高效编程技巧介绍

第3讲 (3小时)数据预处理, 探索性分析

目标:掌握数据预处理与探索性分析

1.数据预处理

2.缺失值处理

3.随机数生成

4.常用统计方法的蒙特卡洛模拟

5.随机抽样

6.单变量数据分析与作图

7.双变量数据分析与作图

8.多变量数据分析与作图

案例1:统计作图在调查数据中的应用

案例2:统计作图在临床医学中的应用

第4讲(3小时)数据挖掘与机器学习入门, 线性回归 \目标:数据挖掘与机器学习入门

1.何为数据挖掘与机器学习

2.数据挖掘与机器学习的主要研究内容

3.有监督学习与无监督学习区别

4.一元线性回归

5.多元线性回归

6.逐步回归

案例1:广告营销计划案例

案例2:信用卡债务预测案例

案例3:房价预测案例

第5讲(3小时)线性分类方法

目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1:信用卡违约预测案例

案例2:股价涨跌方向预测案例

第6讲(3小时)重抽样方法, 互动交流讨论

目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1:量化投资资产配置案例

案例2:汽车每加仑汽油里程数预测案例

互动交流讨论

R数据挖掘与机器学习-高级班

第1讲(3小时)线性分类方法

目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1:信用卡违约预测案例

案例2:股价涨跌方向预测案例

第2讲(3小时)重抽样方法

目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1:量化投资资产配置案例

案例2:汽车每加仑汽油里程数预测案例

第3讲(3小时)决策树, 组合预测

目标:掌握决策树和组合预测方法及其实际应用

1.CART决策树

2.Bagging,

3.随机森林

4.Boosting算法

案例1:棒球运动员薪水预测案例

案例2:心脏病预测案例

案例3:信用卡违约预测案例

第4讲(3小时)支持向量机

目标:掌握支持向量机分类方法

1.最大间隔分类器

2.支持向量分类器

3.支持向量机

案例1:基因表达数据案例

案例2:股票涨跌方向预测

第5讲(3小时)变量选择与高维数据

目标:掌握数据挖掘中高维数据分析方法及其实际应用。

1.LASSO

2.SCAD

3.MCP

4.Group LASSO

案例1:基因筛选

案例2: 股票选股

第6讲(3小时)无监督学习, 主成分分析, 主成分回归, 聚类分析

目标:掌握无监督学习方法及其应用。

1.主成分分析

2.主成分回归

3.Kmeans聚类分析

4.系统聚类分析

案例1:广告支出主成分分析

案例2:犯罪率主成分分析

案例3:学生考试成绩主成分分析

案例4:客户细分聚类案例


报名时间 2017-11-20 14:00 至 2017-01-20 00:00
培训时间 2018年1月21-25日 (五天)
培训地点 北京市海淀区厂洼街3号丹龙大厦B座三层
培训费用 6000元 /5400元 (仅限全日制本科生和硕士研究生优惠价)
授课安排 上午9:00-12:00; 下午2:00-5:00; 答疑


大数据时代数据分析的必备技能

——R数据挖掘与机器学习


R简介

R语言由新西兰奥克兰大学ross ihaka和robert gentleman 开发。R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的顶级统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件已经成为一种趋势。

R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian


学员对象

高校硕士生、博士生、青年教师;

金融、医疗、通讯、咨询、电子商务等领域的数据分析人员、数据挖掘工程师、数据科学家等。


培训目的和特色:

1. 让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
2. 以实际案例引入,深入浅出地讲解如何使用R语言进行数据挖掘和机器学习,让学员不仅掌握R语言的使用,更重要的是学会数据挖掘和机器学习的思想、原理和方法。
3. 学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。


培训内容目录:

初级班:

专题名称

授课内容

13小时)

   R语言入门

目标:掌握R语言的基本用法

1.R语言介绍

2.编辑软件Rstudio使用

3.R程序包的载入与使用

4.数据对象及运算

(向量、矩阵、数组、列表与数据框处理)

23小时)

数据读写

R基本编程

目标:掌握用R编写函数和数据的读写

1. R数据读入与读出

(读入txtxlsSPSSSASstata以及数据库文       件)

2.R 函数编写

3.R的条件与循环函数

4.高效编程技巧介绍

33小时)

数据预处理

探索性分析

目标:掌握数据预处理与探索性分析

1.数据预处理

2.缺失值处理

3.随机数生成

4.常用统计方法的蒙特卡洛模拟

5.随机抽样

6.单变量数据分析与作图

7.双变量数据分析与作图

8.多变量数据分析与作图

案例1:统计作图在调查数据中的应用

案例2:统计作图在临床医学中的应用

43小时)

数据挖掘与机器学习入门

线性回归

目标:数据挖掘与机器学习入门

1.何为数据挖掘与机器学习

2.数据挖掘与机器学习的主要研究内容

3.有监督学习与无监督学习区别

4.一元线性回归

5.多元线性回归

6.逐步回归

案例1广告营销计划案例

案例2信用卡债务预测案例

案例3房价预测案例

53小时)

线性分类方法

目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1信用卡违约预测案例

案例2股价涨跌方向预测案例

63小时)

重抽样方法

互动交流讨论

目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1量化投资资产配置案例

案例2汽车每加仑汽油里程数预测案例

互动交流讨论


高级班:

专题名称

授课内容

13小时)

线性分类方法

目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1信用卡违约预测案例

案例2股价涨跌方向预测案例

23小时)

重抽样方法

目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1量化投资资产配置案例

案例2汽车每加仑汽油里程数预测案例

33小时)

决策树

组合预测

目标:掌握决策树和组合预测方法及其实际应用。

1.CART决策树

2.Bagging

3.随机森林    

4.Boosting算法

案例1棒球运动员薪水预测案例

案例2心脏病预测案例

案例3信用卡违约预测案例

43小时)

支持向量机

目标:掌握支持向量机分类方法

1.最大间隔分类器

2.支持向量分类器

3.支持向量机

案例1基因表达数据案例

案例2股票涨跌方向预测

53小时)

变量选择与高维数据

目标:掌握数据挖掘中高维数据分析方法及其实际应用

1.LASSO

2.SCAD

3.MCP

4.Group  LASSO

案例1基因筛选

案例2 股票选股

6 3小时)

无监督学习

主成分分析

主成分回归

聚类分析

目标:掌握无监督学习方法及其应用。

1.主成分分析

2.主成分回归

3.Kmeans聚类分析

4.系统聚类分析

案例1广告支出主成分分析

案例2 犯罪率主成分分析

案例3 学生考试成绩主成分分析

案例4客户细分聚类案例



配套资料:

1)提供一份精心准备的非常全面的R软件入门和数据挖掘与机器学习讲义。
2)提供课程源代码1份和相应数据若干份。

特别赠送:方老师主讲的R视频!!价值1000元!!


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠不叠加。


联系方式:

魏老师

QQ:28819897142881989714

Tel:010-68478566

Mail:vip@pinggu.org

课程订阅

讲师介绍


Peixun.net

R数据挖掘与机器学习

请认真填写以下信息,方便为您服务
  • 姓名:
  • 电话:
  • 邮箱:
  • 备注:
  • 邀请码:
  • 您还可以选择 登录 或者 注册 更方便您管理课程。

Peixun.net

您关于:

R数据挖掘与机器学习

的报名信息已经提交成功。

去购物车结算
您可以选择 登录 或者 注册 更方便您管理课程。
回头再说

邮件已发送!

已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码

有待解答的问题

3 名学员对您的课程提问,需要您作出回答。 现在就去