基于SPSS Modeler +Weka 组合优惠, 数据挖掘分析与应用
上课信息
上课时间:
2015.3.28-4.5 2015.4.11-19
9:00-12:00 13:30-16:30(16:30-17:00答疑)
上课地点: 全程远程直播
1.大数据的起源及其未来趋势
2.大数据与智能手机、感知装置、物联网、社群媒体及云计算的关系
3.大数据应用的成功案例
4.大数据时代的思维变革
5.社群数据与移动的应用
6.文本数据下的舆情分析
1.大数据的核心关键技术-数据挖掘
2.数据挖掘的发展历程、进行步骤、及产业标准(CRISP DM vs. SEMMA)
3.基本数据挖掘技术简介(查询工具、统计技术、可视化技术、K-最近邻技术、…)
4.进阶数据挖掘技术简介(分类、预测、关联规则、序列型样、聚类、…)
5.WEKA简介及操作接口(Explore, Experimenter, Knowledge Flow,Command Line)说明
1.数据前处理(Data Preprocessing)
*字段的选择:多重数据源的整合、建立区隔化模型
*数据的清洗:数据质量报告(Data Quality Report)的制作、空值(Missing Value)、错误值(Wrong Value)及离群值(Outlier)的侦测及处理方式
*字段的扩充:外部数据的整并及内部数据的统整
*数据的编码:
(1)数据正规化(Data Normalization)技术
(2)数据一般化(Generalization)技术
(3)数据离散化(Data Discretization)技术
(4)数据连续性指派(Continuousness Arbitrary)技术
(5)记录精简(Record Reduction)技术
(6)域值精简(Value Reduction)技术
(7)字段精简(Attribute Reduction)技术
*如何将原始数据依母体目标字段上的比例分成训练及测试数据集
*10-折交叉验证(10-Fold Cross Validation)
(1)银行信用风险评估之进件评分卡(Application Scorecard)案例
(2)玻璃制品分类案例
(1)糖尿病预测案例
(2)天气预测案例
(1)汽车油耗预测案例
(2)CPU效能预测案例
(1)电信产品跨销售(Cross-Selling)案例
(2)影像(Image)数据分类案例
(3)乳腺癌(Breast Cancer)预测案例
(1)可视化工具(Boundary Visualizer)实作
(2)便利超商(Convenience_Store)选点案例
(3)房价(Home Price)预测案例
(1)糖尿病预测案例
(2)电信客户流失案例
(1)银行客户聚类(Customer Segmentation)及营销活动设计案例
(2)鸢尾花案例
(1)零售购物篮分析案例
(2) 零售向上销售(Up-Selling)案例
(1)LED分析案例(5亿笔数据、5GB大小)
(2)Java实作与Weka的链接
现今大数据的时代,各行各业都迫切地想要利用大数据来解决它们的问题,本次课程就是针对大数据分析上的应用与案例,以及进入大数据后分析方式的转变,运用OpenSource-WEKA ;SPSS Modeler专业数据挖掘软件,做广泛且深入的探讨。李老师运用强悍的行业经验,教你不寻常的数据挖掘技巧!
项目名称 | 时间 | 地点 | 费用 | 报名 |
十个案例玩转数据挖掘 | 2015.4.11-19 | 全国直播 | 2800/2200(凭学生证优惠) | |
WEKA-数据挖掘及应用 | 2015.3.28-4.5 | 2800/2200(凭学生证优惠) | ||
SPSS Modeler与WEKA数据挖掘 | 2015.3.28-4.5 2015.4.11-19 | 5000/4000(凭学生证优惠) |
玩转数据挖掘必学课程,十个案例玩转数据挖掘(SPSS Modeler)及WEKA-数据挖掘及应用,学习系列课程立减600元(原价5600元)名额有限,报名从速!
李御玺 (Yue-Shi Lee),国立台湾大学计算机工程博士,铭传大学计算机工程学系教授,铭传大学大数据研究中心主任,中华资料采矿协会理事, 浙江大学城市学院客座教授,云南财经大学信息学院客座教授, 厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问。其研究领域专注于大数据、数据挖掘、与文本挖掘。李博士在其相关研究领域已发表超过280篇以上的研究论文,同时也是台湾科技部与教育部多个相关研究计划的主持人。
学员对象:
(1)数据分析相关工作的各企业人员;有志于学习数据挖掘技术和软件的社会各界人士;
(2)从事数据挖掘和统计分析等相关领域教学的高校教师;
(3)有志于从事金融数据挖掘、商业数据挖掘分析工作和数据挖掘理论研究的学生;
(4)营销经理人、数据库管理者、及智能系统开发者;
十个案例玩转数据挖掘(SPSS Modeler实作)
1. 如何开始进行企业的数据挖掘项目,评估新车设计案例
2. 药物治疗案例,电信客户流失案例
3.关键字段/变量发掘技术,银行信用风险评估之进件评分卡(Application Scorecard)案例
4. 分类技术——贝氏网络(Bayes Net),银行目标客户营销(Target Marketing)案例
5. 预测技术——线性回归(Linear Regression),汽车油耗预测案例
6. 分类及预测技术——决策树(Decision Tree),电信产品跨销售(Cross-Selling)案例
7. 分类及预测技术——类神经网络 (Neural Network),细胞样本分类案例,零售促銷案例
8. 分类技术——罗吉斯回归(Logistic Regression),电信客户分类(不同套餐选择)与客户流失案例解读
9. 预测技术——时间序列(Time Series),全国网络带宽使用预测与男装销售金额预测案例
10. 聚类技术——K-Means,Kohonen SOM, Two-Step,银行客户聚类(Customer Segmentation)及营销活动设计案例
11. 关联规则及序列型样技术——Apriori & AprioriAll ) 零售购物篮分析与零售向上销售(Up-Selling)案例
更多详情内容 》 》 》 》 》 http://bbs.pinggu.org/thread-3565731-1-1.html
WEKA——数据挖掘技术与应用
1. WEKA简介及操作接口(Explore,Experimenter, Knowledge Flow, Command Line)说明;
WEKA实作: 疾病诊断、寿险推销案例解读
2.数据前处理,字段的扩充:外部数据的整并及内部数据的统整;
WEKA实作:
(1) 进件评分卡与药物治疗案例
(2) 鸢尾花和糖尿病预测案例
(3) 电离层雷达侦测案例
3. 利用统计检定(StatisticalTest)的方法发掘关键变量;
(1)银行信用风险评估之进件评分卡(ApplicationScorecard)案例
(2)玻璃制品分类案例
4. 分类技术(Classification Techniques):分类模型效能的评估方式;
(1)糖尿病和天气预测案例
5. 简单线性回归和复回归原理,预测模型效能的评估方式;
(1)汽车油耗预测案例
(2)CPU效能预测案例
6. 分类树与分类规则及其回归树进阶;
(1)电信产品跨销售(Cross-Selling)案例
(2)影像(Image)数据分类案例
(3)乳腺癌(Breast Cancer)预测案例
7. 倒传递类神经网络与罗吉斯回归, 线性回归, 非线性回归间的关系;
(1)可视化工具(Boundary Visualizer)实作
(2)便利超商(Convenience_Store)选点案例
(3)房价(Home Price)预测案例
8.WEKA处理大数据及与其他系统的链接;
(1)LED分析案例(5亿笔数据、5GB大小)
(2)Java实作与Weka的链接
更多详情内容 》 》 》 》 》 http://bbs.pinggu.org/thread-3562864-1-1.html
【报名流程】
1. 网上提交报名信息;
2. 在线缴费:http://baoming.pinggu.org/paycenter.aspx
3. 给予反馈,确认报名信息;
4.开课前一周发送上课资料与软件;
最新消息:完成课时学习后即可申请工信部证书,另交证书费用400元 (自愿原则)
【报名优惠】
(1)论坛的统计软件课程往期的现场班学员一律9折优惠;
(2)同一单位3人以上报名,9折优惠;
(3)独家资料,赠送现场班视频,永久学习;
(4)课后赠送论坛币1000个(玩转论坛必备) 现在就报名!
【报名咨询】
电话: (010)68456523
QQ:2881989712 2665954139
手机: 13718534278(张老师)
18010116775 (曹老师)
邮箱: zhangwei@pinggu.org
tr.service@pinggu.org
内容不能少于5个字符!