基于SPSS Modeler +Weka 组合优惠, 数据挖掘分析与应用
基于SPSS Modeler 十个案例玩转数据挖掘课程大纲
案例1
评估新车设计(汽车业):某汽车制造商开发两种新车(汽车及卡车)的原型。在将新车型引入至产品系列之前,制造商想知道竞争对手已经上市的车辆中,哪些与这两款产品的原型最为相似,以确定这两种新车将与哪些车型展开竞争。此案例将采用K最近邻居(K Nearest Neighbor; KNN)来建模。
案例2
电信客户流失(电信业):某电信服务提供商非常关注客户流失到竞争对手的数量。假如服务使用的数据可以用来预测哪些客户有可能被转移到另一个供货商,则此供货商可提供客制化的优惠,以尽可能留住客户。此案例将采用二元罗吉斯回归(Binomial Logistic Regression)来预测客户的流失。
案例3
药物治疗(医疗业):某医学研究中心收集许多患有某疾病的病患数据,并记录哪一种药物对病患是有疗效的(总共有五种针对此疾病的药物)。此案例将采用决策树 C5.0(Decision Tree C5.0)找出,哪种药物适用于哪一种类型的病人。
案例4
预测贷款逾期者(银行业):某银行希望根据客户过去的贷款数据,利用贝式网络(Bayesian Network)来建模,以便用模型来预测新的贷款者,核贷后会逾期的机率,以做为银行是否核贷的依据,或提供给客户其他类型的贷款产品。
案例5
电信客户分类(电信业):某电信服务提供商透过客户使用服务的方式,将客户分为四类人。此案例的目的是想根据人口统计数据,利用多元罗吉斯回归(Multinomial Logistic Regression)来找出这四类人的特征,并发掘这四类人的潜在新客户。
案例6
细胞样本分类(医疗业):某医学研究中心收集癌症病患的细胞样本特征数据,以便进行研究。原始的数据中显示良性样本与恶性样本间的许多特征有显著的差异。此案例的目的是想利用支持向量机(Support Vector Machine)来建模,以便用模型来提早发现某样本是良性还是恶性的样本。
案例7
零售业销售促销(零售业):此案例的目的是想根据零售产品过去的促销记录,利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。
案例8
预测带宽使用率(通讯业):某全国宽带网络供货商的分析师需进行客户使用网络流量的预估,以便预测带宽的使用。全国网络的使用是全国各局域网络使用的加总,因此分析师需逐一对每个区域市场进行带宽使用的预测。
案例9
预测型录商品的销售(零售业):某型录公司希望根据过去10年的销售记录,来预测男装生产线每月的销售。此案例的目的是想利用两个时间序列模型-指数平滑(Exponential Smoothing)和ARIMA来解决这个问题。
案例10
个人信息及每次购买商品的数据,利用关联模型(Apriori)和决策树C5.0(Decision Tree C5.0)来发掘购买类似商品的客群,以及客群的特征(例如,年龄、收入、等)。
WEKA-大数据的分析与应用课程大纲
第一部分: 大數據時代(The Era of Big Data)
1.大数据的起源及其未来趋势
2.大数据与智能手机、感知装置、物联网、社群媒体及云计算的关系
3.大数据应用的成功案例
4.大数据时代的思维变革
5.社群数据与移动的应用
6.文本数据下的舆情分析
第二部分: 数据挖掘基础(Basic Concept)
1.大数据的核心关键技术-数据挖掘
2.数据挖掘的发展历程、进行步骤、及产业标准(CRISP DM vs. SEMMA)
3.基本数据挖掘技术简介(查询工具、统计技术、可视化技术、K-最近邻技术、…)
4.进阶数据挖掘技术简介(分类、预测、关联规则、序列型样、聚类、…)
5.WEKA简介及操作接口(Explore, Experimenter, Knowledge Flow,Command Line)说明
第三部分: 数据挖掘技术(Data Mining Techniques)及实务建模(Practical Models)
1.数据前处理(Data Preprocessing)
*字段的选择:多重数据源的整合、建立区隔化模型
*数据的清洗:数据质量报告(Data Quality Report)的制作、空值(Missing Value)、错误值(Wrong Value)及离群值(Outlier)的侦测及处理方式
*字段的扩充:外部数据的整并及内部数据的统整
*数据的编码:
(1)数据正规化(Data Normalization)技术
(2)数据一般化(Generalization)技术
(3)数据离散化(Data Discretization)技术
(4)数据连续性指派(Continuousness Arbitrary)技术
(5)记录精简(Record Reduction)技术
(6)域值精简(Value Reduction)技术
(7)字段精简(Attribute Reduction)技术
*如何将原始数据依母体目标字段上的比例分成训练及测试数据集
*10-折交叉验证(10-Fold Cross Validation)
2.关键字段/变量发掘技术
(1)银行信用风险评估之进件评分卡(Application Scorecard)案例
(2)玻璃制品分类案例
3.分类技术(Classification Techniques) – 贝氏网络 (Bayes Net)
(1)糖尿病预测案例
(2)天气预测案例
4.预测技术(Prediction Techniques) – 线性回归 (Linear Regression)
(1)汽车油耗预测案例
(2)CPU效能预测案例
5.分类及预测技术 (Classification & Prediction Techniques) – 决策树 (Decision Tree)
(1)电信产品跨销售(Cross-Selling)案例
(2)影像(Image)数据分类案例
(3)乳腺癌(Breast Cancer)预测案例
6.分类及预测技术 (Classification & Prediction Techniques) – 类神经网络 (Neural Network)
(1)可视化工具(Boundary Visualizer)实作
(2)便利超商(Convenience_Store)选点案例
(3)房价(Home Price)预测案例
7.分类技术 (Classification Techniques) – 罗吉斯回归 (Logistic Regression)及支持向量机 (Support Vector Machine)
(1)糖尿病预测案例
(2)电信客户流失案例
8.聚类技术(Clustering Techniques) – K-Means, Kohonen SOM, Two-Step
(1)银行客户聚类(Customer Segmentation)及营销活动设计案例
(2)鸢尾花案例
9.关联规则及序列型样技术(Association Rules & Sequential Patterns Techniques) – Apriori & AprioriAll
(1)零售购物篮分析案例
(2) 零售向上销售(Up-Selling)案例
10.WEKA处理大数据及与其他系统的链接
(1)LED分析案例(5亿笔数据、5GB大小)
(2)Java实作与Weka的链接
现今大数据的时代,各行各业都迫切地想要利用大数据来解决它们的问题,本次课程就是针对大数据分析上的应用与案例,以及进入大数据后分析方式的转变,运用OpenSource-WEKA ;SPSS Modeler专业数据挖掘软件,做广泛且深入的探讨。李老师运用强悍的行业经验,教你不寻常的数据挖掘技巧!
项目名称 |
时间
|
地点
|
费用
|
报名
|
十个案例玩转数据挖掘
|
2015.4.11-19
|
全国直播
|
2800/2200(凭学生证优惠)
|
点击报名
|
WEKA-数据挖掘及应用
|
2015.3.28-4.5
|
2800/2200(凭学生证优惠)
|
点击报名
|
SPSS Modeler与WEKA数据挖掘
|
2015.3.28-4.5 2015.4.11-19
|
5000/4000(凭学生证优惠)
|
组合报名
|
玩转数据挖掘必学课程,十个案例玩转数据挖掘(SPSS Modeler)及WEKA-数据挖掘及应用,学习系列课程立减600元(原价5600元)名额有限,报名从速!
(组合报名优惠)
李御玺 (Yue-Shi Lee),国立台湾大学计算机工程博士,铭传大学计算机工程学系教授,铭传大学大数据研究中心主任,中华资料采矿协会理事, 浙江大学城市学院客座教授,云南财经大学信息学院客座教授, 厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问。其研究领域专注于大数据、数据挖掘、与文本挖掘。李博士在其相关研究领域已发表超过280篇以上的研究论文,同时也是台湾科技部与教育部多个相关研究计划的主持人。
学员对象:
(1)数据分析相关工作的各企业人员;有志于学习数据挖掘技术和软件的社会各界人士;
(2)从事数据挖掘和统计分析等相关领域教学的高校教师;
(3)有志于从事金融数据挖掘、商业数据挖掘分析工作和数据挖掘理论研究的学生;
(4)营销经理人、数据库管理者、及智能系统开发者;
十个案例玩转数据挖掘(SPSS Modeler实作)
1. 如何开始进行企业的数据挖掘项目,评估新车设计案例
2. 药物治疗案例,电信客户流失案例
3.关键字段/变量发掘技术,银行信用风险评估之进件评分卡(Application Scorecard)案例
4. 分类技术——贝氏网络(Bayes Net),银行目标客户营销(Target Marketing)案例
5. 预测技术——线性回归(Linear Regression),汽车油耗预测案例
6. 分类及预测技术——决策树(Decision Tree),电信产品跨销售(Cross-Selling)案例
7. 分类及预测技术——类神经网络 (Neural Network),细胞样本分类案例,零售促銷案例
8. 分类技术——罗吉斯回归(Logistic Regression),电信客户分类(不同套餐选择)与客户流失案例解读
9. 预测技术——时间序列(Time Series),全国网络带宽使用预测与男装销售金额预测案例
10. 聚类技术——K-Means,Kohonen SOM, Two-Step,银行客户聚类(Customer Segmentation)及营销活动设计案例
11. 关联规则及序列型样技术——Apriori & AprioriAll ) 零售购物篮分析与零售向上销售(Up-Selling)案例
更多详情内容 》 》 》 》 》 http://bbs.pinggu.org/thread-3565731-1-1.html
WEKA——数据挖掘技术与应用
1. WEKA简介及操作接口(Explore,Experimenter, Knowledge Flow, Command Line)说明;
WEKA实作: 疾病诊断、寿险推销案例解读
2.数据前处理,字段的扩充:外部数据的整并及内部数据的统整;
WEKA实作:
(1) 进件评分卡与药物治疗案例
(2) 鸢尾花和糖尿病预测案例
(3) 电离层雷达侦测案例
3. 利用统计检定(StatisticalTest)的方法发掘关键变量;
(1)银行信用风险评估之进件评分卡(ApplicationScorecard)案例
(2)玻璃制品分类案例
4. 分类技术(Classification Techniques):分类模型效能的评估方式;
(1)糖尿病和天气预测案例
5. 简单线性回归和复回归原理,预测模型效能的评估方式;
(1)汽车油耗预测案例
(2)CPU效能预测案例
6. 分类树与分类规则及其回归树进阶;
(1)电信产品跨销售(Cross-Selling)案例
(2)影像(Image)数据分类案例
(3)乳腺癌(Breast Cancer)预测案例
7. 倒传递类神经网络与罗吉斯回归, 线性回归, 非线性回归间的关系;
(1)可视化工具(Boundary Visualizer)实作
(2)便利超商(Convenience_Store)选点案例
(3)房价(Home Price)预测案例
8.WEKA处理大数据及与其他系统的链接;
(1)LED分析案例(5亿笔数据、5GB大小)
(2)Java实作与Weka的链接
更多详情内容 》 》 》 》 》 http://bbs.pinggu.org/thread-3562864-1-1.html
【报名流程】
1. 网上提交报名信息;
2. 在线缴费:http://baoming.pinggu.org/paycenter.aspx
3. 给予反馈,确认报名信息;
4.开课前一周发送上课资料与软件;
最新消息:完成课时学习后即可申请工信部证书,另交证书费用400元 (自愿原则)
【报名优惠】
(1)论坛的统计软件课程往期的现场班学员一律9折优惠;
(2)同一单位3人以上报名,9折优惠;
(3)独家资料,赠送现场班视频,永久学习;
(4)课后赠送论坛币1000个(玩转论坛必备) 现在就报名!
【报名咨询】
电话: (010)68456523
QQ:2881989712 2665954139
手机: 13718534278(张老师)
18010116775 (曹老师)
邮箱: zhangwei@pinggu.org
tr.service@pinggu.org