报名时间 |
2016-08-08 09:57 至 2016-09-23 00:00 |
培训时间 |
2016年9月23-25日 (三天) |
培训地点 |
北京市海淀区首都体育学院 |
培训费用 |
3000元 / 2400元 (仅限全日制本科生和硕士研究生优惠价) |
授课安排 |
上午9:00-12:00,下午1:30-4:30,答疑4:30-5:00 |
讲师介绍:
曾珂:管理科学工硕士,CDA讲师,从事互联网、电商方向数据分析与数据挖掘的研究与CDA数据分析师的教学工作,擅长为文本挖掘、客户关系管理、数据可视化。
课程介绍:
本课程介绍使用R语言进行文本处理、文本挖掘。具体介绍文本处理的常见方法、文本挖掘的原理、分类器的原理,词典构造原理,再结合一些实际案例,让学员能熟悉文本处理文本挖掘,并能够使用R语言完成文本处理的任务。
课程内容:
第一天:
1.自然语言处理与文本处理概述
2.文本的一些常见处理方法:正则匹配、切词分词、R字符串处理
3.文本数据的获取-爬虫
4.案例与练习穿插
第二天:
1.基于分类器的文本挖掘介绍
2.基于分类器的文本挖掘:预处理:切词分词-生成词文档矩阵
3.基于分类器的文本挖掘:词频文档矩阵
4.基于分类器的文本挖掘:分类器分类和结果评估
5.案例与练习穿插
第三天:
1.基于规则的文本挖掘介绍
1.基于规则的文本挖掘:词典的构造
2.基于规则的文本挖掘:规则匹配
3.基于规则的文本挖掘:结果评估
5.案例与练习穿插
优惠:
现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;
以上优惠不叠加。
联系方式:
魏老师
QQ:1143703950
Tel:010-68478566
Mail:vip@pinggu.org