Python数据挖掘应用班——远程直播_数据挖掘_直播北京国富如荷网络科技有限公司-Peixun.net

课程章节详情

Python数据挖掘应用班——远程直播

第一阶段： Python 基础精要，零基础也能学会

1. 语法初步

2. 列表、字符串和元组

3. 集合与字典

4. 条件和循环语句

5. 若干重要内置函数应用

6. 文件操作

7. 函数及其应用

8. 正则表达式

9. 数据库和 Python

10.排序算法、动态规划算法、递归算法等算法

第二阶段：numpy、pandas等进行数据清洗和整理，充分统计分析数据

1. 整理数据（切片、产生随机数、复制、广播、排序等）

2. 数据索引和选择的各种方法

3. 数据的分组、分割、合并、变形

4. 缺失值和空值的数据处理

5. 时间序列数据处理、建模和预测（ARIMA）

6. 含中文数据的处理

7. 数据去重、去离群值

8. R语言和Python（pandas）数据整理和建模的比较

9. 描述统计和推论统计分析

第三阶段：Python机器学习算法和数据挖掘案例实战

1. 文本挖掘原理和案例（Logistic 回归模型对文本的分类）

2. 预测分析核心算法（图片的K-means聚类分析）

3. 机器学习经典算法（图片的识别和分类：PCA建模）

4. 概率统计（二维手写数字识别 KNN方法）

5. 数据可视化（推荐系统和精准营销最近邻方法、协同过滤）

6. 金融建模分析（数据可视化的各种情形）

7. 客户画像和精准营销（新闻的文本分类 TF-IDF准则、旅游新闻个性化推荐）

8. 算法和模型的优化（手写识别）

9. 模型精度评估和提升（朴素贝叶斯决策）

10.特征选取的方法（酒的品质分类预测）

11.最佳K-means分类数（机器学习的格点搜索和参数寻优）

12.交叉验证（CV）（惩罚线性回归分类器）

13.不平衡数据处理（使用支持向量机识别和分类）

14.XGBoost 使用案例（金融时间序列预测）

15.贝叶斯分析（机器集成学习算法）

16.逼近和最优化（随机模拟）

17.自然语言概率图模型（用户流失预警）

18 马尔科夫&蒙特卡罗（量化投资实战）

一、课程目标

1.数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析

2.初学者快速掌握Python 数据分析和数据挖掘（含机器学习）的思想和方法

3.形成科学有效的知识和能力结构体系框架，为今后数据分析工作打下良好的基础

二、课程特色

1．全程没有艰深的公式，几乎全部以实际案例带动启发理解，以通俗易懂的语言讲清楚深刻的数据分析和挖掘思想，随时互动、答疑解惑

2．注重学以致用、注重应用场景再现。把工作中常见的数据分析模型和案例加以剖析，使得学员在实际工作中很快能上手进行实际问题的解决

3．注重实际工作经验分享，让学员在工作学习中少走弯路，以培养兴趣为引导、以阐明基本原理思想为基础，让学员在数据分析中有应万变的能力

三、授课老师

覃老师，早年毕业于中国人民大学统计学院，近 20 年来一直进行着数据分析的理论和实践，熟悉数据分析与建模，擅长使用Python、R语言、SAS和Spark解决大数据建模及算法优化难题，积累了大量实践案例，经验丰富；善于用逻辑贯穿数据分析过程，把深奥的思想和方法用通俗易懂的语言讲述清楚透彻，善于用数据分析计算机程序实现从数据到结论到预测的落地过程。2010 年至今培养了上万名（包括首批）使用R语言、SAS和Python等工具实现数据分析和挖掘的专业人士，帮助他们在数据挖掘领域提升工作技能或实现就业。

覃老师曾在某世界500强金融业公司工作期间曾带队负责开发国内首款基于数据分析建模、随机模拟和最优化精确计算的金融年金产品，该产品销售额持续领跑同业市场多年，获得金融产品创新大奖。

覃老师培训或完成过数据分析和挖掘项目的企业有中国人寿、陆金所、中国建设银行、汇丰银行、北京银行、渤海银行、宁波银行、吴江农商行、中国移动等。

四、课程大纲：