Peixun.net > 现场班 > CDA数据分析师 > Python数据分析集训班

Python数据分析集训班

课时:0 分钟| 2人学习 分享 收藏
数据是信息时代的“新能源”。从金融到零售,从电商到体育,数据科学都成为成功决策的基础,广泛应用在营销优化、风险控制、客户关系等商业领域。 【CDA数据分析周末集训班-python方向】以CDA数据分析师标准等级大纲要求出发,从数据获取(Python爬虫、Mysql数据库)—统计学理论方法—数据分析与软件应用(Python)—数据挖掘和机器学习(Python)—数据可视化(Matplotlib,Seaborn等)整套数据分析流程技术系统讲解,还将结合量化投资、金融、银行、电信等行业真实需求出发全部用实际案例教学来使所学项目课程更能符合企业要求。

上课信息

上课时间: 2019年6月1-2019年8月25日
9:00—12:00,13:30—17:00

上课地点: 北京海淀区厂洼街三号 CDA数据分析研究院

Python数据分析集训班

Python基础

成为Python高手之前必备基础知识

Python标准数据类型(String、Number、Tuple、List、Dict、Set)及常用操作

控制流语句(条件分支、for循环、while语句、try-except-else-finally语句)

变量的作用域(内建变量、全局变量、局部变量、闭包外局部变量)

函数的参数(关键字参数、位置参数、形参和实参、默认参数、可变参数)

自定义函数--函数式编程

异常和错误

文件操作

时间模块

Python数据清洗

Numpy中的数据类型--ndarray数组的创建

Numpy数组基础(索引、切片、变形、分裂)

Numpy数组运算:通用函数

Numpy数组变形、拼接

Numpy数组计算:广播、聚合、比较和掩码、数组排序

Pandas对象简介(Series、Dataframe、Index)

Pandas数据加载与存储

Pandas数值运算方法:通用函数、聚合函数、遍历

Panda层次化索引

Pandas数据处理:数据类型转换、缺失值处理、字符串转换

Pandas数据表的合并与连接

Pandas数据的累计与分组

高性能Pandas:query()、eval()实现高性能运算

Pandas数据规整化:清理、转换、合并、重塑

统计学理论(视频)

数据分析方法概述:数据分析过程、数据分析的商业驱动

概率论基础:集合、概率、随机变量、概率密度、公理化)

变换和期望:随机变量函数分布、矩、矩列唯一性

常见分布族:离散分布、连续分布、指数分布、中心极限定理、概率不等式

多维随机变量:联合分布与边缘分布、多层模型与混合分布、二维变化、协方差与相关系数

随机样本的性质:抽样、样本分布

数据简化原理:似然函数、辅助函数

参数估计:点估计、区间估计、矩估计、贝叶斯估计、EM算法

假设检验:似然比检验、贝叶斯检验、最大功效检验、置信区间、P值、损失函数

渐进评价:相合性、有效性、标准误差、稳健性、LTR的渐进分布、近似极大似然区间

方差分析和回归分析:ANOVA假设、简单线性回归与最小二乘

回归模型:变量有误差时的线性回归、Logistic回归、稳健回归

Python爬虫

网络爬虫基础知识

网络请求及响应-requests库

HTML文档解析-BeautifulSoup库

常见反爬虫机制及应对

网络爬虫 VS 网络数据抓取

实战1:批量下载头像

实战2:抓取豆瓣书籍简介

实战3:模拟浏览器selenium抓取电商商品信息及评论

绘图思想的基本原理

Python数据可视化包-Matplotlib介绍

使用Matplotlib进行基本的图形绘制

使用Python数据处理包Pandas做可视化

Python数据可视化包-Seaborn介绍与图形绘制

Python数据可视化包-Pyecharts介绍与图形绘制

使用Python进行地图绘制-Pyecharts

Python数据清洗高级操作及案例实战

如何成为一名优秀的数据分析师

供Python读取的数据(CSV文件、JSON数据、XML数据)

数据的获取与存储(数据的不平等性、真实性、可读性、清洁度等)

对获取到的数据进行探索:埃博拉病毒危机、列车安全数据、童工数据)

数据清洗探索:找出要清洗的数据、数据格式化、找出离群值和不良数据、找出重复数据、模糊匹配、正则匹配等)

数据清洗探索:标准化和脚本化(数据归一化和标准化、找到适合项目的数据清洗方法、数据清洗脚本化、用新数据测试)

数据探索和分析:数据探索(表函数探索、连接多个数据集、找出离群值、创建分组)

数据探索与分析:分离和聚焦数据、描述结论、书写报告文档

Pandas时间序列&金融数据处理

数据清洗实战案例:泰坦尼克幸存者数据清洗

数据清洗实战案例:USDA食品数据清洗

数据探索实例:为什么非洲童工雇佣的概率更高?腐败感和童工雇佣有什么关系?

数据探索实例:国外电商用户购买信息的数据处理与探索:通过购物篮商品信息探索出客户来源、流失、留存率、消费水平及消费倾向

Mysql数据库管理(视频)

Mysql数据库知识介绍

Mysql数据库的基本操作

Mysql数据表的基本操作

Mysql数据类型和约束条件

数据的CRUD操作之增加、删除、修改数据表

SQL数据库表连接

SQL数据库单表查询、多表查询

SQL操作符和函数

SQL综合案例:彩票数据核对练习

SQL综合案例:电商数据查询练习

机器学习算法

机器学习入门介绍:机器学习基本思想、常用算法分类、算法库等

Scikit-Learn入门介绍:特征矩阵、标签数组、评估器及常用函数

Scikit-Learn特征工程:分类特征、文本特征、图像特征、特征衍生、缺失值填充、特征管道

原理补充:常用相似度衡量方法、归一化方法、混淆矩阵及常用模型评估指标

KNN-最近邻分类器、KD-Tree和KNN回归

KNN算法示例:改进约会网站配对效果

梯度下降算法:梯度下降、随机梯度下降和微批梯度下降

原理补充:条件概率计算、全概率公式、K-S曲线、受试者特征曲线(ROC)等

贝叶斯分类器:朴素贝叶斯、贝叶斯网络

朴素贝叶斯算法示例:垃圾邮件过滤

原理补充:梯度下降算法,包括梯度下降、随机梯度下降和微批梯度下降

回归分析:线性回归、岭回归、LASSO和弹性网

回归分析算法示例:预测海洋生物鲍鱼的年龄

广义线性回归:Logistic回归和泊松回归

Logistic回归算法示例:构建信用卡反欺诈模型

树模型:C4.5、C5.0和CART树

树模型算法示例:红酒分类

SVM支持向量机分类和支持向量机回归

SVM算法示例:手写数字识别

集成算法之Bagging类算法:Bagging、随机森林等

集成算法之Boosting类算法:Boosting、GBDT梯度提升树、XgBoost等

集成算法示例:泰坦尼克号幸存者预测

神经网络算法:反向传播神经网路、卷积神经网络、LSTM等

聚类分析:K-means快速聚类、DBSCAN密度聚类、层次聚类等

关联规则:Apriori、FP-Growth、PrefixSpan等

无监督学习:LDA、LSI

数据降维方法:PCA主成分分析和SVD奇异值分解

Scikit-Learn常用功能介绍与使用:网格搜索、Pipline

大型综合案例:利用Pipline选择模型构建机器学习流,并利用网格搜索完成模型调优

电商案例

分析目标:

精准营销实现流量的增加;

实现产品生命周期管理;

帮助构建商业活动KPI检测体系;

实现品类管理与多位能力模型构建

基于国外大型电商用户购买信息数据的客户购买预测模型构建流程:

step1:数据的读取及定位需要清洗的数据

step2:模型有监督/无监督判断

step3:非结构数据处理(数据编码处理--非数字特征)

step4:数据量纲处理(归一化/标准化)

step5:数据挖掘--无监督学习(给数据打上标签)

step6:构建预测模型--有监督学习

step7:模型的评估与选择

step8:模型的优化与封装

金融案例

分析目标:

构建用户画像助力用户风险控制;

实现金融产品的生命周期管理,助力产品迭代;

构建中小微企业的贷款风险和偿债能力分析/信用卡评分/反欺诈预测系统,实现企业风险控制能力的稳步提升"

基于大型金融公司的客户贷款信息,构建用户信用评分卡模型的建模步骤:

step1:数据的读取及定位需要清洗的数据

step2:模型有监督/无监督判断

step3:非结构数据处理

step4:空值、重复数据、离群点处理

step4:数据量纲处理(归一化/标准化)

step6:构建评分卡模型/反欺诈预测模型

step7:模型的评估与选择

step8:模型的优化与封装


报名时间 2019-05-16 14:38 至 2019-06-01 14:38
培训时间 2019年6月1-2019年8月25日
培训地点 北京海淀区厂洼街三号 CDA数据分析研究院
培训费用 12800
授课安排 9:00—12:00,13:30—17:00




CDA精英学院(课程简章)

岗位模型与知识增长   一站式知识服务   数据IP精英打造




& 学院简介

CDA精英学院,是经管之家CDA数据分析师品牌旗下面向职场人士的全新一站式学习院校。学院凝练了当下数据人士职业发展岗位模型,秉承了CDA数据分析师等级标准,推崇“技术+行业”的培养理念,致力于打造具有先进数据思维、成熟实战技能、创新解决方案的职场优秀人才。

CDA精英学院主要面向职场有数据分析技能提升需求的人士。包括为数据岗(分析师、工程师、技术顾问、数据官等)和非数据岗(产品、市场、运营、财务等)人员提供不同技术级别、不同行业领域的体系化培养课程,以及丰富的线下行业交流沙龙、优秀持证人分享会等个人IP打造活动。多方面、高层次为学员提供就业推荐咨询服务和定制化职业晋升解决方案服务。

& 岗位模型

基于多年的数据分析教学经验以及对当下企业数据相关岗位、薪资待遇的调查研究,CDA总结出来了一套权威职场“岗位模型”,获得市场认可和多家合作企业背书:

CDA精英学院岗位模型最左侧是经典的CDA LEVEL 1 2 3等级培训能力要求,“薪资范围”部分是每个等级对应企业相关数据岗位及薪资范围“技能&能力”部分是对应岗位的技能要求列表,即胜任某一岗位需要拥有什么样的能力。“推荐课程”部分是该技能对应的CDA精英学院课程。目前课程分为LEVEL 1业务数据分析师,LEVEL 2 Python数据分析集训,LEVE 2大数据分析师,AI工程师、LEVEL 3数据科学家、CDA数据分析周末集训营和CDA全栈数据科学集训营。学习周期时长3-7.5个月不等,学员可以根据自身需求进行选择。精英学院将为学员提供一站式特色教学和课程服务:学习过程中有助教全程辅导,讲师全程答疑、班主任督促学习、就业老师提供就业咨询服务等。

& LEVEL 2-Python数据分析集训课程介绍

在数据和信息爆炸的今天,各个行业尤其是金融、电商、房地产、医疗、健康、政府部门这类经济效应强势部门都在积极采用数据分析和数据科学协助决策的方式,来提高决策的正确性和高效性。并将其广泛应用在营销优化、风险控制、用户研究、疾病诊断、商业部署等领域。 Python数据分析集训课程涉及到统计、SQL、Python基础、数据清洗、Python爬虫、数据可视化(Matplotlib、Seaborn、Pyecharts)和python机器学习算法等内容,并结合互联网金融、电信、银行、医疗、交通等行业实际案例来帮助学员建立整套的数据分析思路,使学员更符合企业要求。

培训方式:

2 学习模式:面授 or 远程,2+1学习模式【2周线下(直播),1周线上】,线下(直播)周末培训8周,共16天,线上自由学习4周。

2 学习权限:一年内可免费重学任意2期不赠送视频课当日起一年内学完后台进度达到100%赠送的当期全套录播视频(150+h),即可申请长期视频学习权限。

学习目标:

2 熟练掌握数据科学领域最受欢迎的编程语言-Python

2 掌握使用Python和pandas库进行数据清洗和预处理

2 使用Python爬虫获取网络数据

2 学会使用matplotlib、seaborn进行初级可视化

2 学会使用Pyecharts进行高级数据可视化

2 学会构建机器学习算法进行分类、预测和聚类模型

2 使用Python进行数据分析整体思路、针对业务做出模型最优化选择

2 善用机器学习解决用户画像、精准营销、风险管理等商业问题

2 使用机器学习实操电商、金融、电信、医药行业真实项目案例

学习对象和基础:

2 在校学生、转行欲从业人士

2 在职数据分析师

2 有一定的统计基础最佳

2 Python数据分析和挖掘感兴趣的业界人士

2 学习完《业务数据分析师》课程学员为佳

课程大纲:

课程内容

时长

Python基础

成为Python高手之前必备基础知识

Python标准数据类型(String、Number、Tuple、List、Dict、Set)及常用操作

控制流语句(条件分支、for循环、while语句、try-except-else-finally语句)

变量的作用域(内建变量、全局变量、局部变量、闭包外局部变量)

函数的参数(关键字参数、位置参数、形参和实参、默认参数、可变参数)

自定义函数--函数式编程

异常和错误

文件操作

时间模块

12课时

Python数据清洗

Numpy中的数据类型--ndarray数组的创建

Numpy数组基础(索引、切片、变形、分裂)

Numpy数组运算:通用函数

Numpy数组变形、拼接

Numpy数组计算:广播、聚合、比较和掩码、数组排序

Pandas对象简介(Series、Dataframe、Index)

Pandas数据加载与存储

Pandas数值运算方法:通用函数、聚合函数、遍历

Panda层次化索引

Pandas数据处理:数据类型转换、缺失值处理、字符串转换

Pandas数据表的合并与连接

Pandas数据的累计与分组

高性能Pandas:query()、eval()实现高性能运算

Pandas数据规整化:清理、转换、合并、重塑

12课时

统计学理论

数据分析方法概述:数据分析过程、数据分析的商业驱动

概率论基础:集合、概率、随机变量、概率密度、公理化)

变换和期望:随机变量函数分布、矩、矩列唯一性

常见分布族:离散分布、连续分布、指数分布、中心极限定理、概率不等式

多维随机变量:联合分布与边缘分布、多层模型与混合分布、二维变化、协方差与相关系数

随机样本的性质:抽样、样本分布

数据简化原理:似然函数、辅助函数

参数估计:点估计、区间估计、矩估计、贝叶斯估计、EM算法

假设检验:似然比检验、贝叶斯检验、最大功效检验、置信区间、P值、损失函数

渐进评价:相合性、有效性、标准误差、稳健性、LTR的渐进分布、近似极大似然区间

方差分析和回归分析:ANOVA假设、简单线性回归与最小二乘

回归模型:变量有误差时的线性回归、Logistic回归、稳健回归

线上8课时

Python爬虫

网络爬虫基础知识

网络请求及响应-requests库

HTML文档解析-BeautifulSoup库

常见反爬虫机制及应对

网络爬虫 VS 网络数据抓取

实战1:批量下载头像

实战2:抓取豆瓣书籍简介

实战3:模拟浏览器selenium抓取电商商品信息及评论

12课时

Python数据可视化

绘图思想的基本原理

Python数据可视化包-Matplotlib介绍

使用Matplotlib进行基本的图形绘制

使用Python数据处理包Pandas做可视化

Python数据可视化包-Seaborn介绍与图形绘制

Python数据可视化包-Pyecharts介绍与图形绘制

使用Python进行地图绘制-Pyecharts

线上8课时

Python数据清洗高级操作及案例实战

如何成为一名优秀的数据分析师

供Python读取的数据(CSV文件、JSON数据、XML数据)

数据的获取与存储(数据的不平等性、真实性、可读性、清洁度等)

对获取到的数据进行探索:埃博拉病毒危机、列车安全数据、童工数据)

数据清洗探索:找出要清洗的数据、数据格式化、找出离群值和不良数据、找出重复数据、模糊匹配、正则匹配等)

数据清洗探索:标准化和脚本化(数据归一化和标准化、找到适合项目的数据清洗方法、数据清洗脚本化、用新数据测试)

数据探索和分析:数据探索(表函数探索、连接多个数据集、找出离群值、创建分组)

数据探索与分析:分离和聚焦数据、描述结论、书写报告文档

Pandas时间序列&金融数据处理

数据清洗实战案例:泰坦尼克幸存者数据清洗

数据清洗实战案例:USDA食品数据清洗

数据探索实例:为什么非洲童工雇佣的概率更高?腐败感和童工雇佣有什么关系?

数据探索实例:国外电商用户购买信息的数据处理与探索:通过购物篮商品信息探索出客户来源、流失、留存率、消费水平及消费倾向

12课时

Mysql数据库管理

Mysql数据库知识介绍

Mysql数据库的基本操作

Mysql数据表的基本操作

Mysql数据类型和约束条件

数据的CRUD操作之增加、删除、修改数据表

SQL数据库表连接

SQL数据库单表查询、多表查询

SQL操作符和函数

SQL综合案例:彩票数据核对练习

SQL综合案例:电商数据查询练习

线上8课时

机器学习算法

机器学习入门介绍:机器学习基本思想、常用算法分类、算法库等

Scikit-Learn入门介绍:特征矩阵、标签数组、评估器及常用函数

Scikit-Learn特征工程:分类特征、文本特征、图像特征、特征衍生、缺失值填充、特征管道

原理补充:常用相似度衡量方法、归一化方法、混淆矩阵及常用模型评估指标

KNN-最近邻分类器、KD-Tree和KNN回归

KNN算法示例:改进约会网站配对效果

梯度下降算法:梯度下降、随机梯度下降和微批梯度下降

原理补充:条件概率计算、全概率公式、K-S曲线、受试者特征曲线(ROC)等

贝叶斯分类器:朴素贝叶斯、贝叶斯网络

朴素贝叶斯算法示例:垃圾邮件过滤

原理补充:梯度下降算法,包括梯度下降、随机梯度下降和微批梯度下降

回归分析:线性回归、岭回归、LASSO和弹性网

回归分析算法示例:预测海洋生物鲍鱼的年龄

广义线性回归:Logistic回归和泊松回归

Logistic回归算法示例:构建信用卡反欺诈模型

树模型:C4.5、C5.0和CART树

树模型算法示例:红酒分类

SVM支持向量机分类和支持向量机回归

SVM算法示例:手写数字识别

集成算法之Bagging类算法:Bagging、随机森林等

集成算法之Boosting类算法:Boosting、GBDT梯度提升树、XgBoost等

集成算法示例:泰坦尼克号幸存者预测

神经网络算法:反向传播神经网路、卷积神经网络、LSTM等

聚类分析:K-means快速聚类、DBSCAN密度聚类、层次聚类等

关联规则:Apriori、FP-Growth、PrefixSpan等

无监督学习:LDA、LSI

数据降维方法:PCA主成分分析和SVD奇异值分解

Scikit-Learn常用功能介绍与使用:网格搜索、Pipline

大型综合案例:利用Pipline选择模型构建机器学习流,并利用网格搜索完成模型调优

36课时+40课时视频

电商案例

分析目标:

精准营销实现流量的增加;

实现产品生命周期管理;

帮助构建商业活动KPI检测体系;

实现品类管理与多位能力模型构建

基于国外大型电商用户购买信息数据的客户购买预测模型构建流程:

step1:数据的读取及定位需要清洗的数据

step2:模型有监督/无监督判断

step3:非结构数据处理(数据编码处理--非数字特征)

step4:数据量纲处理(归一化/标准化)

step5:数据挖掘--无监督学习(给数据打上标签)

step6:构建预测模型--有监督学习

step7:模型的评估与选择

step8:模型的优化与封装

6课时

金融案例

分析目标:

构建用户画像助力用户风险控制;

实现金融产品的生命周期管理,助力产品迭代;

构建中小微企业的贷款风险和偿债能力分析/信用卡评分/反欺诈预测系统,实现企业风险控制能力的稳步提升"

基于大型金融公司的客户贷款信息,构建用户信用评分卡模型的建模步骤:

step1:数据的读取及定位需要清洗的数据

step2:模型有监督/无监督判断

step3:非结构数据处理

step4:空值、重复数据、离群点处理

step4:数据量纲处理(归一化/标准化)

step6:构建评分卡模型/反欺诈预测模型

step7:模型的评估与选择

step8:模型的优化与封装

6课时

& 课程特色

& 师资团队

吴昊天 CDA Level 2 大数据分析师考试命题组组长

曾就职于电子科技大学大数据中心医疗卫生研究所,历任数据分析师、数据挖掘工程师、大数据架构师等职,多次参与并主导医保反欺诈领域和智慧诊疗相关算法设计、执行、优化等相关工作,拥有丰富的算法研发经验与多项算法专利。拥有丰富的数据类项目管理经验。

赵仁乾CDA数据分析研究院讲师/京邮电大学管理科学与工程硕士

现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。

李御玺台湾铭传大学教授/中华数据挖掘协会理事

台湾大学博士,在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。 其还兼任厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问。服务过的客户包括:中国工商局、中信银行、台新银行等。

& 精英服务


2 后学习计划:有价值的物质激励

1. 毕业后可总结分享自己的学习心得、技术干货、优秀作业、实操案例等内容,CDA研究院审核通过,可给予一定的奖金酬劳。

2. 精英学员毕业后CDA可以提供丰富的学员个人IP打造机会,给予包装与传播支持,帮助学员积累个人粉丝,打造个人名气。

3. 精英学员毕业后可参与CDA俱乐部线下活动,作为嘉宾分享;可加入CDA助教兼职团队;优秀精英学员可成为CDA兼职讲师,获取价值和物质激励。

4. CDA为即将毕业的精英学员提供就业咨询和推荐服务,并邀请行业大咖分享心里路程,协助学员进行技能提升的同时,时刻把握市场最新动态,为学员创造更多与市场、行业大咖连接的机会。

……

& 上课时间

2 开学典礼:2019年61

2 学习时间:3个月周期,线下周末培训8周,共16天,每天9:00-16:30,线上自由学习4周。

2 学习形式:可参与面授班 or 远程直播班。现场面授及远程直播班时间相同。

& 学习费用

面授班价格:12800元

远程班价格:9800元

& 咨询顾问

王老师

电话:4000-51-9191

微信:13121318867


Amber21- 2019-05-16 23:47

培训时间 。 回复(0)
回复 Amber21- 数学公式

提交

提交

课程订阅

讲师介绍


Peixun.net

Python数据分析集训班

请认真填写以下信息,方便为您服务
  • 姓名:
  • 电话:
  • 邮箱:
  • 备注:
  • 邀请码:
  • 您还可以选择 登录 或者 注册 更方便您管理课程。

Peixun.net

您关于:

Python数据分析集训班

的报名信息已经提交成功。

去购物车结算
您可以选择 登录 或者 注册 更方便您管理课程。
回头再说

邮件已发送!

已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码

有待解答的问题

3 名学员对您的课程提问,需要您作出回答。 现在就去