Peixun.net > 现场班 > 统计软件 > Python数据分析与机器学习

Python数据分析与机器学习

课时:0 | 89人学习 分享 收藏
通过对数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,使初学者快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架,为提升工作中的数据分析能力打下良好的基础。

上课信息

上课时间: 2017年11月4-7日 (四天)
上午9:00-12:00,下午1:30-4:30,答疑4:30-5:00

上课地点: 北京市海淀区厂洼街3号丹龙大厦附近

Python数据分析与机器学习

第1天: Python 基础精要(初中级别, 整个课程的基础)

一,Python数据分析基础

1、 python语法初步:主要是代码编写规范,变量的、标识符的学习,注释的一些说明。

1) 变量要求,容易出错的命名方式。

2) 代码的规范要求。

3) 代码的注释操作和注释文档

4) 变量的赋值和Python 脚本文件的编码要求。

2、 python数字和内置对象

1) python的交互式操作.raw_input与input的区别

2) python内置对象:

type,cmp,repr,str,isinstance,xrange,None与NULL等

3) 数字与字符的计算和逻辑运算,及数字精度的注意事项。

3、 python元组

1) 元组的特性

2) 元组的初始化、删除、增加、修改、替换

3) 元组的切片及相关的内建函数

4、 python列表和字符串

1) 列表与字符串的特性

2) 列表与字符串的初始化、删除、增加、修改、替换

3) 字符的格式化操作

4) 列表与字符的切片操作及相关的内建函数

5) 特殊的字符及字符的编码与解码

5、 python集合与字典

1) 字典的特性

2) 字典的初始化、删除、增加、修改、替换

3) 映射类型的操作及相关的内建函数

6、 python语法:条件和循环

1) 条件分支语句的用法及注意事项

2) While循环语句的用法

3) For语句,range与xrange函数的用法

4) Break与continue,pass、else的运用

5) 迭代器与iter函数

7、 文件操作

1) File和open函数及其参数的学习

2) 文件目录操作

3) 文件内容的操作

8、 错误和异常的处理

1) 错误与异常的区别

2) Try-except-finally语法讲解

3) 断言,触发异常

4) 常用的异常,及自定义异常

9、 模块、包

1) 搜索路径及命名空间

2) import与from-import语法

3) 包的讲解

10、函 数

1) 函数的讲解

2) 函数参数

3) 函数编程:lambda,匿名函数

4) 内建函数apply,filter,map,reduce

5) 变量作用域:globa,闭包,命名空间

6) 递归

7) 生成器

11、面向对象编程

1) 类的定义、属性和实例化

2) 类的组合、继承

3) 类的方法调用和修饰符

4) 类的内建函数

二、 Python进阶:

1、 python中链表、栈的实现和操作。

2、 python中二叉树的实现和操作。

3、 python中简单排序算法、快速排序和归并排序的实现和操作。

三、 正则表达式

1、 正则表达式使用的字符讲解

2、 正则表达式的应用:匹配模式,编译形式,分割和替换

3、 Re模块的讲解

四、Python应用:

1) 模拟实现ATM机取钱

2) 冒泡算法和二分查找

3) 模拟海关

4) 蒙特洛模拟

第2天: 使用numpy、pandas等进行数据清洗和整理,充分统计分析数据(数据分析和挖掘前最重要的工作,直接决定了建模分析的质量,往往也是最耗时的工作)

一、Numpy基础:

1、 Numpy语法初步:主要是认识和掌握Numpy的基本语法和操作

1) Numpy的数组

2) Numpy的数组的索引和切片操作

3) Numpy的通用函数

4) Numpy的数据处理

5) Numpy的对文件的操作

2、 Numpy实例

通过模拟随机漫步来说明如何运用数组运算,让学员深刻认识Numpy。

二、Pandas基础:

1、 Pandas基础知识

1) Pandas的数据结构series和DataFrame

2) Pandas的索引、选取和过虑。

3) Pandas的排序和汇总统计

4) Pandas处理缺失的数据

2、 Pandas数据的规整化

1) Pandas合并、清理数据集。

2) Pandas连接数据集。

3) Pandas移除重复、值替换和映射转换数据集。

4) 检测及过虑异常值。

5) 排列和随机采样。

6) Pandas的字符串操作。

3、 Pandas数据的聚合与分组

1) Pandas的对数据分组操作。

2) Pandas的对数据聚合操作。

3) Pandas的交叉和透视表的应用。

4、 Pandas对时间序列的处理

1) Pandas的时间序列基础。

2) Pandas的时间序列初始化和偏移运算。

3) Pandas的时间频率处理及日期的移动。

4) Pandas重采样

5、 Pandas数据加载与存储

1) 读写文本格式的数据。

2) Pandas使用json数据。

3) Pandas读写数据库。

6、 Pandas的案例实操作

1) 大学考试成绩统计数据分析。

2) Python就业数据分析。

3) 电影市场的分析。

4) 股票的交易分析。

5) 智慧水务的水质数据分析。

6) 上市公司的财务分析

第3天和第4天:Python机器学习算法和数据挖掘案例精要(根据学员在工作中遇到的各种经典的机器学习算法和实际常见案例进行分析,帮助大家快速上手、学以致用)

目标:

1. 掌握机器学习分类的各种方法(决策树、朴素贝叶斯、随机森林、支持向量机、神经网络等)和经典案例

2. 掌握文本分类实际案例

3. 掌握推荐系统的机器学习

4. 选择正确的方法和模型

5. 掌握特征选择和特征工程

项目:

1. 垃圾短信或邮件的识别与分类(Logistic回归)

2. 使用随机森林进行预测

3. 图像识别和预测的方法和应用

4. 利用朴素贝叶斯进行文本分类(含算法和TF-IDF策略)

5. kaggle神器XGBoost 应用案例

6. Titanic灾难事件的机器学习各种算法分析比较

7. iris数据集机器学习分类方法的比较

8. 推荐系统构建方法

9. 网页广告图片屏蔽器

10. 支持向量机算法原理和应用场景

11. 客户画像和精准营销

12. 网站文本挖掘

13. 手写识别

14. 最近邻(kNN)算法及其案例

15. 使用PCA方法进行降维

16. k-means聚类等应用实例

17. 购物篮分析

18. Python机器学习量化投资实例


报名时间 2017-09-22 00:00 至 2017-11-04 00:00
培训时间 2017年11月4-7日 (四天)
培训地点 北京市海淀区厂洼街3号丹龙大厦附近
培训费用 4200元 / 3600元 (仅限全日制本科生及硕士研究生优惠价)
授课安排 上午9:00-12:00,下午1:30-4:30,答疑4:30-5:00


Python数据分析与机器学习

——思想、方法和应用案例

一、培训目的:

通过对数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,使学员快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架,为提升工作中的数据分析能力打下良好的基础。


二、目标人群:

1.急需入门数据挖掘和建模,想使用Python从事数据分析有关工作;即将或已经在数据分析或机器学习岗位工作的人;

2.想在实际数据分析工作中进一步提升技能,短时间内获取数据分析和挖掘工作经验的人。


三、培训特色:

1.全程没有艰深的公式,几乎全部以实际案例带动启发理解,以通俗易懂的语言讲清楚深刻的数据分析和机器学习算法思想,随时互动、答疑解惑;

2.注重学以致用、注重应用场景再现。抓住工作中经典的数据分析模型和案例加以剖析,使得学员在实际工作中很快能上手进行实际问题的解决;

3.注重实际工作经验分享,让学员在工作学习中少走弯路,以培养兴趣为引导、以阐明基本原理思想为基础,让学员掌握数据分析工作中的关键环节和技术。


四、培训软件及资料:

自带安装好anaconda的笔记本电脑,具体安装方式开课前发。课件也将提前发送。


五、讲师介绍:

Gino早年获得名校数学与计算机专业学士和统计学专业硕士,近20年来一直进行着数据分析的理论和实践,数学、统计和计算机功底强悍。为人低调谦和,讲课富于激情和感染力。

   他在高校担任过数学、计算机和统计学老师,也曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,在实践中攻克统计建模和数据分析难题无数,数据处理与分析科学精准,在实际应用中取得良好的预期效果。

他至今培训了来自高校、研究所、国外和各行各业的上千名学员,每一次培训都好评如潮。来自学术和业界的学员均在培训中受益颇多。

Bob早年计算机专业科班出身,功底深厚,较早的认识Python的价值和强大的功能,多年来一直使用Python进行数据分析的工作,并且使用Python开发多个数据挖掘及信息系统的项目,积累了丰富的经验。也是国内较早的进行Python培训的讲师之一,在湖广等地帮助很多人通过掌握Python找到了满意的工作。培训中讲解的案例实用,全部来自开发实际,含金量高,以前学员认识到其价值后强烈要求加课进一步学习。


六、课程大纲

(内容超过4天课时,上课时内容和难度可能会根据学员的实际情况有所调整,添加深度学习内容,原则是根据学员的特点、需求讲授最需要的):


第1天: Python 基础精要(初中级别, 整个课程的基础)

一,Python数据分析基础

1、Python语法初步:主要是代码编写规范,变量的、标识符的学习,注释的一些说明。

 1)  变量要求,容易出错的命名方式。

 2)  代码的规范要求。

 3)  代码的注释操作和注释文档

 4)  变量的赋值和Python 脚本文件的编码要求。

2、Python数字和内置对象

 1)  python的交互式操作.raw_input与input的区别

 2)  python内置对象: type,cmp,repr,str,isinstance,xrange,None与NULL等

 3)  数字与字符的计算和逻辑运算,及数字精度的注意事项。

3、Python元组

 1)  元组的特性

 2)  元组的初始化、删除、增加、修改、替换

 3)  元组的切片及相关的内建函数

4、Python列表和字符串

 1)  列表与字符串的特性

 2)  列表与字符串的初始化、删除、增加、修改、替换

 3)  字符的格式化操作

 4)  列表与字符的切片操作及相关的内建函数

 5)  特殊的字符及字符的编码与解码

5、Python集合与字典

 1)  字典的特性

 2)  字典的初始化、删除、增加、修改、替换

 3)  映射类型的操作及相关的内建函数

6、Python语法:条件和循环

 1)  条件分支语句的用法及注意事项

 2)  While循环语句的用法

 3)  For语句,range与xrange函数的用法

 4)  Break与continue,pass、else的运用

 5)  迭代器与iter函数

7、文件操作

 1)  File和open函数及其参数的学习

 2)  文件目录操作

 3)  文件内容的操作

8、错误和异常的处理

 1)  错误与异常的区别

 2)  Try-except-finally语法讲解

 3)  断言,触发异常

 4)  常用的异常,及自定义异常

9、模块、包

 1)  搜索路径及命名空间

 2)  import与from-import语法

 3)  包的讲解

10、函数

 1)  函数的讲解

 2)  函数参数

 3)  函数编程:lambda,匿名函数

 4)  内建函数apply,filter,map,reduce

 5)  变量作用域:globa,闭包,命名空间

 6)  递归

 7)  生成器

11、面向对象编程

 1)  类的定义、属性和实例化

 2)  类的组合、继承

 3)  类的方法调用和修饰符

 4)  类的内建函数


二、Python进阶:

1、 Python中链表、栈的实现和操作

2、 Python中二叉树的实现和操作

3、 Python中简单排序算法、快速排序和归并排序的实现和操作


三、正则表达式

1、 正则表达式使用的字符讲解

2、 正则表达式的应用:匹配模式,编译形式,分割和替换

3、 Re模块的讲解


四、Python应用:

1)  模拟实现ATM机取钱

2)  冒泡算法和二分查找

3)  模拟海关

4)  蒙特洛模拟


第2天: 使用numpy、pandas等进行数据清洗和整理,充分统计分析数据(数据分析和挖掘前最重要的工作,直接决定了建模分析的质量,往往也是最耗时的工作)

一、Numpy基础:

1、Numpy语法初步:主要是认识和掌握Numpy的基本语法和操作

 1)  Numpy的数组

 2)  Numpy的数组的索引和切片操作

 3)  Numpy的通用函数

 4)  Numpy的数据处理

 5)  Numpy的对文件的操作

2、Numpy实例

 通过模拟随机漫步来说明如何运用数组运算,让学员深刻认识Numpy


二、Pandas基础:

1、Pandas基础知识

 1)  Pandas的数据结构series和DataFrame

 2)  Pandas的索引、选取和过虑。

 3)  Pandas的排序和汇总统计

 4)  Pandas处理缺失的数据

2、Pandas数据的规整化

 1)  Pandas合并、清理数据集

 2)  Pandas连接数据集

 3)  Pandas移除重复、值替换和映射转换数据集

 4)  检测及过虑异常值

 5)  排列和随机采样

 6)  Pandas的字符串操作

3、Pandas数据的聚合与分组

 1)  Pandas的对数据分组操作

 2)  Pandas的对数据聚合操作

 3)  Pandas的交叉和透视表的应用

4、Pandas对时间序列的处理

 1)  Pandas的时间序列基础

 2)  Pandas的时间序列初始化和偏移运算

 3)  Pandas的时间频率处理及日期的移动

 4)  Pandas重采样

5、Pandas数据加载与存储

 1)  读写文本格式的数据

 2)  Pandas使用json数据

 3)  Pandas读写数据库

6、Pandas的案例实操作

 1)  大学考试成绩统计数据分析

 2)  Python就业数据分析

 3)  电影市场的分析

 4)  股票的交易分析

 5)  智慧水务的水质数据分析

 6)  上市公司的财务分析


第3天和第4天:Python机器学习算法和数据挖掘案例精要(根据学员在工作中遇到的各种经典的机器学习算法和实际常见案例进行分析,帮助大家快速上手、学以致用)

目标:

1. 掌握机器学习分类的各种方法(决策树、朴素贝叶斯、随机森林、支持向量机、神经网络等)和经典案例

2. 掌握文本分类实际案例

3. 掌握推荐系统的机器学习

4. 选择正确的方法和模型

5. 掌握特征选择和特征工程


项目:

1. 垃圾短信或邮件的识别与分类(Logistic回归)

2. 使用随机森林进行预测

3. 图像识别和预测的方法和应用

4. 利用朴素贝叶斯进行文本分类(含算法和TF-IDF策略)

5. kaggle神器XGBoost 应用案例

6. Titanic灾难事件的机器学习各种算法分析比较

7. iris数据集机器学习分类方法的比较

8. 推荐系统构建方法

9. 网页广告图片屏蔽器

10. 支持向量机算法原理和应用场景

11. 客户画像和精准营销

12. 网站文本挖掘

13. 手写识别

14. 最近邻(kNN)算法及其案例

15. 使用PCA方法进行降维

16. k-means聚类等应用实例

17. 购物篮分析

18. Python机器学习量化投资实例


课程优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠不叠加。


联系方式:

魏老师

QQ:28819897142881989714

Tel:010-68478566

Mail:vip@pinggu.org

课程订阅

讲师介绍

Bob


Peixun.net

Python数据分析与机器学习

请认真填写以下信息,方便为您服务
  • 姓名:
  • 电话:
  • 邮箱:
  • 备注:
  • 邀请码:
  • 您还可以选择 登录 或者 注册 更方便您管理课程。

Peixun.net

您关于:

Python数据分析与机器学习

的报名信息已经提交成功。

去购物车结算
您可以选择 登录 或者 注册 更方便您管理课程。
回头再说

邮件已发送!

已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码

有待解答的问题

3 名学员对您的课程提问,需要您作出回答。 现在就去