Peixun.net > 直播 > CDA数据分析师 > 『远程』大数据分析周末班--北京-第15期

『远程』大数据分析周末班--北京-第15期

课时:35 分钟| 130人学习 分享 收藏
以大数据分析师为目标,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。

『远程』大数据分析周末班--北京-第15期

CDA2级大数据分析师,免费试听

1.CDA大数据分析师职业发展路径立即播放

第一章 大数据环境搭建

1.Linux入门基础

2.Hadoop入门介绍

3.Hadoop单机环境搭建

4.Hadoop伪分布式集群搭建

5.Hadoop完全分布式集群搭建

第二章 Hadoop核心组件使用方法

1.分布式文件系统HDFS架构原理及常用指令

2.HDFS编程入门

3.分布式数据库Hbase架构原理及常用指令

4.Hbase编程入门

5.分布式数据仓库Hive架构原理及HQL语法介绍

6.分布式计算引擎MapReduce架构原理及基本使用方法

7.资源调度器YARN基本原理

8.ETL工具Sqoop使用方法

第三章 分布式计算引擎Spark入门

1.Scala语法介绍

2.Spark架构特点及基本原理

3.Spark入门及安装部署方法

4.Spark Core介绍

5.Spark SQL介绍与数据读取、保存方法

6.Spark GraphX入门及基本使用方法

7.Spark GraphX图计算算法案例

第四章 Spark核心组件使用方法

1.日志采集系统Flume和分布式消息队列Kafka入门

2.流式计算框架Spark Streaming基本原理及使用方法

3.流式计算框架Structured Streaming基本原理及使用方法

4.分布式算法库Spark MlLib入门介绍

5.Spark ML与Spark MLLib

6.机器学习工作流

第五章 Python编程基础与数据清洗(线上)

1.Python编程基础:基本数据结构

2.Python编程基础:常用控制语句

3.NumPy基本数据结构和常用操作

4.Pandas基本数据结构和常用操作

5.Python数据清洗案例

第六章 统计学基础(线上)

1.描述性统计

2.常用统计量的解释与使用

3.抽样方法

4.假设检验

5.参数估计

6.方差分析

第七章 PySpark基础

1.Spark数据结构及编程语言接口

2.PySpark开发环境搭建

3.PySpark编程入门:Spark基本数据结构

4.PySpark编程入门:PySpark常用语句

5.Spark与分布式数据库和分布式数据仓库的集成方法

6.采用PySpark读取分布式数据库中数据

7.PySpark数据清洗案例

第八章 PySpark机器学习(线上)

1.机器学习入门

2.PySpark基于Spark ML的特征抽取、转化和选择方法

3.最近邻分类器KNN基本原理及ML实现

4.聚类分析基本原理

5.K-Means快速聚类基本原理

6.K-Means快速聚类的Spark ML实现方法

7.高斯混合模型(GMM)聚类算法的Spark实现

第九章 PySpark机器学习(二)

1.Spark MLLib统计分析

2.线性回归基本原理

3.线性回归的Spark ML实现方法

4.对数几率分布于Sigmoild函数

5.逻辑回归基本原理

6.逻辑回归的Spark ML实现方法

第十章 PySpark机器学习(三)

1.决策树模型的基本原理

2.决策树的Spark ML实现方法

3.随机森林基本原理

4.随机森林的Spark ML实现方法

5.关联规则算法入门:Apriori算法基本原理

6.利用FP-Growth挖掘关联规则

7.FP-Growth算法的Spark ML实现方法

8.带时序关系的关联规则挖掘算法Pre-FixSpan基本原理

9.Pre-FixSpan的Spark ML实现方法

第十一章 PySpark机器学习(四)

1.协同过滤在Spark ML中的实现方法

2.Spark机器学习流构建方法

3.Spark机器学习模型超参数调优方法

4.Spark机器学习模型自动选择方法

5.PySpark案例

第十二章 期末答辩


      当下,上至国家总理,下及普通老百姓,大家都在关注大数据,尤其是国务院《关于印发促进大数据发展行动纲要的通知》发布,大数据已上升为国家战略,数据驱动的大数据时代到来了,你准备好了吗?


      Hadoop+Hive+Mahout+Spark,大数据分析利器全覆盖,CDA 大数据认证,offer任你挑!


      相信你看过一些大数据相关书籍,原理知识都能理解,可是怎么应用于工作中呢?大数据分析环境怎么搭建?如果进行大数据分析?其实只要有人手把手传授你,CDA大数据周末班带你跨入大数据分析门槛,其实没你想象那么难。


《CDA-Hadoop大数据分析师》第12期


| 课程介绍 |



    课程以大数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。


     Hadoop大数据分析课程给你的就是 把握时代脉博,掌握大数据时代前沿;全面掌握Hadoop的架构原理和使用场景;全面掌握Hadoop的三种架构方式及搭建过程;熟练掌握HDFS文件系统与MapReduce程序开发思想; 能利用hadoop平台进行大数据分析;能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。


大数据试听视频http://www.peixun.net/view/826.html


大数据环境配置干货:http://www.tudou.com/programs/view/CS3KvXCXRik/


| 学员对象 |



1.   大数据分析,数据挖掘兴趣爱好者及转行人士

2.   职位晋升、薪酬提高人士

3.   在校数学,经济,计算机,统计等专业教师和学生

4.   各大数据项目负责人及其团队人士

| 报名流程 |



      1.在线填写报名信息

      2.给予反馈,确认报名信息

      3.网上缴费

      4.开课前一周发送电子版课件和教室路线图


 CDA 大数据分析交流QQ群 368178559


| 师资团队 |




     谢邦昌;台湾大学生物统计学博士,台湾著名大学天主教辅仁大学统计信息学系教授。现任中华数据挖掘协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。中国人民大学统计学系Data Mining中心客座教授,上海财经大学统计学系客座教授。厦门大学计划统计学系客座教授。西南财经大学客座教授。他是数据挖掘界领军人物及世界知名统计学家。发表过近三百篇关于统计和数据挖掘的论文。出版了近五十余本相关专著。拥有大数据分析多年行业经验。


        曹正凤;北京大数据协会理事,首发集团智慧交通大数据中心筹备组负责人,经管之家(原人大经济论坛)大数据培训中心负责人,统计学专业博士,具有多年的JAVA程序设计和统计教学经验,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文,且发表的EI核心收录论文受到多次检索。目前致力于大数据分析前沿领域研究,主持经管之家大数据项目《基于hadoop架构的论坛主题推荐系统》,主持全国统计科学研究项目《基于大数据平台的我国宏观经济走势预测》,研究参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目。


      辛立伟 ;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。目前专注于Java EE6、Java富互联网应用程序、Android 3G软件的研发、相关技术培训和企业咨询等。多次参与大数据分析课程教学。



      张田圆;软通动力信息技术(集团)有限公司助理副总裁、智慧业务事业群 CTO。分管技术领域:云计算、大数据、大规模并发系统、智慧城市及众创空间等。2008年主导设计海信集团IPTV互动电视系统及智能电视系统的研发,采用大规模分布式系统的原理支撑一千多万台海信智能电视终端。2010年和中科曙光合作,建设无锡市城市云数据中心,负责云存储中心的建设和云存储产品的研发,实现大规模数据和存储、处理及在线迁移、分级存储等,为城市云计算中心提供云存储基础服务。2012年主导实施甘肃省政府建设西北政企云、陕西北斗云、山东省齐鲁兴业云,和北京市计算中心、天津超算中心、河南工业云、山东工业云等都有很好的合作。2014年至今主导实施山西省移动大数据平台、浙江省绍兴市智慧交通大数据平台和无锡城市大数据中心建设,并与北大合作建立大数据创新研究院。
 

     董轶群;计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方向为智能规划、空间推理、基于大数据的时空信息系统。多年来从事计算机相关领域的研究,曾参与多个国家自然科学基金面上项目、重大项目等纵向课题的研究工作,并在国内外权威期刊与重要会议上发表了多篇理论成果。


     王安;钱方银通科技有限公司,首席分析师。中国科学技术大学理论力学学士,中国科学院计算力学硕士,北京大学光华管理学院MBA。此前曾带领团队为多家大中型银行,保险公司提供风险管理,数据分析咨询服务,关注领域包括,定量化风险管理,互联网金融,大数据应用。


| 其他服务 |



      1.讲义、数据等全套资料

      2.赠送全套同步课程视频

      3.课前预习视频和资料

      4.助教全方位答疑服务

      5.赠送论坛币1000枚

      6.课程答疑

      7.线下交流活动

      8.咖啡茶歇,论坛币(1000个)

      关于重听:在参加本期之后的后续三期可以(并且只能)选择一期免费来听。


| 在线咨询 |




 


      工作时间:周一至周五 8:30-18:00 其他时间请致电手机。

      座机:010-68411404

      手机:18010006628

      陈老师



startyxf 2016-05-12 18:26

这个好贵啊

课程订阅

资料下载

讲师介绍


Peixun.net

『远程』大数据分析周末班--北京-第15期

请认真填写以下信息,方便为您服务
  • 姓名:
  • 电话:
  • 邮箱:
  • 备注:
  • 邀请码:
  • 您还可以选择 登录 或者 注册 更方便您管理课程。

Peixun.net

您关于:

『远程』大数据分析周末班--北京-第15期

的报名信息已经提交成功。

去购物车结算
您可以选择 登录 或者 注册 更方便您管理课程。
回头再说

邮件已发送!

已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码

有待解答的问题

3 名学员对您的课程提问,需要您作出回答。 现在就去