返回详情页
章节
问答
第一阶段:大数据平台基础
1.大数据生态环境及应用场景
2.Linux基础操作
3.Hadoop2.X集群部署
4.HDFS分布式文件系统介绍及功能
5.Yarn及MapReduce架构及工作原理
第二阶段:数据库应用
1.常用数据库的介绍及区别
2.数据库设计、ER图
3.数据库管理(用户权限、数据库创建等)
4.表的管理(表的创建、外键、修改等)
5.表的更新
6.表的查询
7.索引 视图
第三阶段:大数据仓库
1.数据仓库概念,Hive数据类型
2.HiveQL数据库及表管理
3.HiveQL数据查询、函数(聚合函数、窗口函数、UDF)
4.HiveQL视图
5.HiveQL索引
6.Hbase表设计及数据查询
7.Sqoop数据传递及综合案例
第四阶段:统计学基础
1.描述型统计分析
2.抽样估计
3.方差分析
4.相关分析
5.列联分析
6.主成分分析
7.SPSS基本操作
第五阶段:Python机器学习
1.Python介绍及基础语法
2.NumPy和Pandas
3.数据可视化Matplotlib
4.Python常用算法
5.特征工程
6.Python推荐系统介绍
7.文本挖掘
8.Pyspark应用
第六阶段:大数据平台分析工具Spark
1.Scala编程基础
2.Spark介绍、原理
3.RDD详解
4.Spark SQL(查询、函数)
5.Spark MLlib机器学习(聚类、分类、推荐、文本挖掘)
6.Spark GraphX
第七阶段:可视化工具Tableau及报告撰写
1.Tableau介绍
2.Tableau基础操作
3.Tableau字段处理
4.Tableau故事
第八阶段:大数据综合案例
1.高速公路大数据项目实战
2.互联网金融监管项目实战
3.电力大数据项目实战
4.大数据分析项目答辩
发表
CDA大数据分析就业班-现场