三、MapReduce工作原理
12-15-1 mapreduce原理-1
12-15-2 mapreduce原理-2
12-15-3 mapreduce原理-3
12-15-4 mapreduce原理-4
12-15-5 mapreduce原理-5
12-16-1 mapreduce编程-1
12-16-2 mapreduce编程-2
12-16-3 mapreduce编程-3
12-16-4 mapreduce编程-4
12-16-5 mapreduce编程-5
12-18-1 hive背景介绍\部署-1
12-18-2 hive背景介绍\部署-2
12-18-3 hive背景介绍\部署-3
12-18-4 hive背景介绍\部署-4
12-19-1 hive建表回顾
12-19-2 hive分区表、排序
12-19-3 hive基本此操作(聚合、排序等)
12-19-4 上午知识总结、练习
12-20-1 hive解析
12-20-2 分区表与分桶表的区别
12-20-3 分桶操作及mapreduce设置
12-20-4 数据倾斜及解决方案
12-20-5 笔试题
12-21-1 hive聚合函数
12-21-2 hive窗口函数一
12-21-3 hive窗口函数二
12-21-4 hive与hbase的集成一
12-21-5 hive与hbase的集成二
12-22-1 sqoop概述、原理
12-22-2 sqoop导入hdfs
12-22-3 sqoop导入hive
12-22-4 sqoop job的使用
12-23-1 hbase概述
12-23-2 hbase数据模型
12-23-3 RegionServer工作原理
12-23-4 Hbase常用JavaAPI
12-28-1 Scala环境配置
12-28-2 操作符重载
12-28-3 循环
12-28-4 break 和continue相关功能在Scala中的使用
12-28-5 异常处理
12-28-6 多维数组
12-28-7 元组
12-29-1 作业讲解
12-29-2 Scala类
12-29-3 属性set与get,this修饰符
12-29-4 构造器
12-29-5 单例对象
12-29-6 枚举
12-30-1 作业题讲解一
12-30-2 作业题讲解二
12-30-3 字符串操作
12-30-4 特质
12-30-5 运算符
12-30-6 列表
12-31-1 scala 高阶函数一
12-31-2 scala 高阶函数二
12-31-3 匿名函数
12-31-4 视图界定
12-31-5 单例类型
12-31-6 Scala总结
四、Spark
1-3-1 spark概述、运行模式
1-3-2 spark安装配置、词频统计
1-3-3 初识RDD、sparkCore算子操作一
1-3-4 sparkCore算子操作二
1-3-5 spark idea环境配置
1-4-1 sparkcore排序案例
1-4-2 sparkcore均值案例、分区
1-4-3 sparkcore topN 、二次排序案例
1-4-4 RDD操作
1-5-1 共享变量
1-5-2 pv/uv案例
1-5-3 sparkSQL概述
1-5-4 dataframe 、dataset创建
1-6-1 sparkSQL操作hive数据源
1-6-2 yarn模式运行spark作业
1-6-3 pv/uv案例一
1-6-4 pv/uv案例二
1-7-1 电商日志分析一
1-7-2 电商日志分析二
1-7-3 sparkStreaming原理介绍
1-7-4 sparkStreaming-socket数据源
1-8-1 kafka数据源
1-8-2 kafka-Receiver
1-8-3 窗口函数
1-8-4 总结梳理
1-12-1 sparkGraphX概述
1-12-2 创建图、获取图属性、属性转换
1-12-3 图的连接操作、聚合操作
1-12-4 社交网络数据分析案例一
1-13-1 航班数据案例一
1-13-2 航班数据案例二
1-13-3 亚马逊产品联合购买网络案例
1-13-4 航班数据案例三
1-14-1 机器学习介绍
1-14-2 spark机器学习库介绍,pipline介绍
1-14-3 管道的具体使用代码
1-14-4 电影推荐系统
1-15-1 回归方法 二手房价格预测
1-15-2 朴素贝叶斯 鸢尾花多分类
1-15-3 SQL中的正则