经济30年快速发展,正在亲临数据时代的特征。随着企业级数据的累积,相应的使现代统计软件分析过程也发生变化,由传统基本的数据挖掘技术,渐渐趋向于数据库技术应用。与此同时各家软件相应推出应对策略,像SAS、SPSS、STATA等大型统计软件,相序推出多线程、分布式等数据处理技术,这对于企业日益庞大的数据现状来说,无疑在一定程度上缓解了大数据处理的压力。
至SPSS20.0以后,在海量数据分析方面有了显著改善,同时SPSS兼备数据管理、数据库访问等技术,可以将整个数据分析的相关过程整合到一个统一的技术平台上。
本次课程使用SPSS21.0系统用于演示。
下面主要从数据管理、数据预处理、统计分析、结果输出几个方面来介绍SPSS软件的基本应用。
目录:
1. SPSS软件介绍
1.1 课程介绍
1.2 了解SPSS软件
1.3 SPSS的安装与基本使用
1.4 软件界面详解
1.5 SPSS软件初探:数据分析实例
2. 数据文件的管理
2.1 怎样生成和导入数据
2.2 定义变量属性
2.3 多个数据文件的合并
2.4 数据文件的拆分
2.5 数据的重组与转置
2.6 数据的分类汇总
2.7 侦察异常值
3. 数据预处理
3.1 选择个案
3.2 个案排秩
3.3 加权个案
3.4 计算变量过程
3.5 数据的重新编码
3.6 数据的自动编码
3.7 连续变量的可视离散化
3.8 指定数值的查找与计数
3.9 SPSS表达式与函数
3.10描述缺失值类型及其填补
4. 描述统计功能
4.1 频率分析
4.2 探索性分析
4.3 正态性检验的P-P图与Q-Q图
5. 交互式功能的图形展示
5.1 散点图:呈现变量间关联程度
5.2 直方图:观察连续数据分布的“形状”
5.3 箱体图:度量数据离散性
5.4 饼图:描述类别比例
5.5 茎叶图:描述数据形状、频数与异常值
5.6 条图:观察离散数据分布的“形状”
5.7 误差图:显示数据的可信区间
5.8 线图:追踪事物变化的趋势
5.9 面积图:线图下的面积区块
5.10点图:描述变量的分布与趋势特征
5.11垂线图:显示类别间信息的变化程度
5.12控制图:侦察事物变化的波动性
5.13Pareto图:描述事物的主要特征
5.14其他统计图(ROC曲线、P-P图与Q-Q图)
6. 变量之间的关系:数据分析
6.1 t检验
6.2 方差分析
6.3 卡方分析
6.4 相关分析
6.5 简单线性回归分析
6.6 多元线性回归分析
7. 统计报表过程
7.1 统计表入门
7.2 制作统计报表
7.3 统计报表编辑及其模板技术
7.4 统计报表的数据处理技术标准及其注意事项