描述性统计:通过计算平均值、中位数、众数、方差等统计量,对数据集的基本特征进行描述,帮助人们了解数据集的集中趋势和离散程度。
推断性统计:基于抽样数据进行统计推断,包括参数估计、假设检验等方法。参数估计是通过对样本数据的统计量来估计总体参数;假设检验则是通过检验样本统计量与总体参数之间的差异,以判断原假设是否成立。
回归分析:研究自变量与因变量之间关系的方法,包括线性回归、多元回归、逻辑回归等。通过回归分析,可以建立自变量与因变量之间的数学模型,用于预测和解释。
聚类分析:将数据划分为若干个类别的方法,通过计算数据之间的相似性,找出相似的数据点并将其归为一类。聚类分析可以帮助人们发现数据中的潜在规律和结构。
分类与预测:通过建立分类模型,对数据进行分类和预测。常用的分类方法包括决策树、支持向量机、朴素贝叶斯等。
时间序列分析:研究时间序列数据的方法,包括平稳性检验、自相关函数和偏自相关函数的分析、时间序列模型建立与预测等。
实验设计:研究如何有效地设计实验,以获得可靠的数据和结论。实验设计包括选择合适的实验组和对照组、确定实验因素和水平、分配实验对象等。
数据可视化:通过绘制统计图表,将数据以图形的形式展示出来,帮助人们更容易地发现数据中的规律和趋势。