一、描述统计方法
集中趋势分析 平均数、中位数、众数
适用场景:描述数据中心位置
离散程度分析
标准差、方差、极差
适用场景:衡量数据波动范围
分布形态分析
峰度、偏度、偏态分布
适用场景:判断数据分布特征
二、差异关系研究方法
相关分析
单相关(两个变量)、复相关(多个变量)
适用场景:探究变量间线性关系
回归分析
线性回归、逻辑回归
适用场景:预测变量值或分类
方差分析(ANOVA)
定类数据与定量数据差异分析
适用场景:比较多组均值差异
t检验
两组定量数据差异检验
适用场景:小样本均值比较
卡方检验
定类数据关联性分析
适用场景:独立性检验(如性别与购买行为)
三、信息浓缩与降维方法
主成分分析(PCA)
通过正交变换减少变量维度
适用场景:数据冗余消除与特征提取
因子分析
提取变量共性因子
适用场景:简化多变量模型
四、探索性数据分析方法
聚类分析
自动将数据分组为相似类别
适用场景:市场细分、异常值检测
因子分析(社会科学研究)
基于相关矩阵提取潜在因子
适用场景:社会学变量结构分析
五、其他常用方法
逻辑树分析法
拆解复杂问题为子问题
适用场景:问题根源分析(如用户行为路径)
PEST分析法
宏观环境因素分析(政治、经济、社会、技术)
适用场景:行业战略规划
多维度拆解法
按维度(如用户特征、业务流程)分析数据
适用场景:用户行为深度挖掘
六、数据可视化方法
图表类型: 柱状图、折线图、散点图、雷达图等 工具
适用场景:直观展示数据趋势、分布及关系
以上方法可根据具体问题选择组合使用,例如先用描述统计了解数据基础,再通过相关性分析和回归模型挖掘关系,最后用聚类分析进行细分。