首先了解基本统计知识(大约5分钟),接着选择正确的研究方法进行结果解读;与此同时,了解一些问卷研究的思路使得研究更加顺手。与此同时,掌握一些数据清理的技能更好,比如对异常数据处理。
比如性别/专业等为定类数据,那么基本情况分析部分,直接使用频数分析即可;
如果数据中有量表态度题,那么基本情况分析时,可计算量表题的平均值,了解样本的平均态度情况;
进一步想深入分析差异关系,如果是定类和定类关系,比如‘性别’和‘是否吸烟’的关系,那么可使用交叉(卡方)分析;如果是定类和定量关系,比如‘性别’和‘身高’的关系,那么可使用方差分析;
进一步想深入分析影响关系,即X对于Y的影响,如果Y是定量数据(比如身高),那么可使用线性回归。如果说Y是定类数据(比如是否愿意购买电影票,购买哪种类型的电影票),那么就需要使用Logit回归分析,比如Y为是否愿意(yes和no两项),那么就使用二元Logit回归,如果是多个类别(比如购买‘爱情类’,‘喜剧类’,‘恐怖类’),那么此时使用多分类Logit回归即可。
如果数据中有量表数据即态度题,那么通常需要使用测量数据的真实性和量表设计的有效性,可使用信度和效度分析。
如果数据中有多选题(多选题是一种特殊的定类数据,其分析应该以‘某个多选题的所有选项作为整体’一次性分析),可使用SPSSAU问卷研究里面的‘多选题’,‘单选-多选’,‘多选-多选’,‘多选-单选’。分别分析多选题各项的选择比例,也或者单选题和多选题的差异关系,也或者多选题和多选题的差异关系,也或者多选题和单选题的差异关系。
03. 问卷思路剖析
问卷思路上一般分成三个部分,分别是基本情况分析,差异关系研究和影响关系研究。
- 首先是对问卷数据做基本的描述分析,结合数据类型,选择使用频数分析,或者描述分析即可;
- 接着研究差异关系情况,结合数据类型选择使用交叉卡方分析,或者方差分析即可;
- 接着研究影响关系情况,即X对于Y的影响,结合Y的数据类型,选择使用线性回归或者Logit回归即可。
参考资料如下:https://spssau.com/helps/basics/framemodule.html
(1)基本情况分析
分析方法:频数分析/描述分析
- 了解样本特征情况,基本认知情况,基本态度情况
- 比如个体基本特征(性别,年龄,学历,专业)等基本分布情况如何;比如对于疫情的认知情况或态度情况如何?
(2)探索规律(差异关系)
分析方法:交叉卡方分析/方差分析
- 深入分析差异情况,找出数据规律
- 比如分析不同性别/学历/专业群体,他们对于疫情认知态度差异情况如何?
(3)探索规律(影响关系)
分析方法:线性回归/Logit回归
- 深入分析更进一步的影响关系情况,找出数据规律
- 比如分析疫情认知态度情况 对 ‘疫情期间是否外出就读’的影响关系情况?
(4)其它
如果数据有量表题,那么可以测量数据的真实性和量表题设计的有效性。(仅针对量表题)
分析方法:信度分析/效度分析
- 探究数据的真实性和量表题设计的有效性
- 比如使用量表题询问‘消费升级’的态度情况,那么回收数据是否真实,且是否真的测量了‘消费升级’这个概念。
04.数据清理技能
数据分析前,有可能需要对数据进行清理,比如某个标题需要修改下,也比如数据中有大篇幅没有填写,也或者很多乱答(都选择同一个答案),那么此时需要做‘无效样本’处理。
与此同时,数据分析的时候,比如想把学历‘小学/初中/高中/大学/研究生’共5个类别,现在想组合成3个类别,分别是‘高中及以下/大学/研究生’,那么此时需要使用数据编码功能。
以上就是本次分享的内容啦。如果你有什么疑难问题,可以在评论区告诉我们。