问卷调查是一种流行的数据收集方式,但难以设计,并且在产生可接受的调查表之前通常需要进行许多重写。问卷是要向个人提出的一系列问题,以便获得有关任何给定任务的统计上有用的信息。它的构建和负责任的管理成为了至关重要的工具。它经常用于定量营销研究和社会研究。除了我们熟悉的心理学、社会学、经济学、教育学,到现在大热的机器学习,深度学习,统计学等数据编程类相关的方向,甚至是医学、案件侦查都会用到这样的方式。

留学生毕业论文问卷调查如何设计?

它们是从大量个人那里收集广泛信息的宝贵方法,通常被称为受访者。良好的问卷结构对于调查的成功至关重要。不适当的问题,不正确的问题顺序,不正确的缩放比例和错误的格式会使调查表失去其价值。很多小伙伴可能在初期的问卷设计中有大量不科学的操作,对后期的分析和结论的导出产生了巨大的影响,甚至导致了论文的难产… 比如

问卷太冗杂了,受访者填写到崩溃纷纷放弃;

问卷术语太多,受访者看到一纸天书无处安放双眼;

问卷设计和literature review的理论和结论似乎关系都不大,无法得到什么结果…

别着急,现在才6月底,小伙伴们还有大量的时间调整自己的问卷设计。今天,来和大家聊一聊问卷设计这回事。本篇文章主要介绍问卷设计方法。

1、问卷设计基本原则

问卷设计需要遵从如下几个原则:

1. 问题要有针对性,珍惜受访者原因贡献给你的时间;

一个小栗子:目前环境态势恶劣,垃圾分类、处理工作迫在眉睫,您觉得各地政府是否应该尽快将垃圾分类工作提上日程? 你话都说到这一步了,我难道还要冒着全民公敌的风险,揭竿起义吗?

2. 问题尽量要贴合literature review提到的理论相结合,不要天马行空的编造;

3. 化抽象为具体;

举个例子:调查美国亚马逊客户满意度,你不能只用「粘性较高」、「比较满意」来设置选项,而是应该用「持续每年在亚马逊消费的具体金额区间」、「在社交场合主动向亲友推荐的频率」等选项来调查用户对这个网站的使用习惯和品牌印象。

再一个栗子:

含糊的提问得到含糊的答案。例如,您的家庭收入是多少?当应答者给出此问题的数字答案时,其答案是各式各样的,如2020年的税前收入,2020年的税后收入,2022年税前收入,2022年税后收入。

4. 避免应答者可能不明白的缩写、俗语或生僻的用语。

例子:你对PPO的意见详解?很可能不是每个人都知道PPO代表优先提供者组织(Preferred Provider Organization)。如果这一问题以一般公众为目标应答者,研究人员可能会遇到麻烦。另一方面,如果问题针对物理学家或医院管理者,那么缩写PPO很可能是可接受的。

再来一个:媒体上最近经常报道的二噁英,对你在食品消费的选择上会有影响吗? 二英、二w英,这是哪来的生僻字,为难我这个乡下人吗?

2、夯实基础:基础知识介绍

数据分析常见术语有哪些呢?P值,量表,非量表,分类数据,样本都是需要大家了解的:

编号 术语 相关名词
1 P值 显著性、显著性差异、0.01水平显著、0.05水平显著
2 量表 李克特量表,定量数据
3 非量表 分类数据,多选题
4 数据类型 定量数据,分类数据
5 样本 样本量,无效样本

这里想跟大家重点说一下量表和非量表。

量表,通常是指李克特量表,其用于测量被试对于某概念(通俗讲即某件事情)的态度或者看法情况。通常量表会由很多项目(题项)构成,并且答项类似于非常同意、同意、不一定、不同意、非常不同意,也或者非常满意、比较满意、中立、比较不满意,非常不满意等。量表被广泛使用于学术研究的各个领域,并且大多数统计方法均只能针对量表,比如信度分析,效度分析,探索性因子分析,结构方程模型等。量表的尺度形式有多种,常见是五级量表,即五个答项,另外还会有七级量表,九级量表或者四级量表等,四级量表或者九级量表使用频率相对较少。量表广泛运用于各个学术领域,并且非常多分析方法适用于量表题项,比如因子分析,相关分析,回归分析,方差分析,T检验,聚类分析等,通常情况下中介作用或者调节作用分析也针对量表题项。如果希望进行使用分析方法,则需要尽量使用量表题项。

非量表为除量表(或者类似量表)的题项,比如多选题,或者基本事实现状题项等,非量表题项更多用于了解基本事实现状,研究人员可以通过此类题项分析研究当前现状情况,并且提出相关建议措施。通常情况下,非量表题项包括以下几种类型,分别是单选题,多选题,填空题等。分析方法上,非量表题项可以使用频数分析进行基本描述,以及卡方分析对比差异,也可以使用Logistics回归分析和聚类分析、

另外,数据的类型有哪些呢?

术语 说明 举例
定量数据 数字大小具有比较意义 您对天猫的满意度情况如何?(非常不满意,比较不满意,中立,比较满意,非常满意)
分类数据 数字大小代表分类 性别(男和女),专业(文科、理科、工科)

3、量表类问卷设计

量表类问卷指大部分(60%以上)问题均为量表题项的问卷,量表类问卷广泛运用于学术研究,以及可以对量表类问卷进行多种分析,包括影响关系研究,中介或者调节作用检验,指标权重计算,细分市场研究等。量表题项对应多种统计分析方法,包括描述性分析(平均值),信度分析,效度分析,相关分析,回归分析,探索性因子分析,聚类分析等,结构方程模型软件AMOS的验证性因子分析或者结构方程模型SEM功能,也仅适用于量表类题项。

3.1 问卷设计框架

量表类问卷设计框架

下面通过一个栗子和小伙伴们讲解一下。

(1) 筛选题项。如果对于样本特征有特殊要求,比如研究题目为90后员工离职倾向影响因素分析,明显的研究样本一定需要为90后,因此需要首先设置筛选题项,如果非90后样本,即停止回答后续题项。如果研究中需要进行样本筛

(2) 样本基本背景信息题项。通常情况下,问卷中需要加入样本基本信息题项(人口学统计学变量),比如性别,年龄,学历,月收入等题项,不同背景的样本,可能对同样一件事情有着不一致的态度。因此需要加入此类题项,此类题项通常是进行频率统计,以及进行方差分析,T检验差异对比等。

(3) 样本特征信息题项。除样本基本信息题项外,通常情况下还需要设计样本基本特征信息。比如研究题目为网络消费态度影响因素研究,则可以加入相关网络消费基本现状特征题项,比如当前网购频率情况,样本网购的商品类目情况,以及网购消费金额情况,网购消费平台情况等。研究人员核心思路并非针对样本特征情况,因而此类题项的个数应该较少,建议3~8个之间。

(4) 样本基本态度题项。除开样本基本背景信息,样本基本特征外,还可能涉及样本基本态度情况题项,此类题项基本上均为非量表题项。以及此类题项设计目的在于了解样本的基本态度情况,比如研究者可以通过此类题项,了解样本对于当前网购的消费态度,网购的前景态度,也或者网购平台的态度情况等。

此类题项用于分析样本的基本态度,通常情况下后续分析时会对其进行频率统计,以了解样本的基本态度(无法使用信度分析或者效度分析)。有时也可以分析此类题项与其余题项之间的关系,比如使用卡方分析研究不同性别样本对此类题项的差异性态度,也可以使用回归分析研究此类题项对消费意愿的影响情况等。

(5) 核心变量题项。

敲黑板!!!此处为重点!!!

此部分为量表类问卷研究的核心内容,题量上最多,并且此部分通常情况下均为量表类题项。比如某研究为90后离职倾向影响因素研究,具体影响因素上可分为以下五个方面,分别是薪酬福利、人际关系、工作本身、价值观,成就发展和企业文化。明显地,研究人员需要针对此五方面分别设计题项,每项因素可能由多个题项组成(建议每个最小维度由4~7个题项组成),因此五项因素总共涉及题项约为28个。

以及研究影响因素对于离职倾向(Y)的影响,自然还需要题项询问样本离职倾向态度。

量表题项注意事项 说明
需要有文献参考依据 题项是否有参考文献?
变量或维度对应题项合理性 每个变量对应题项数量是否合适?
因变量Y对应题项 如果研究影响关系,是否有因变量Y对应题项?
反向题 反向题是否需要,以及是否可以正向处理?

第一是此部分题项设计需要有文献参考依据,结合相关研究文献参考进行设计,或者直接借用相关文献题项设计,不能随意主观设计题项,以免导致后续信度,效度不达标。

第二是每个最小维度(方面)尽可能由4~7个题项去表示,避免后续分析过程中出现信度或者效度不达标现象,并且每个维度由多个题项表示,可以更好的表达对应维度(方面)的概念信息,更具说服力。

第三是如果研究变量影响关系,即X对于Y的影响情况,需要有因变量Y的对应题项,否则会导致后续无法进行相关分析或者回归分析的尴尬,比如研究工作满意度的影响情况,题项中涉及到各个可能影响满意度的因素对应题项,但是并没有体现样本整体工作满意度的题项,此类问卷无法进行相关分析和回归分析,无法使用回归分析研究各类因素对于工作满意度的影响关系。

第四是反向题问题(2.1部分有具体说明),如果并非必要,研究人员可以将反向题进行正向处理。

如果研究权重情况或者使用此部分量表题项进行样本细分聚类时,很可能每一个题项即为一个小点(方面),研究人员需要注意对各个题项的问法进行仔细考量,避免问项设计带来样本回答偏差。如果研究中介作用或者调节作用检验,对应维度或变量题项均需要有理论文献参考,避免问卷设计问题导致分析结果的误差。如果研究中介作用或者调节作用,中介变量或者调节变量也需要有对应题项体现。

此部分量表题项适用于各种统计方法,包括信度分析,效度分析,相关分析,回归分析,因子分析,聚类分析等。

(6) 其它题项。如果研究目的在于对样本聚类,将样本细分为几类,并且针对每类样本提供个性化建议,比如消费者对某类潜在新产品的选择偏好情况,此时可以设计题项单独问及某类潜在产品的需求偏好或者态度情况。比如研究人员基于这样的思路,结合相关题项将样本进行聚类,并且设计一款新型雾霾保险产品,分析不同类别样本对该产品的偏好差异,最终针对不同类别人群提供不同的保险产品选择。

4、非量表类问卷设计

接着跟大家讲一下非量表类问卷设计。约定大部分题项(60%以上)或者基本所有题项均为非量表题项时,此类问卷称之为非量表类问卷。多数非量表类问卷是对某事情现状进行研究,研究样本的基本态度,并且结合数据结论提供建议措施等。分析方法上,非量表类问卷可以使用的统计方法较少,常见为卡方分析,Logistic回归分析,部分情况下也可以使用相关分析或者回归分析,卡方分析的使用频率最高,单选题或者多选题均可以使用卡方分析研究题项间的关系情况。如果为非量表类题项,无法使用信度分析,效度分析或者探索性因子分析等。

非量表类问卷设计框架可分为六个部分,分别是筛选题项,基本背景信息题项,样本特征信息题项,以及样本对于研究话题的基本认知现状情况,并且还涉及样本对于研究话题的基本态度情况等。具体非量表类问卷的设计框架如下图所示。

非量表类问卷设计框架

(1) 筛选题项。类似于量表类问卷,如果研究话题需要对样本有要求时,即需要设置筛选题项,比如研究话题为P2P认知情况,研究者限制样本需要有过P2P投资经历,或者对P2P有一定了解,因此在问卷最前面设置相关筛选题项尤其必要。

(2) 样本基本背景信息题项。通常情况下,问卷中需要加入样本基本信息题项(人口学统计学变量),比如性别,年龄,学历,月收入,职业等题项,不同样本背景的样本,很可能对同样一件事情有着不一致的态度。因此需要加入此类题项,此类题项通常是进行频率统计,以及可以进行卡方分析对比差异,有时候也会将样本基本背景信息题项作为自变量(X)进行logistics回归分析。

(3) 样本特征信息题项。针对非量表类问卷,通常会有较多基本特征信息题项,比如研究题目是P2P投资态度,则可能包括样本对于P2P的了解信息渠道,样本进行P2P投资的资金来源情况,样本对于P2P相关平台了解情况,以及样本以往投资经验,样本朋友P2P投资情况等。此部分题项并非研究的核心,更多是对研究样本背景信息进一步了解,充分了解样本特征有助于深入分析某结论的产生原因,不同特征的样本可能导致对同一话题有着差异性态度。此类题项并非核心研究内容,因而题项不能过多,较为合理的题项数量比例是整份问卷数量的20%左右。分析方法上,通常是进行频数统计,以及与相关态度题项进行卡方分析,进行差异对比研究。

(4) 基本现状题项。此部分在于研究样本对某研究话题的基本事实现状情况,比如研究题目是P2P投资态度,则可能涉及以下题目:当前是否有过P2P投资经历,P2P投资时间情况,P2P投资金额情况,P2P投资平台情况,P2P投资具体产品情况等。此部分为样本基本现状即事实性问题,对样本基本现状情况有深入了解,才可能会有更好的分析讨论。

(5) 样本基本态度题项。非量表类问卷研究中,除了对基本现状进行分析,研究人员还需要分析样本的基本态度。比如研究题目为P2P投资态度,则可能会涉及到以下题目:愿意进行P2P投资的原因情况,不愿意进行P2P投资的原因情况,对于P2P的风险态度认知情况,P2P的前景看法情况,P2P的关注度情况,P2P相关政策态度等。此类态度题项可以是多选题形式(比如涉及到原因的题项),也可以是单选题,并且也可以是量表题(比如P2P前景态度,分为五个答项分别是,非常不看好,比较不看好,中立,看好和非常看好)。

如果研究思路上倾重于了解样本的态度,此部分的题项数量上会较多,并且可以将题项分为几类,分别每类代表某方面的态度。至于题项数量上,整份问卷题目数量的40%左右较为合理。

对于样本基本态度题项的分析,首先需要进行基本频数或者平均值统计,以了解样本当前基本态度情况,并且还可以与样本基本特征,或者样本基本现状题项进行交叉卡方分析,了解不同样本人群的态度差异,并且还可以使用回归分析(多元线性回归或者Logistic回归分析),研究样本背景,或者样本现状题项对于样本态度的影响关系,为后续建议提供分析支持。

(6) 其它。在上述例子P2P投资态度研究时,如果希望设计一款新型投资理财产品,或者希望单独一部分题项了解P2P投资者的风险态度,则可以一个独立的部分罗列题项。