搜索
查看: 3136|回复: 0

你信任你的老板吗?——调查中的敏感性问题处理

[复制链接]

202

主题

6

回帖

885

积分

高级会员

积分
885
发表于 2014-7-23 08:53:47 | 显示全部楼层 |阅读模式

大学生中到底有多少作弊者?曾有过作弊行为的学生到底占多大的比例?

       你的家庭财产是多少?

       你第二职业的月收入是多少?

       你信任你的老板吗?

        ……

        要调查这些问题,如果直接询问你是否曾经在考试中作弊?那么绝大多数学生都会作否定的回答,或拒绝回答,这是一个敏感问题。在社会调查中,有时会碰到一些敏感问题或涉及个人隐私的问题。对这类问题,被调查者往往不愿意说出他们真实的想法。因此直接调查可能得不到可信的结果。

解决这类问题的方法之一是采取不记名的调查。但是即使宣布不记名,有时也难以消除被调查者的顾虑,他们怀疑调查者事后可能查笔迹,或事先在问卷上作了记号等等,因此可能不如实作答。

另外一种方法叫做“随机化选答”技术,又分为正反问题选答和无关问题选答这两种形式。其基本思想是让被调查者随机地选答一个问题,而调查员并不知道他(她)回答的是哪一个问题。被调查者可以根据自己所选的问题真实地作答(或只划勾表示“是”或“不是”),没有人会知道被调查者的秘密。

例如某大学利用正反问题随机化选答技术,调查学生中曾经有过作弊行为的人数比例。随机抽取n=300人,调查的问题以正、反两种形式叙述。在问卷中附有一张随机数字表,要求被调查者先用指尖或铅笔在表上随意地指一个数(要求不看表),如果这个数是

0、1、2、3、4、5、6、7

中的任何一个,则回答问题A,如果这个数是

8  或  9

则回答问题B。并要求被调查者不要把自己所回答的问题告诉任何人(包括调查员)。被调查者只需根据自己所选的问题作真实的回答:

1.是  或  2.不是

实际上只需在1或2上划圈就可以了。这两个问题和供选择的答案是:

A.你曾经在考试中作过弊或帮助同学作过弊,是吗?

B.你从来没有在考试中作过弊或帮助同学作过弊,是吗?

1.是 2.不是

从调查结果得知,在300名学生中,有180名学生选择了“是”,即对A、B两题选择“是”的比例为:

e’=180/300=0.60

我们要估计的是对A题选择“是”的比例P(A)’。由选答的规则可知,选答A题的概率为:

P=8/10=0.80

根据全概率公式,可以按下面的公式估计P(A)’,即曾经在考试中作过弊或帮助同学作过弊的比例为:

P(A)’=(e’-(1-P))/(2P-1)

            =(0.60-(1-0.8))/(2*0.8-1)

=0.667=66.7%

    这是样本估计值。为了估计总体比例P(A)'的95%置信区间,还要估计其方差和标准误,最终得到该大学的学生中曾经在考试中作过弊或帮助同学作过弊的人数比例为57.5%~75.9%。

如果采用无关问题随机化选答技术进行调查,假定样本量仍是n=300,选答A题的概率仍为P=0.80(按前面的规定,在随机数字表上随意地指定的数如果是0、1、2、3、4、5、6、7中的任何一个,则回答问题A,否则回答问题B),供选择的两个无关问题和供选择的答案可以是:

A.你曾经在考试中作过弊或帮助同学作过弊,是吗?

B.你父亲生日的月份为双数,是吗?

1.是 2.不是

一般情况下,对B题选择“是”的比例是未知的,但是在该大学学生的总人数比较大的情况下,可以近似地认为学生中父亲的生日月份为双数的占半数,即P(B)’=0.50。那么对A题选择“是”的比例P(A)’的计算公式为:

P(A)’=(e’-(1-P) P(B))/P

其中e’表示对A,B两题选择“是”的比例。调查的结果有185名学生选择了“是”的回答,因此:

e’=185/300=0.617

由此估计出对A题回答“是”,即曾经在考试中作过弊或帮助同学作过弊的(样本)比例为:

P(A)’=(0.617-(1-0.8)*0.5)/0.8=0.646

同样,为了估计总体比例P(A)的95%置信区间,需要估计其方差和标准误差,最终得到:可以以95%的置信度推断,该大学的学生中,曾经在考试中作过弊或帮助同学作过弊的比例为57.7%~71.5%。

上述两种随机化选答的方法都采用了随机数字表的方法,来确定是回答A题还是回答B题。在实际应用中还可采取摸球的办法:摸到白球答A,摸到红球答B,而袋中A球个数所占的比例就是选答A题的概率P。也有将A、B分别写在卡片上,摸到A即回答A题,摸到B即回答B题,A卡片所占的比例就是选答A题的概率。不过不管采用哪一种具体的办法,都应向调查者解释清楚方法的原理,解除他们的顾虑。如果使用摸球或摸卡片的办法,还应将袋中的球或卡片及具体做法向被调查者交待一下,让被调查者放心——他(她)所回答的问题是只有他(她)自己才知道的。

“正反问题随机化选答”技术似乎更简便一些,不必去设计“无关问题”,只需将问题反过来再问一下就可以了。但是也有缺陷,就是反面问题仍是敏感问题,被调查人可能仍有顾虑而不予合作;其次还要注意,选A题(正题)的概率不可以是二分之一。

“无关问题随机化选答”对选A题的概率没有限制,可以是二分之一,例如可规定在随机数字表中指到单数就答A题,双数就答B题。这样更便于被调查者理解和操作,A、B题各占一半也不易引起他们的顾虑。但是在设计“无关问题”时要注意简单明了,同时必须是让被调查者以外的人很难猜测答案的问题。例如,如果将本例中的B题改为:

B.你的生日月份为双数,对吗?

那么被调查者就可能有顾虑,因为调查者可能会猜到他回答的是哪道题。如果他的答案为“是”,他的生日是7月份。那么这只可能是针对A题的答案,即他承认作过弊。因此必须是真正与他无关的问题才能入选。但是由于事先必须知道总体中对“无关问题”作肯定回答的比例,这一点有时候是需要事先费力去了解的,或只能是近似的估计。例如我们假定了该校大学生的父亲有一半的生日在双月份,可能会带有一定的误差。

不管采取哪一种随机化选答技术,A题答“是”的比例的估计量的方差都大于简单随机抽样的方差,即采用随机化选答技术可能会在估计精度上造成一定的损失。但是这样取得的数据的真实性将远远高于一般的直接调查询问方法,因此这种精度上的牺牲是有补偿的。随机化选答技术对调查员提出了更高的要求,必须向被调查者解释清楚这种方法的原理和具体的操作方法,才能取得正确、真实的数据。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-5-17 11:28 , Processed in 0.062541 second(s), 25 queries .

快速回复 返回顶部 返回列表