有草书屋

手机浏览器扫描二维码访问

二数据的初步整理(第1页)

二、数据的初步整理

banner"

>

任何数据资料在进行分析前都需要进行无效数据的筛选和剔除。

判断无效数据的标准有以下几点。

第一,录入错误。

数据录入过程中的错误不可避免,有些错误通过检查是可以得到发现并更正的,如图12-2与图12-3中列出的第6条数据的性别,在数据中录入的值是3,明显是录入错误,这种情况下可以根据编号找回原始问卷进行修改。

第二,数据漏答、错答比较多。

一般情况下,错漏答问题数超过全部问题数的5%可以认为被调查者并没有认真完成调查,该条数据无效,需要剔除。

第三,回答呈现出某种机械的规律性。

如果被调查者的选择集中于某个选项或者规律性地在几个选项之间循环,如“111111”

“555555”

或者“1234554321”

“1234512345”

等,都表明被调查者并没有真正地回答问题,数据无效,需要剔除。

第四,测谎题超标。

如果调查问卷含有测谎题,被调查者在测谎题上面的回答显示其说谎,则说明被调查者并没有真实地回答问题,数据无效,需要剔除。

第五,异常数据。

异常数据有两类,一类是明显的逻辑错误题,比如被调查者在回答是否是独生子女时选择“是”

,在回答父母是否偏心时也选择“是”

,则说明至少一个问题上的回答是虚假的,反映被调查者的配合度比较低,可以考虑剔除数据。

另一类是指在总体数据中,个别数据的数值极端大或者极端小。

比如心理学实验中被试的反应时如果低于100毫秒,说明被试没有看到刺激就按键反应,属于无效数据。

另外也可根据三个标准差的原则剔除极端数据,即删除平均数加减三个标准差以外的数据。

例如,在分析两个班级的语文成绩是否有差异时,可能会存在一些极端成绩,并不能代表班级的一般水平,就需要按三个标准差的原则剔除极高分与极低分。

具体做法为:假设A班平均分为80分,标准差为6分,则A班98分以上和62分以下的成绩属于三个标准差以外的极端数据,需要删除。

根据以上标准经过无效数据删除后的数据才是最后用于统计分析的有效数据。

请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。

热门小说推荐
混沌冠冕

混沌冠冕

来到国度的第十八年,亚伦终于想起了自己是穿越者的事实。他的情况有点不妙。没有一个可爱的妹妹觉醒杀戮神子,又没有个金马桶上的帝皇出现认他当儿子,更没有遇到一群被迫害需要救助的女巫。甚至资质一般的他,面临的是他就是这个家族的最后一代。要是能够就职那种可以用卡牌召唤生物的职业就好了。幸好,命运没有抛弃他。四位和蔼可亲善良美好的神,决定选他当自己的代表。那么,目标就从戴上混沌冠冕,和这四位好哥哥一起打牌开始吧!...

每日热搜小说推荐