TXT电子书

手机浏览器扫描二维码访问

二数据的初步整理(第1页)

二、数据的初步整理

banner"

>

任何数据资料在进行分析前都需要进行无效数据的筛选和剔除。

判断无效数据的标准有以下几点。

第一,录入错误。

数据录入过程中的错误不可避免,有些错误通过检查是可以得到发现并更正的,如图12-2与图12-3中列出的第6条数据的性别,在数据中录入的值是3,明显是录入错误,这种情况下可以根据编号找回原始问卷进行修改。

第二,数据漏答、错答比较多。

一般情况下,错漏答问题数超过全部问题数的5%可以认为被调查者并没有认真完成调查,该条数据无效,需要剔除。

第三,回答呈现出某种机械的规律性。

如果被调查者的选择集中于某个选项或者规律性地在几个选项之间循环,如“111111”

“555555”

或者“1234554321”

“1234512345”

等,都表明被调查者并没有真正地回答问题,数据无效,需要剔除。

第四,测谎题超标。

如果调查问卷含有测谎题,被调查者在测谎题上面的回答显示其说谎,则说明被调查者并没有真实地回答问题,数据无效,需要剔除。

第五,异常数据。

异常数据有两类,一类是明显的逻辑错误题,比如被调查者在回答是否是独生子女时选择“是”

,在回答父母是否偏心时也选择“是”

,则说明至少一个问题上的回答是虚假的,反映被调查者的配合度比较低,可以考虑剔除数据。

另一类是指在总体数据中,个别数据的数值极端大或者极端小。

比如心理学实验中被试的反应时如果低于100毫秒,说明被试没有看到刺激就按键反应,属于无效数据。

另外也可根据三个标准差的原则剔除极端数据,即删除平均数加减三个标准差以外的数据。

例如,在分析两个班级的语文成绩是否有差异时,可能会存在一些极端成绩,并不能代表班级的一般水平,就需要按三个标准差的原则剔除极高分与极低分。

具体做法为:假设A班平均分为80分,标准差为6分,则A班98分以上和62分以下的成绩属于三个标准差以外的极端数据,需要删除。

根据以上标准经过无效数据删除后的数据才是最后用于统计分析的有效数据。

请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。

热门小说推荐
穿越从路易十三时代开始

穿越从路易十三时代开始

一切从一场有组织的到十七世纪初欧洲的穿越试炼开始。  对于优秀的赵红军和他的三个兄弟而言,航海探险可以有,征服世界也可以有,然而前提是通过五百名额的试炼…...

反穿书后,千金大佬娇养反派自救了

反穿书后,千金大佬娇养反派自救了

觉醒后,秦陶陶发现自己是一本穿书文男主的白月光。生前对男主各种跪舔,爱而不得跳了楼。死后就成了推动男女主感情戏工具人,被频频鞭尸。秦家大小姐不干了!马上开启王...

小说家的边缘角色自救指南

小说家的边缘角色自救指南

楚祖上辈子是个小说家,因为通宵赶稿猝死,死后绑定了「边缘角色修正系统」。系统提出交易,只要楚祖能扮演并修正那些被读者讨厌的边缘角色,他就能重获新生。楚祖改人设是吧?老擅长了!第一本读者A你可以让反派降智,但你最好不要做梦觉得读者也会降智,很难懂吗?还是读者A靠靠靠!早说是大佬的局中局中局啊!!祖爹!对不起!是我说话太大声了!!第二本读者B狗塑适可而止,就算你重复强调五百次他是可爱狗狗,但我只看到了一只舔狗,还是不会汪汪叫的那种。还是读者B起猛了,看到无敌阳光开朗大狗狗了,哪里能领养,阿祖!我也要养阿祖!!第三本读者C作者生活这么不如意,一定要搞这么五毒俱全的角色?写不出来东西找个班上吧。还是读者CMD,祖神,我可真该死啊!第四本第五本第六本楚祖怎么样,虽然演的一般,但我改得还行吧?系统你知道什么叫边缘角色吗?人气大爆角色算什么边缘角色啊!!!TIPS12100存稿箱吐章节,偶尔抽空改错字2警惕祖哥感情牌,他是个狠人3wb短不拉揪,随机掉落祖哥CG4论坛都会标注发言时间,精确到秒,有用5是想简单尝试各种题材的产物,专栏预收有各个题材,收收菜呗w...

开局一座核心舱

开局一座核心舱

以战锤之火,审判庭之魂,跨越万千星河,对抗混沌邪神!西贝猫出品,完本保证。...

年代文大佬的漂亮作精

年代文大佬的漂亮作精

程方秋生得千娇百媚,肤如凝脂,一睁开眼,居然成了一本七零年代文里的炮灰女配。她无语望天,在这个充满限制的时代,她只想当条咸鱼,拿着便宜老公的丰厚工资买买买,顺便再好好享受宽肩窄腰,冷峻帅气...

苏穆兵王穿越

苏穆兵王穿越

苏穆,华夏最强兵王,意外穿越到抗战时期,获得杀敌掉装系统。每次击杀敌方士兵,就会掉落各种物资,解锁成就,更能得到系统丰厚的奖励。系统提示恭喜宿主击杀敌方士...

每日热搜小说推荐