您的位置:新文秘网>>扶贫/农业讲话/信息/质检/思想汇报/工作汇报/>>正文

关于全国扶贫开发信息系统数据清洗和数据质量评估工作的汇报

发表时间:2019/9/30 17:58:14

关于全国扶贫开发信息系统数据清洗和数据质量评估工作的汇报

各位领导、同志们,大家晚上好!我是**区扶贫办统计监测处的**,今天由我为大家讲解一下全国扶贫开发信息系统数据清洗和数据质量评估工作。我今天讲解的题目是:数据质量评估规则详解。
在座的领导同志都知道,**年11月3日,_总书记到湖南省湘西州花垣(yuan)县十八洞村考察,在这里他首次提出了“精准扶贫”。此后的多次考察和讲话中,他反复强调脱贫攻坚工作中“精准”二字的重要性。精准扶贫的基础在于建档立卡的精准,基础不牢,地动山摇。因此,国务院扶贫办针对我们建档立卡信息系统,也就是我们经常说到的全国扶贫开发信息系统业务管理子系统,制定了数据清洗和数据质量评估规则,进一步提升全国扶贫开发数据质量。
数据质量是建档立卡的生命线。2020年国家统计局和扶贫办将组织开展对摘帽县的普查工作,重点围绕脱贫结果的真实性和准确性,调查贫困人口“两不愁三保障”实现情况、获得帮扶情况、贫困人口参与脱贫攻坚情况。针对数据质量问题,国务院扶贫办要求,各级扶贫部门要做好以下工作:
一是要层层传导压力。要采取有效手段,让基
……(新文秘网https://www.wm114.cn省略769字,正式会员可完整阅读)…… 
数据质量评估体系。
这是数据质量评估规则建立以来,我们新疆整体的情况。重点说一下最新的情况,2019年9月,国务院扶贫办制定了最新的96类问题数据规则,给我们也提供了问题数据明细,总计6.12万条,目前大家也已经收到通报和问题数据明细了,所以,请各位领导、同志们要高度重视此项工作,重要性我前面也强调过了,这是最基础的工作。排名靠后的地州、县市我们会进行通报,每年数据质量的好坏将作为考核评估的基础。
现在这个就是国扶办新梳理并制定的96项规则。一级问题有11项,二级问题有46项,三级问题有15项,四级问题有24项。这个大家简单看一下,后面我再详细的讲。
关于计分的问题,国务院扶贫办是这样规定的:单项规则排名,指单项指标错误数据量占该规则评估范围数据总量的百分比,数据质量越高占比越低、排名越靠前;将各级别规则(一级、二级、三级)得分,分别按0.5、0.3、0.2的权重进行加权平均,就得出了各地“综合得分”,按得分由低到高进行排序,数据质量越高分值越低,排名越靠前。四级规则需要核实,有问题就修正,如果合理存在就不用管了,四级规则不计分。……
第三大部分,数据质量评估规则解释。这一块主要分为8大块:贫困人口证件号码重复问题、贫困人口证件号码异常问题、脱贫户两不愁三保障相关指标、必录项及重要指标项空缺、重要指标间逻辑关系或业务逻辑异常、帮扶主体情况、贫困村相关指标信息和扶贫项目情况。
第1、2大块,都是贫困人口证件号码问题。证件号码是贫困人口的唯一标识,也是与行业部门数据共享和比对的依据。与证件号码有关的数据质量评估规则包括贫困人口证件号码重复(省内/省外)及位数异常、身份证号不符合校验规则、残疾人无残疾证和无身份证贫困人口等问题数据。
证件号码位数异常(证件号码非15、18、20、22位)、身份证号码不符合校验规则(特指18位证件号码)
1.按证件号码位数分
(1)一代身份证(15位)
(2)二代身份证(18位)
(3)残疾人证(20或22位)
(4)999999开头的其他位数
2.身份证号码构成
中华人民共和国国家标准GB 11643-1999《公民身份号码》中规定:公民身份号码是特征组合码,由十七位数字本体码和一位校验码组成。
出生日期码表示公民出生的公历年(4位)、月(2位)、日(2位)
顺序码是给同地址码同出生日期码的人编定的顺序号,其中奇数分配给男性,偶数分配给女性。
最后一位是校验码,这里采用的是ISO 7064:1983,MOD 11-2校验码系统。校验码为一位数,但如果最后采用校验码系统计算的校验码是“10”,碍于身份证号码为18位的规定,则以“*”代替校验码“10”。
3.残疾人证构成
第二代残疾人证号由居民身份证号+1位残疾类别代码+1位残疾等级代码组成,所有数据由基层办证人员录入残疾人人口基础数据库,实现全国联网。如残疾证遗失,补办证的残疾证将在20位编号后加印“B”,第二次遗失补办则加印“B2”,以此类推。
视力残疾、听力残疾、言语残疾、肢体残疾、智力残疾、精神残疾和多重残疾(两种及两种以上类别的残疾)
第3大块,是我们脱贫户“两不愁三保障”问题。脱贫户未解决“两不愁三保障”问题,具体到扶贫开发信息系统指标就是义务教育阶段适龄儿童不在校、脱贫户未解决安全饮用水、因病致贫脱贫户(含历年脱贫户)有患病成员但未参加大病保险、住危房以及人均纯收入低于2995元。……
脱贫户(含历年脱贫户)中义务教育健康儿童不在校且无义务教育阶段不在校原因:脱贫户中有6-15周岁、健康的人群没有填写在校生状况并且没有填写义务教育阶段不在校的原因。
第4大块,是必录项及重要指标项空缺,如“健康状况”为空、“劳动能力”为空、生产生活条件各子项为空等。
第5大块,是重要指标间逻辑关系或业务逻辑异常。
在这里具体说一下劳动能力。前面肖辉处长多次讲过,我再重复一遍。大家看到劳动能力,第一反应应该想到什么?是两个:16-60岁,健康状况。劳动能力分为普通劳动 ……(未完,全文共6154字,当前仅显示2161字,请阅读下面提示信息。收藏《关于全国扶贫开发信息系统数据清洗和数据质量评估工作的汇报》