您的位置:新文秘网>>干部/组织讲话/党会报告/学习体会/学习材料/政府/政府报告/>>正文

干部学习讲稿:基于大数据的政府决策支持(上)

发表时间:2017/1/8 8:19:50
目录/提纲:……
一、背景:新趋势,新路径
(一)大数据的概念
(二)大数据的特征
(三)非结构化数据与政府治理决策
(四)国家对大数据的支持
二、布局:国内外,两平台
(一)提前布局,创新机制
(二)国内布局——国家发改委互联网大数据分析中心
(三)全球布局——国家信息中心“一带一路”大数据中心
……
干部学习讲稿:基于大数据的政府决策支持(上)
杨道玲
国家信息中心信息化研究部电子政务研究室副处长

课程前言
各位学员大家上午好!非常高兴有机会和大家做一个交流,今天交流的题目叫“基于大数据的政府决策支持”。关于大数据,可能各地的同志们、领导们已经有了比较充分的了解。今天不讲大数据学术概念,也不讲大数据理论,想结合近一两年来,国家发改委围绕大数据方面做的一些工作实践,总结一些大数据对政府决策支持的套路和方法。
今天讲的内容包括四个方面:
第一,先简要的介绍一下当前大数据面临新趋势、新形势是什么。政府的决策到底需要什么样的数据决策支持?
第二,目前大数据在对国家发改委,对政府决策支持方面都有什么样的措施和做法?这些做法哪些可以应用到地方各级政府决策支持中去?
第三,通过五到六个具体的案例给大家介绍一下,大数据在支撑政府的决策支持和支撑政府的治理创新方面,一些新的方法、新的理念和新的模式。
第四,对大数据大应用简要的展望和小结。大概这么四个方面的内容。
一、背景:新趋势,新路径
先讲第一个方面,当前大数据成为国家战略,而且大数据在国外、全球也是风起云涌,很多国家都开始应用大数据,推行政府数据开放和大数据促进政府治理创新。大数据到底是一个什么样的态势?先给大家做一个背景性的介绍。
(一)大数据的概念
关于大数据的概念,我这里不去做学术性的阐释,在2015年的时候,_发了三个技术性的文件,这三个文件分别是2015年年初的云计算,大概是7月份,促进互联网+的一个文件,紧接着有一个促
……(新文秘网https://www.wm114.cn省略1078字,正式会员可完整阅读)…… 

(二)大数据的特征
大数据到底有多大?我左边有一张图,有一个表,左边是麦肯锡预测的。说到2020年,从2009年的2020年,十年了,数据量有可能翻44倍到35个ZB,大家可能不清楚,35个ZB到底是多大?我右边有一个表,这是我今天早上截图截下来的。大家看二进制的换算,1KB等于1024,B2的十次方,从KB到MB到GB,我们现在硬盘用的是GB,有的大的存储的器是TB,TB下面是PB,每一个等级之间是1024倍,就是2的十次方倍,到PB下面是EB、ZB,最大的现在是YB。这个是在大概的进率换算单位。如果按照十次分的换算,我们把1024简单的理解为十的三次方就是1000,按照1000来算,ZB就是十的21次方,就是这么大的数据量。应该可以说叫超级海量的数据。
IDC国际数据公司,它的预测跟麦肯锡的预测基本上是类似的,他们有三个结论。第一,说当前数据增长进入了爆发期。2011年,全球数据总量是1.8个ZB,大家看ZB是我们现在倒数第二大的单位,1.8个ZB。预计2020年是40个ZB,十年他认为增长超过20倍。不管超过20倍也好,40倍也好,表明了我们在未来的十年,现在没有十年了,未来的四年,我们数据量比2010年相比,是要至少翻一番以上。应该不是翻一番,翻几十倍以上。
第二个结论是美国和中国是最大的两个增长极,目前它认为大数据资源美国占了32%,欧洲是19%,中国是13%,到2020年中国要上升为21%,处于世界第二位。这个可能大家对数据概念没有感觉,但是我们自己生活中,这种数据量不断地增加、不断地扩充,呈现出几何基数的增长,这个咱们可能是有非常深刻体验的。90年代时候用的是普通的小型的3.5存盘,那个盘是1.44个MB,1.44兆,后来用了光盘,现在用了硬盘,硬盘开始是40个G,现在是几百个G,现在甚至有上T的硬盘,就是我们普通个人使用的。存储密度的增加,表明数据量容量是不断扩充的,表明需求是不断增加的。
第三个特征,非结构化的数据占比比较大。这里涉及一个概念叫非结构化和结构化.现在认为非结构化数据占75%,什么叫非结构化?我们先看看什么结构化。
这两张表我相信很多同志都见过,而且我们第一张表,个人经历,可能一生中无数时期填这样一个表。但这个表很有特点,就是字段数相对比较固定的,比如说姓名,你这个名字是三个字符还是几个字符,它是固定的。第二,性别,是男是女,就两个选项。身高,它是数字,结尾是米或者厘米。所有这一系列的字段都是可以经过机器处理,而且都是可以直接导入数据库进行处理的。
还有右边的图,我们举个例子,某某县,人口经济构成统计表,这个表咱们也可能经常见到,这种也是可以直接导入经济计算的。这种信息我们称之为叫结构化信息,因为它们在数据库里面是一块块的模块完全对应起来。
(三)非结构化数据与政府治理决策
1、非结构化数据主体
什么是非结构化?最主要这五类,大家看想想生活中是不是这五类信息反而比统计性信息要多?
第一类,是搜索引擎,这个都用过,每天在百度上输入的时候,输入搜索词,我们的搜索词都是非标准的。每个人,比如说我们搜索一个事情的话,每个人用的词可能都不一样,全属于人工的或者自然的语言。这个量是非常大的,百度就此做了搜索引擎,抓取信息,然后通过我们搜索词,构建出搜索的热度,能够反而向你推送各种相关的信息,靠什么?就靠这种分析。还有以前吵过的竞价排名,竞价排名排的是什么?也是搜索词。这些东西它都可能是各方面的语言进行组配,非标准语言,非结构化的。
第二类,社交媒体,咱们可能都用过,论坛、微博、微信,包括QQ很多的及时通讯,还有贴吧。这里面发各类的帖子它都不是结构化的。我们随机的一句话,随意的一篇文章,可长可短等等,段落等等,都是根据我们发布者主体意识进行决定的。
第三类,视频或音频,这个不展开了,这个大家都非常熟悉。包括我们今天用的是视频,视频肯定是比音频数据要大,我一个视频包含的数据量可能是我们文字信息的N多次方倍。
第四类,位置服务,很多地图,在地图上进行叠加了若干个图层,这种位置信息,查找一个线路,包括现在滴滴打车,查找餐馆等等,这都用了位置服务。所有位置服务在地图上产生的数据量非常大,而且是随机的,不同的用户可能使用不同的服务。但是这是数据累积起来之后,就是发现很多规律,比如说在今天有多少用户搜索了某某个产品,通过时间序列累积之后就发现很多趋势,这个趋势里面反过来推,搜索这类产品和这个地方的人都可能是哪些类型的用户,做用户画像往回推,这可能形成一个针对性的服务,这对商家来说它就非常需要,想知道我的用户到底是谁,他们有什么样的需求,他是什么样的特征,是男是女的,年龄段、学历层次,他们平时还有其他什么样的购物爱好,或者体验爱好等等。图像信息,图片图像这个也很多。这是非结构化的数据。
2、非结构化数据对政府决策的要求
这些大量的数据,特别是大量的非结构化数据,互联网的数据产生之后,到底对我们政府决策带来什么样一些冲击或者问题?面临什么样的挑战?当前新形势下,我们提出要政府的治理,治理体系和治理能力现代化。这个治理能力、治理体系现代化对我们政府治理提出了新的要求,要求什么?决策要快速、要及时。第二,不能再拍脑袋出台政策,要基于大量的用户调查,这个大量是多大的量?我们以前是做问卷调查,或者找几个听政的方式,找几个代表,现在可能不够了。第三,新的业态、新的应用在不断地产生,如果政府的治理跟不上新形势,就会很被动。所以我们现在治理的现代化,对我们要求是全方位掌握信息、全样本的了解信息。
3、非结构化数据下传统政府治理的缺点
而传统的政府治理的缺点,我 ……(未完,全文共12732字,当前仅显示3029字,请阅读下面提示信息。收藏《干部学习讲稿:基于大数据的政府决策支持(上)》