大数据读书心得体会
《大数据》不是一本纯技术的书籍,作者用美国多年来丰富而详细的案例说明了大数据的趋势和发展历程,大数据的初衷就是将一个公开、高效的政府呈现在人民眼前。下面是带来的大数据读书心得,欢迎查看。
大数据读书心得一:
《大数据》是去年的一本畅销书,在2012年的广州南国书香节上曾有过一瞥,后来又几次听闻,一直想好好看看。现在是一个技术奔腾、信息爆炸的社会,大数据这个新鲜热辣的概念一经推出,就受到了人们极大的热捧。这也难怪,每天都身处网络的信息海洋中,常常会有被数据、信息“淹没”窒息感和无力感,不识庐山真面目,只缘身在此山中,我们向鱼儿一样亟待跳出海面,看看当下网络之海中正涌动着的大数据暗流,看看这个大家都在谈论的大数据到底是个什么东西?
书的扉页上写着作者涂子沛对大数据的定义:大数据(big data)指一般的软件工具难以捕捉、管理和分析的大容量非结构数据,一般以“太字节”为单位。构成大数据的信息主要包括:宽带普及带来的巨量日志和通讯记录,社交网络每天不断更新的个人信息,视频通讯、医疗影像、地理信息、监控录像等视频记录,传感器、导航设备等非传统 IT 设备产生的数据信息,以及持续增加的各种智能终端产生的图片及信息,这些信息呈爆炸性增长,不断涌入网络海洋。大数据之大并不仅仅在于容量之大,更大的意义在于:通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来大知识、大科技、大利润和大发展。当然这个定义并不是唯一的,Intel试图用视频解说的方式告诉我们什么是大数据:《大数据入门:大数据如何产生巨大影响力》。
这本书将美国的奥巴马大选作为引子,从他的建立透明和开放的政府的雄心壮志讲起,阳光是最好的防腐剂,信息公开和公民社会紧密相连,从政府信息公开化的必要性,到如何筛选、甄别、分析、管理、利用海量的政府部门的数据,因为政府部门涉及人类生活的方方面面,也就逐渐引出信息社会大数据的概念,给我们带来如何应对大数据时代的到来的挑战和机遇的思考。因为这本书信奉一句至理名言:除了上帝,任何人都必须用数据说话。
麦肯锡2011年6月的全球市场报告———Big Data:The next generation frontier for innovation, competition and productivity是深入了解大数据发端和全貌必看的报告,下载地址。
就我个人的理解而言,大数据的概念是社会信息化深入发展的一个阶段,映射到教育信息化的领域中来,又有哪些关联和启示呢?专业领域中常常提到的数据挖掘、个人知识管理都和此有关,学校教育过程是一个有特殊的场景、特定的事物和特殊的角色(学生、教师、教育管理者),随着学校的信息化进程加快,与教育教学和学习相关的环境数据、业务数据和角色数据也将大量增加,这就是是教育领域中的大数据,如何有效获取、筛选、管理和利用也成为挑战和变革的机遇。
大数据读书心得二:
有人说生活像一团乱麻,剪不断理还乱;我说生活像一团乱码,尽管云山雾罩惝恍迷离,最后却总会拨云见日雨过天晴。维克托迈尔舍恩伯格就把这团乱码叫做大数据,在他的这本书里,试图给出的就是拨开云雾见青天的玄机。
这玄机说来也简单,就是放弃千百年来人们孜孜追求的因果关系转而投奔相关关系。说来简单,其实却颠覆了多少代人对真理探求的梦想。我觉得作者是个典型的实用主义者,在美帝国主义万恶的压迫和洗脑下,始终追逐性价比和利益最大化,居然放弃了追求共产主义真理最基本的要求!不像我们在天朝光芒的笼罩下,从小就开始学习和追求纯粹的共产主义唯心科学历史文化知识啦!这或许就是我们永远无法获得诺贝尔奖、永远无法站在科技最前沿的根本原因吧。其实小学时候,我就想过这个问题,相信所有的人都问过类似的问题,例如现在仍然很多人在问,妈的从来没人知道我每天摆摊赚多少钱,你们他妈的那人均收入四五千是怎么算出来的。中国是抽样的代表,因为中国人最喜欢用代表来表现整体,最典型的例子莫过于公布的幸福指数满意指数各种指数永远都高于你的预期,你完全不清楚他是怎么来的,一直到最后汇总成三个代表,真心不清楚它到底能代表了啥。说这么多显得自己是个愤青,其实只是想表达“样本=总体”这个概念在科技飞速发展的今天,在世界的不同角落,还是会体现出不同的价值,受到不同程度的对待及关注。在大数据观念的冲击下,我们是不是真的需要将平时关注的重点从事物内在的发展规律转移到事物客观的发生情况上。
大数据的出现,必然对诸多领域产生极大的冲击,某些行业在未来十年必将会得到突飞猛进的发展,而其他一些行业则可能会消失。这是废话,典型的三十年河东三十年河西的道理,就像三十年前的数理化王子们,现在可能蜷缩在某工厂的小角落里颤颤巍巍的修理机器;就像三十年前职业高中的学生才学财会学银行,如今这帮孙子一个个都开大奔养小三攒的楼房够给自己做墓群的了;当然也不乏像生物这种专业,三十年前人们不知道是干啥的,三十年后人们都知道没事别去干,唯一可惜的是我在这三十年之间的历史长河中却恰恰选了这么一个专业,这也是为什么我现在在这写读后感而没有跟姑娘去玩耍的原因。其实乍一看这个题目,我首先想到的是精益生产的过程控制,比如六西格玛,这其实就是通过对所有数据的分析来预测产品品质的变化,就已经是大数据的具体应用了。
而任何事物都会有偏差,会有错误,也就是说,这全部的数据中,肯定是要出现很多与总体反应出的规律相违背的个体,但是无论如何这也是该事件中一般规律的客观体现的一种形式,要远远好过从选定的样本中剔除异常值然后得到的结论。换句话说,也大大减少了排除异己对表达事物客观规律的影响。就好比是统计局统计中国人民的平均收入一样,这些数怎么这么低啊,这不是给我们国家在国际社会上的形象抹黑么,删掉删掉;这些数怎么这么高啊,这还不引起社会不满国家动荡啊,删掉删掉。所以说,大数据至少对反应客观事实和对客观事实做预测这两个方面是有非常积极地意义的。而这个新兴行业所体现的商机,既在如何利用数据上,又在如何取得数据上。
先说数据的利用,这里面表达的就是作者在通书中强调的对“相关关系”的挖掘利用。相关关系与因果关系便不再赘述,而能够对相关关系进行挖掘利用的企业其实缺不多,因为可以相信未来的大数据库就像现在的自然资源一样,必将因为对利益的追逐成为稀缺资源,而最终落在个别人或企业或部门的手中。想想无论当你想要做什么事情的时候,都有人已经提前知道并且为你做好了计划,还真是一件甜蜜而又令人不寒而栗的事情。
而对于数据的获取,我觉得必然是未来中小型企业甚至个人发挥极致的创造力的领域。如何在尽可能降低成本的情况下采集到越多越准确的数据是必然的发展趋势,鉴于这三个维度事实上都无法做到极致,那么对于数据获取方式的争夺肯定将成就更多的英雄人物。
现在回头从说说作者书中的观点中想到的,P87中关于巴斯德的疫苗的事件,描述了一个被疯狗咬伤的小孩,在接种了巴斯德的狂犬疫苗后成功幸存,巴斯德成了英雄的故事。这是个非常有意思的案例,因为小孩被狗咬伤而患病的概率仅为七分之一,也就是说,本事件有85%的概率是小孩根本就不会患病。那么小孩的生命到底是不是巴斯德救的,而这疫苗到底是有效没效,通过这个事件似乎根本就没有办法得到验证。这就好比某人推出个四万亿计划,但实际上国际经济形势就是好转,哪怕你只推出个二百五计划,GDP都会蹭蹭的往上涨,而且又不会带来四万亿导致的严重通胀、产能过剩、房价泡沫等问题。那你说这四万亿到底是救了国还是误了国?回到我自己的工作领域上来,安全工作,我们一直遵循的方向都是寻找因果关系,典型的从工作前的风险评估,到调查事故的Taproot或者五个为什么,无一不是逻辑推理得到结果的产物。而事实上,如果能做到信息的丰富采集和汇总的话,找出事物之间的相关性,对提高工作环境的安全系数是极为有利的。这个点留着,看看可不可以在未来继续做进一步研究。
大数据读书心得三:
《大数据》不是一本纯技术的书籍,作者用美国多年来丰富而详细的案例说明了大数据的趋势和发展历程,大数据的初衷就是将一个公开、高效的政府呈现在人民眼前。书中从美国《信息自由法》说起,其发展历程充满了坎坷,经过各个时期信息自由倡议者的努力,终于出现端倪,并迅速成长,充分体现出美国政府的信息必须被公开,以及个人的隐私必须被保护。人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
《大数据》开篇讲述美国《信息自由法》历经多任总统,其中有支持者,也有反对者,最后终于签发,标志都美国进入信息公开及隐私保护的大数据时代。现如今全世界现有60多个国家制定、实施《信息自由法》。
随着《信息自由法》的颁布,以及现代科技的发展,会产生越来越多的数据。数据主要来源是:1.各行各业通过计算机产生了大量的数据;2. 业务数据3. 民意数据4. 环境数据。并且数据在数量、速度、多样性三个维度迅速增长,促使数据帝国逐渐兴起。
有了这么多数据,应该如何利用?
首先,在治国方面。1.循“数”管理,减少交通事故死亡人数。2.用数据进行医疗福利打假,可为政府节省开支。3.警方通过CompStat系统,分析犯罪数据,预知犯罪地点。
其次,商务智能方面。1.数据仓库,2.联机分析(OLAP),3. 数据挖掘,4. 数据可视化。
当然随着数据的增多,如何收集和使用这些数据,就需要制订一系列的法则。1.收集法则:减负;2.使用法则:隐私;3.发布法则:免费,4.管理法则:质量。其中数据质量最为重要,为了保证数据质量颁布了《数据质量法》,同时也带来了困惑,即给商业组织带来了质疑政府公布数据质量的手段,对于这一手段,满足其商业利益,是民主与商业组织之间的对抗和冲突。
同时,统一分析和使用大数据与个人隐私产生的冲突。通过中央数据银行和全国统一ID就获得某个人一生的行动,违反了个人隐私法,但不分析这些信息,又可能导致恐怖分子的袭击,最终以保护个人隐私胜利,但政府还是想执行统一身份认证。
奥巴马的上任加速了政府数据开放的进程,奥巴马上任后立即任命首席信息官,由首席信息官在4个月内推出政府大数据网站data.gov,在互联网上为民众提供开放的政府数据。阳光基金会和个人利用开放数据开发出各种分析工具,充分体现出数据价值。
但公益组织并不满足开放数据的数量,为了让民众监督一个更为公正透明的政府,公益组织要求公开白宫访客记录,但这并不是一个简单的要求。经过公益组织不懈的努力,白宫终于公开了访客记录,但公益组织发现了更多的问题,白宫也提出将继续修改访客记录的方式。
大数据有效的监督了政府的公正与民主。民主不是一个结果,而是参与的过程,人民要不断的争取才能实现民主。
本书结尾也较详细的描述除美国外,其它各国通过大数据走向民主的进程,充分说明了这一进程是一个大趋势。首先,英国紧随美国后面实施数据开放,虽然晚于美国,但发展飞快,开放的数据量已超过美国。其次,即美、英两国开放数据之后,更多的国家也加入到其中。2011年9月20日,8个国家宣布成立“开放政府联盟”,要想加入需具备4个条件:1.财政透明,2.信息自由,3.财产公开,4.公民参与。截止2012年4月25日已有50个国家加入。
在大数据时代,数据就是直接的财富,数据分析和挖掘能力就是国家、企业的核心竞争力。中国应该摘下千百年来差不多先生的标签,尽快赶上西方国家大数据的步伐。
大数据读书心得体会的评论条评论