《大数据时代》读书心得体会(推荐9篇)
《大数据时代》读书心得体会 篇1
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI最大的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。看完此书,我心中的一些问题:
1.什么是大数据?
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity--这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2.大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过
专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,5,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3.大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响最大的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
《大数据时代》读书心得体会 篇2
《大数据时代》这本书主要描述的是大数据时代到临人们生活、工作与思维各方面所遇到的重大变革。
文中清晰的阐述了大数据的基本概念和特点,并列出明确的观点。不管对于产业实践者,还是对于政府和公众机构,都非常具有价值。作者将本书分为3个部分。第一部分提出了大数据时代处理数据理念上的三大转变:抽样等于全体;要效率不要绝对精确;要相关不要因果;第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后一部分,作者描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。
引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20xx年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与20xx年、20xx年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事长马云通过大量数据分析得出20xx年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用, Farecast公司是一个成功的典型范例。该公司由奥伦·埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。Farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用Farecast票价预测工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。
也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。
文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。
关于不是随机样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的Xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。
作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(其语库来自于未经过滤的网页内容,会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误)
在不是因果关系,而是相关关系的篇章中。作者指出在大数据时代往往知道是什么要比知道为什么来的更实在。作者列举了林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的预测是大数据的核心。Aviva保险公司利用几百种生活方式的数据,如爱好、长浏览网页等间接的预测出哪些人更可能患高血压、糖尿病和抑郁症。UPS国家快递公司通过使用预测性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在预测方面的优势。
本书第二部分讲的是大数据时代的商业变革。
作者用莫里绘制导航图的例子告诉我们,远在信息数字化之前,对数据的运用就已经开始了。莫里利用大量的人力去分析多年保存的航海记录,他从这些大量的数据中获取到新的利用价值。绘制的图表帮助商人节约一大笔钱,使年轻的海员们间接获取了成千上万名经验丰富的航海家的指导。日本先进工业技术研究所越水重臣教授通过安装压力传感器将人屁股特征数据化,进而形成对乘客身份的特征识别。这项技术为汽车防盗系统提供了方案。公司,致力于为顾客预测商品的价格,通过收集处理海量的价格信息,预测准确率高达77%,帮助顾客在购买一个产品时节约了大约100美元。MasterCardd.Advisor部门通过分析来自210个国家的15亿信用卡用户的650亿条交易记录,分析得出商业发展和客户消费趋势,如通过分析发现如果一个人下午四点左右给汽车加油的话,他很可能在接下来的一个小时内去购物或者去餐馆吃饭 ,且在这一小时里大约花费35到40美元。商家正可以利用这个分析结果,在加油的小票背面附加上附近商店的优惠券。
这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。皮特.华登,Jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。
大数据成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。
文章第三部分讲了大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。包括如数据的收益的处理问题以及数据中用户资料的隐私和决策过程带来的影响。作者在保护个人隐私方面提出了几种想法。一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。作者同时也指出了这两种方式的难度。一方面收集到的数据可能会被后续的多次利用。另一方面,匿名化会在数据收集越来越多和数据的相互结合关联使用时变得无效。作者列列举电影《少数派报告》的情节说明越来越依赖数据时,大数据可能将我们禁锢在可能性之中。当然通过分析犯罪的常发地与常发时间,合理安排警力会对治安防范提供不小的帮助。作者还指出不能尽信数据的分析结果,因为不能保证获取分析结果来源的数据准确性。大数据在给我们生活提供便利的同时,也让隐私保护的法律手段失去了作用。我们必须杜绝对数据的过分依赖。
在高速迈进大数据时代的同时,人类信息管理准则需要重新定位,这将带动社会核心价值观的转变。大数据时代,对原有规范的修修补补已经不足以抑制大数据带来的风险。保护个人隐私就需要对个人数据处理器对其政策和行为承担更多责任。同时必须重新定义公正的概念,以确保人类行为的自由。作者提出了解决这些问题的方向。如个人隐私保护方面,可以让使用者承担更多的社会责任。将责任从民众转移到数据使用者有很多意义,也有充分的理由。因为他们更清楚将如何使用数据且是数据应用最大的受益者。关于公正方面简单的讲就是个人可以并应为他们的行为而非倾向负责。就像公司有内部会计和外部审计人员一样,大数据时代,公司将设置专门的人员--内部和外部算法师对大数据活动进行监督。还有可能出现第三方的机构对大数据行为进行监督和衡量。作者甚至考虑到对大数据存在的垄断情况进行分析并在反垄断反面给了建议。最后结语中作者提出大数据提供给人们的只是参考答案,提醒我们在利用这个工具时要铭记人类的作用是无法完全替代的。
大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交网站,购物网站等都掌握了用户的大量的数据信息。在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。
大数据时代读书心得体会范文6
“大数据”概念早在1980年就有国外的学者提出,可是最近几年才广泛受到大家的关注。当“大数据”这个概念传到中国的时候,瞬间引起了轰动。随即,各种有关“大数据”的资料和书籍充斥的我们的视野。随意打开某个电子商务平台图书类页面,在搜索框中搜索“大数据”三个字,就会出现好多本有关“大数据”的书籍。可是,有一个很有趣的现象就是:几乎所有的平台上,出现的第一本关于“大数据”的书籍一定是《大数据时代》。一点进去,这本书推荐栏里的第一句话就是:迄今为止全世界最好的一本大数据专著。同时,为这本书做推荐的都是各行业的精英领袖。所有“大数据”方面的书籍也是这本书销量最高,评价最好。
我从来不会因为哪本书畅销和很多人推荐就盲目跟风的去看一本书。因为我知道通常在这种情况下选择一本书,整个阅读的体会和感受是无法遵从自己的内心的,整个过程都很容易夹杂着别人对这本书的感受。所以通常我读书的节奏大多都是跟不上“潮流”的,但往往经过风雨洗礼之后沉淀下来的都是精华。坦白讲,阅读这本书的初衷并不是因为我想从书中获取到多少大数据方面的精华,只是很想知道对于这么一个很直白的名词,作者是怎么写出这么厚的一本书的。这种初衷或许很无知和幼稚,可就是这种“愚蠢”的好奇心,让我更透彻的看到书中的精华。
在看《大数据时代》这本书之前,我的所有读后感都是集中在书籍给了我什么思考。对于这本书的读后感,除了观点碰撞之外,我还会加上大部分个人看这本书的体会。因为这本书,已经完全让我模糊了大多数人口中的“全世界最好的书”是一种什么标准。也许《大数据时代》真的无法承载那么高的赞美!
大数据时代的入门书
看完这本书,我随意调查了一些阅读过这本书并且给这本书绝对好评的朋友。询问他们这本书好在哪里?大多数的回答是说《大数据时代》这本书让对大数据一无所知的他们了解了大数据这个概念,同时通过很多案例说明原来大数据能有这么大的用处,影响会有这么大!仅此而已。我看完这本书最大的感受是这本书分为上、下两部分。前120多页为上部分,后120多页为下部分。之所以说《大数据时代》是一本关于大数据的入门书,是因为这本书用了前面120多页的篇幅反复的强调大数据的出现对社会发展影响很大,并且要人们转变小数据时代惯有的思想。所以整本书的前半部分就强调大数据时代的三个转变:1、大数据利用所有的数据,而不再仅仅依靠一小部分数据,不再依赖于随机采样。2、大数据数据多,不再热衷于追求精确性,也不再期待精确性。3、大数据时代不再热衷于寻找因果关系,而是追求相关关系。所以整个上半部分没什么可详说的。我们重点聊聊本书的后半部分。
既然一直都在强调大数据对我们的意义,总要有具体体现。整本书中,我感触最大的一个案例就是某公司通过分析大数据发现:新品发布的时候,旧一代的产品可能会出现短暂的价格上涨。因为人们在心理上就认为新产品的推出,旧产品就会便宜,从而就会提高购买量。这个发现和我们平常的心理是完全违背的,而且如果不用数据来证明,直接讲道理给大家可能还是无法相信。这就是大数据对我们很多传统思维的颠覆。一旦涉及到思维的改变,往往就会引起整个社会的大变动。
大数据这个概念的出现,让大数据逐渐发展形成一条价值链。在这条价值链上,数据本身、技能和思维是最重要的环节。随着互联网技术的发展,越来越多的公司都能收集到大量的数据,这些数据也会越来越公开。可是在这些公司中,不是所有的公司都有从数据中提取价值或者用数据催生创新思想的技能。于是就会出现以下两种公司,一种是掌握了专业技能但不一定拥有数据或者提出数据创新性用途才能的公司,另一种就是拥有超前思维,懂得怎样挖掘数据的新价值的创新公司。短时间内,我们可能会感觉拥有创新思维,懂得挖掘出数据新价值的大数据思维是最重要的。可是等到产业成熟之后,所有人都知晓了大数据的意义,所有人便开始挖掘自己的大数据思维。同时,随着科技的进步,掌握大数据技术的也将成为常态。所以到后来,整个价值链的核心环节还是回到了数据本身。而到那时候,大数据的公开性也就越来越小。
在大谈完大数据对人类发展的积极意义之后,作者也考虑到大数据时代的风险。这一部分是作者脑洞大开的精彩之处,同时也是最荒谬的一部分。书中说大数据时代将要惩罚未来犯罪,这样可以在嫌疑人在可能犯罪之前就把犯罪行为给防止。这样的社会,大数据俨然已经延伸到了我们每个人生活的点滴。几乎我们在生活中所做的一切都在大数据的“监控”之下,我想到那时候,别说我们每个人的隐私已经没有的了,严重一点可以说是我们可能连人都不算了。在我们人的社会属性中,自由权利是一项很重要的指标。通过大数据惩罚人的未来犯罪已经否定了人的自由选择能力和人的行为责任自负。同时,由于数据是永久保存,大数据预测也是通过每个人之前的数据来判断,所以大数据同样也否定了人的求善心理。还有,从现在各种大数据预测的结果来看,很多发言人都说大数据不是百分百的准确。所以利用大数据来判断人的行为发展已经违背了大数据不追求精确性的特征,这也是书中自相矛盾的地方。
对于一个新事物,如果能让大家了解这个事物并且对此产生兴趣,这已经算是一本不错的入门书了。
大数据时代的心灵鸡汤
从小到大,鸡汤对于我们来说一直都挺珍贵的。身体虚弱了,喝点鸡汤能够补充营养。心灵受伤了,看点心灵鸡汤可以鼓舞人心。可是近几年,人们生活水平提高了,营养富余,鸡汤已经不是人们补营养的期待了。同样,心灵鸡汤也是如此。
心灵鸡汤其实是一个很虚伪的东西。很多人都被心灵鸡汤诱人的外表给迷惑。在我看来,心灵鸡汤很大的一个特征就是:立人的志,但是就不告诉你实现志的方法。很多人每次在失意的时候就喜欢看心灵鸡汤,希望能得到慰藉。看完后也觉得醍醐灌顶,感觉整个世界都亮了。但又有几个人想过喝完这些鸡汤之后你除了看似重拾梦想,你还获得了什么?你知道怎么去做吗?《大数据时代》就是这样一本书。整本书从头到尾都在向读者讲述大数据的意义,当然期间也会用相应的案例来证明大数据确实有这样的能力。但是,整本书从没有涉及到技术层面的问题。或许对于大数据这种依靠互联网技术的新事物,即使向读者讲技术,也没有几个人看得懂,可是整本书没有一点关于大数据思维的技能引导。给出的案例中只有少数案例向读者讲述了这个公司为什么要利用大数据来解决这种问题,大多数都只是告诉读者国外某家公司运用大数据得出了某种结论。同时,在本书中文译作者写的序里,强调自己翻译这本著作的一大优点是可以结合国内的案例来分析书中的理论,结果,看到最后一页都没有看到一个国内企业关于大数据运用的案例。
之所以我称之为“心灵鸡汤”,还有一个原因就是作者在书中大讲特讲的大数据的作用,事实上按照现在的经济发展水平和社会文明发展程度是很难实现的。书中很多时候的理论都是要建立在社会各项文明都发展健全的基础上才能实现。
大数据的“传销手册”
看到这个标题,大家可能会觉得我夸大其词,受到如此多人好评的书怎么是“传销手册”呢?对于这个表达,我只想说两点:1、此说法仅代表我个人观点,是否认同是个人问题。2、此说法主要针对本书的上部分。
我们都知道传销组织在发展下线的前期是要花大力气去培训的,也就是洗脑。而对于一个陌生又很难以理解的事物,最好的“洗脑”方式就是重复。《大数据时代》这本书就是运用这种方式,前半部分为了让读者能够接受“大数据”这个概念,作者反反复复提醒读者大数据不是随机采样、不追求精确和不寻找因果关系。同时用很多看似很通俗易懂其实看完后还是不知道说了什么的案例来让人信服大数据的作用。书中的后半部分虽然也是用这种方式来感染读者,可后半部分中作者的畅想和对大数据的威胁分析还是对读者有一些实质意义的,所以后半部分的“传销”影响就不是很重要。
大数据时代是未来的趋势,这谁都不会否认。大数据改造了我们的生活,改变着我们的世界。不管它是以一种什么样的姿态面向世界,它都没有错,因为大数据只是一种工具。但当人类开始质疑甚至恐惧大数据的时候,人类就该思考自己是否利用好这个好工具了。
《大数据时代》读书心得体会 篇3
《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点就在于作者利用上百个例子来对大数据的方方面面做了详细解说,让外行也很容易理解。结构上,作者通过大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰。
所谓"大数据",按作者的说法,就是"所有数据"。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低。在过去,由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差;统计结果往往不能重复使用,造成数据利用率低。而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。 "小数据"时代,一个样本的错误就可以造成对总体估计的失败,幸运的是,"大数据"时代对精确性不再那么要求苛刻——也无法要求太严格——数据的数量足以弥补这一缺陷。在对思维变革这一部分的阐述中,最重要也是全书的核心观点就是大数据时代,我们应该从追求"因果关系"的旧思维方式向追求"相关关系"转变。 在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者自己也说,"大数据的相关性将人们指向了比探讨因果关系更有前景的领域。"
大数据时代的数据获取方式是多种多样,数据形式也是千变万化,任何文字、行为、万物都可以被数据化后用来分析。对这些数据的利用,不仅要考虑到其初次使用价值,更要放眼它未来可能的用途以提高数据的利用率。当然数据并不是无限使用,时效、环境的变化肯定会对数据提出新的要求,所以数据的折旧也是应当考虑的。这又引出了对数据这一无形资产的估值可能性。对于Facebook, Twitter这样的公司来说,数据就是他们的核心,如何在资产负债表上给他们一个公正的体现正是我们需要考虑的。
大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司: 第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据早期,技能和思维最有价值,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘。这是假定了一个成熟的市场,人人都了解了大数据的用途。
对于普通人来说,大数据时代最关心的还是隐私问题。不知不觉中,个人的一举一动都暴露在政府甚至私人企业之下,还面临潜在的泄露风险。对此,作者提出了使用者承担责任的解决办法,而不是过去那种流于形式的使用授权。大数据甚至能预测一个人的犯罪动机,这给监管者带来的难题是,预测一个人要犯罪,惩罚还是不惩罚?在这点上,社会达成"个人仅需对行为而非动机负责"的共识非常重要。
大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这能在一定程度上防止数据滥用的发生和数据独裁。当今的法律亦需对大数据监管进行修订补充。
当代大数据发展主要由科技公司推动,相信在不久的将来更多的传统领域会意识到大数据的重要性。但我们也应该保持清醒,大数据并不是万能药,对某些领域或环节,使用大数据是一种简单且实用的选择;但对某些领域,盲目使用大数据只会适得其反。
《大数据时代》读书心得体会 篇4
《大数据时代》这本书主要描述的是大数据时代到临人们生活、工作与思维各方面所遇到的重大变革。
文中清晰的阐述了大数据的基本概念和特点,并列出明确的观点。不管对于产业实践者,还是对于政府和公众机构,都非常具有价值。作者将本书分为3个部分。第一部分提出了大数据时代处理数据理念上的三大转变:抽样等于全体;要效率不要绝对精确;要相关不要因果;第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后一部分,作者描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。
引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20 篇5
“大数据”概念早在1980年就有国外的学者提出,可是最近几年才广泛受到大家的关注。当“大数据”这个概念传到中国的时候,瞬间引起了轰动。随即,各种有关“大数据”的资料和书籍充斥的我们的视野。随意打开某个电子商务平台图书类页面,在搜索框中搜索“大数据”三个字,就会出现好多本有关“大数据”的书籍。可是,有一个很有趣的现象就是:几乎所有的平台上,出现的第一本关于“大数据”的书籍一定是《大数据时代》。一点进去,这本书推荐栏里的第一句话就是:迄今为止全世界最好的一本大数据专著。同时,为这本书做推荐的都是各行业的精英领袖。所有“大数据”方面的书籍也是这本书销量最高,评价最好。
我从来不会因为哪本书畅销和很多人推荐就盲目跟风的去看一本书。因为我知道通常在这种情况下选择一本书,整个阅读的体会和感受是无法遵从自己的内心的,整个过程都很容易夹杂着别人对这本书的感受。所以通常我读书的节奏大多都是跟不上“潮流”的,但往往经过风雨洗礼之后沉淀下来的都是精华。坦白讲,阅读这本书的初衷并不是因为我想从书中获取到多少大数据方面的精华,只是很想知道对于这么一个很直白的名词,作者是怎么写出这么厚的一本书的。这种初衷或许很无知和幼稚,可就是这种“愚蠢”的好奇心,让我更透彻的看到书中的精华。
在看《大数据时代》这本书之前,我的所有读后感都是集中在书籍给了我什么思考。对于这本书的读后感,除了观点碰撞之外,我还会加上大部分个人看这本书的体会。因为这本书,已经完全让我模糊了大多数人口中的“全世界最好的书”是一种什么标准。也许《大数据时代》真的无法承载那么高的赞美!
大数据时代的入门书
看完这本书,我随意调查了一些阅读过这本书并且给这本书绝对好评的朋友。询问他们这本书好在哪里?大多数的回答是说《大数据时代》这本书让对大数据一无所知的他们了解了大数据这个概念,同时通过很多案例说明原来大数据能有这么大的用处,影响会有这么大!仅此而已。我看完这本书最大的感受是这本书分为上、下两部分。前120多页为上部分,后120多页为下部分。之所以说《大数据时代》是一本关于大数据的入门书,是因为这本书用了前面120多页的篇幅反复的强调大数据的出现对社会发展影响很大,并且要人们转变小数据时代惯有的思想。所以整本书的前半部分就强调大数据时代的三个转变:1、大数据利用所有的数据,而不再仅仅依靠一小部分数据,不再依赖于随机采样。2、大数据数据多,不再热衷于追求精确性,也不再期待精确性。3、大数据时代不再热衷于寻找因果关系,而是追求相关关系。所以整个上半部分没什么可详说的。我们重点聊聊本书的后半部分。
既然一直都在强调大数据对我们的意义,总要有具体体现。整本书中,我感触最大的一个案例就是某公司通过分析大数据发现:新品发布的时候,旧一代的产品可能会出现短暂的价格上涨。因为人们在心理上就认为新产品的推出,旧产品就会便宜,从而就会提高购买量。这个发现和我们平常的心理是完全违背的,而且如果不用数据来证明,直接讲道理给大家可能还是无法相信。这就是大数据对我们很多传统思维的颠覆。一旦涉及到思维的改变,往往就会引起整个社会的大变动。
大数据这个概念的出现,让大数据逐渐发展形成一条价值链。在这条价值链上,数据本身、技能和思维是最重要的环节。随着互联网技术的发展,越来越多的公司都能收集到大量的数据,这些数据也会越来越公开。可是在这些公司中,不是所有的公司都有从数据中提取价值或者用数据催生创新思想的技能。于是就会出现以下两种公司,一种是掌握了专业技能但不一定拥有数据或者提出数据创新性用途才能的公司,另一种就是拥有超前思维,懂得怎样挖掘数据的新价值的创新公司。短时间内,我们可能会感觉拥有创新思维,懂得挖掘出数据新价值的大数据思维是最重要的。可是等到产业成熟之后,所有人都知晓了大数据的意义,所有人便开始挖掘自己的大数据思维。同时,随着科技的进步,掌握大数据技术的也将成为常态。所以到后来,整个价值链的核心环节还是回到了数据本身。而到那时候,大数据的公开性也就越来越小。
在大谈完大数据对人类发展的积极意义之后,作者也考虑到大数据时代的风险。这一部分是作者脑洞大开的精彩之处,同时也是最荒谬的一部分。书中说大数据时代将要惩罚未来犯罪,这样可以在嫌疑人在可能犯罪之前就把犯罪行为给防止。这样的社会,大数据俨然已经延伸到了我们每个人生活的点滴。几乎我们在生活中所做的一切都在大数据的“监控”之下,我想到那时候,别说我们每个人的隐私已经没有的了,严重一点可以说是我们可能连人都不算了。在我们人的社会属性中,自由权利是一项很重要的指标。通过大数据惩罚人的未来犯罪已经否定了人的自由选择能力和人的行为责任自负。同时,由于数据是永久保存,大数据预测也是通过每个人之前的数据来判断,所以大数据同样也否定了人的求善心理。还有,从现在各种大数据预测的结果来看,很多发言人都说大数据不是百分百的准确。所以利用大数据来判断人的行为发展已经违背了大数据不追求精确性的特征,这也是书中自相矛盾的地方。
对于一个新事物,如果能让大家了解这个事物并且对此产生兴趣,这已经算是一本不错的入门书了。
大数据时代的心灵鸡汤
从小到大,鸡汤对于我们来说一直都挺珍贵的。身体虚弱了,喝点鸡汤能够补充营养。心灵受伤了,看点心灵鸡汤可以鼓舞人心。可是近几年,人们生活水平提高了,营养富余,鸡汤已经不是人们补营养的期待了。同样,心灵鸡汤也是如此。
心灵鸡汤其实是一个很虚伪的东西。很多人都被心灵鸡汤诱人的外表给迷惑。在我看来,心灵鸡汤很大的一个特征就是:立人的志,但是就不告诉你实现志的方法。很多人每次在失意的时候就喜欢看心灵鸡汤,希望能得到慰藉。看完后也觉得醍醐灌顶,感觉整个世界都亮了。但又有几个人想过喝完这些鸡汤之后你除了看似重拾梦想,你还获得了什么?你知道怎么去做吗?《大数据时代》就是这样一本书。整本书从头到尾都在向读者讲述大数据的意义,当然期间也会用相应的案例来证明大数据确实有这样的能力。但是,整本书从没有涉及到技术层面的问题。或许对于大数据这种依靠互联网技术的新事物,即使向读者讲技术,也没有几个人看得懂,可是整本书没有一点关于大数据思维的技能引导。给出的案例中只有少数案例向读者讲述了这个公司为什么要利用大数据来解决这种问题,大多数都只是告诉读者国外某家公司运用大数据得出了某种结论。同时,在本书中文译作者写的序里,强调自己翻译这本著作的一大优点是可以结合国内的案例来分析书中的理论,结果,看到最后一页都没有看到一个国内企业关于大数据运用的案例。
之所以我称之为“心灵鸡汤”,还有一个原因就是作者在书中大讲特讲的大数据的作用,事实上按照现在的经济发展水平和社会文明发展程度是很难实现的。书中很多时候的理论都是要建立在社会各项文明都发展健全的基础上才能实现。
大数据的“传销手册”
看到这个标题,大家可能会觉得我夸大其词,受到如此多人好评的书怎么是“传销手册”呢?对于这个表达,我只想说两点:1、此说法仅代表我个人观点,是否认同是个人问题。2、此说法主要针对本书的上部分。
我们都知道传销组织在发展下线的前期是要花大力气去培训的,也就是洗脑。而对于一个陌生又很难以理解的事物,最好的“洗脑”方式就是重复。《大数据时代》这本书就是运用这种方式,前半部分为了让读者能够接受“大数据”这个概念,作者反反复复提醒读者大数据不是随机采样、不追求精确和不寻找因果关系。同时用很多看似很通俗易懂其实看完后还是不知道说了什么的案例来让人信服大数据的作用。书中的后半部分虽然也是用这种方式来感染读者,可后半部分中作者的畅想和对大数据的威胁分析还是对读者有一些实质意义的,所以后半部分的“传销”影响就不是很重要。
大数据时代是未来的趋势,这谁都不会否认。大数据改造了我们的生活,改变着我们的世界。不管它是以一种什么样的姿态面向世界,它都没有错,因为大数据只是一种工具。但当人类开始质疑甚至恐惧大数据的时候,人类就该思考自己是否利用好这个好工具了。
《大数据时代》读书心得体会 篇6
4月13日下午,在湖南大学东楼205参加了关于《大数据时代》的读书交流活动。通过相互交流学习,使我更深层次的理解了大数据时代的利与弊,机遇和挑战。在写心得体会前,我想再重新审视一下关于大数据的历史沿革和现实意义。
首先,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数 据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后又IT行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、物联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业IT架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。
其次,进入20xx年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。正如《纽约时报》20xx年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
最后,随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……,截止到20xx年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,20xx年全球产生的数据量为0.49ZB,20xx年的数据量为0.8ZB,20xx年增长为1.2ZB,20xx年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到20xx年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了20xx年,全世界所产生的数据规模将达到今天的44倍。
首先,谈谈大数据带给生活的转变。大数据已经是信息产业发展的必然趋势,可以说,大数据现在已经开始慢慢渗透入我们的生活,如:现在流行的打车软件、三维立体化社区的建立、某些从事生产销售的行业利用大数据来优化规模和实现利益最大化。而我们很多人对大数据还很陌生,只是被动的适应着大数据给生活带来的改变。大数据时代是以云计算为基础的,所以,要实现大数据,相关的很多的硬件设备都要更新换代,信息处理系统、信息传输系统、信息反馈系统、信息决策系统都将面临新的挑战,相关产业都要重新调整产业结构,在那时,可以夸张的说,信息就是黄金,信息就是石油。大数据时代的到来会解放更多的劳动生产力,势必将会更加加剧生产力过剩的现状,社会两极分化现象会更加明显,掌握不了信息资源,很难再翻身,要防止信息垄断带来的可怕局面。大数据时代的到来会使人们的生活节奏急速加快,信息的时效性决定了它的流通速率,人们的生活节奏要跟上信息流通的速率,就不得不加快自己的节奏,人们会越来越忙,到那时,就像现在的日本,可能想找个人听你说说话,真的是一件很难的事。
第二,关于数据管理的看法。大数据时代,数据管理是一件很重要的工作,如何才能避免自己的数据被非法窃取、丢失和被盗?我的看法是,人防、技防、物防一体化。人防,即我们要从思想上牢固树立信息安全防范的意识,不主动泄露信息,要管理好自己身边的信息设备;技防,就是要运用软件来管理和处理数据,经常检查更新数据库,定时查杀电脑病毒,确保电脑状况安全;物防,就是重要的数据一定要备份保留,而且应当做到备份与原始文件是物理隔离,无关的信息应当及时删除,减轻硬盘的压力。
三、怎么保护自己的隐私。隐私,顾名思义,就是不愿意让别人看到的东西,所以,在大数据时代,更要管理好自己的隐私,以免对自己和家人造成麻烦和损失。越是隐私的信息,越要远离网络,不要再公开的社交网络储存和展示个人图片、资料等信息,免得被非法人士采用和窃取。建议还是用纸质的日记代替电脑日记,避免信息传播范围太大,管理好自己的日记本。研发一种新的硬件连接器,总是以随机码来保护自己真实IP地址,提高网络安全的可靠性,加强对联网信息的管理和保护。
不论我们情不情愿,大数据时代都会到来,现实社会是我们高喊着走向大数据时代,其实大数据时代已经向我们走来,所以与其被动接受,不如主动学习,从中找到自己的出路,成为大数据时代的建设者和受益者。
《大数据时代》读书心得体会 篇7
未来的十年,将是大数据引领下的智慧科技时代。不管你是否意识到它的存在,大数据都将越来越快地改变我们这个时代,包括我们的生活方式。
维克托·迈尔-舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一。他通过一个大家熟知的事例,来帮助我们理解“大数据”的潜在影响力,那就是四个世纪之前望远镜和显微镜的发明。望远镜能够让我们感受宇宙,显微镜能够让我们观测微生物,它们都是收集海量数据的新工具,因为这种工具的发明,人们同步更新了分析数据的技术和方法,促进了人们对世界更好的理解。如果说望远镜和显微镜是测量领域中的一场革命,那么今天的数据测量就相当于是现代版的望远镜、显微镜。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富,以及更多的传感设备、移动终端接入到网络,由此产生的数据及数据的增长速度比历史上的任何时期都要多、都要快。一个大数据的时代,不经意间顺理成章地翩然而至。
一、什么是大数据?
大数据是当前最热门的话题之一。但什么是大数据,人们尚未给出确切的定义。首先,“大数据”是相对过去小的、局部性的数据而言的;其次,利用大数据进行分析和工作时,所依据的关于此事尽可能完整的数据,从而“一览众山小”,而不是采用局部的小数据,从局部推断整体。
维克托也并未直接给出大数据的定义。不过,他用三大转变描述了大数据的特性:
转变之一:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。例如一项针对相扑比赛中非法操纵比赛结果的研究对64000场比赛进行了分析,这算不上一个很大的数字,但由于这是过去十年所有的比赛,所以它是大数据。
转变之二:由于有了更多的数据,我们可以接受更多的混杂、更多数据上的不精确。如果我们对于一个事物只有50个数据点,那么每一个数据点都必须非常精确,因为每个数据点都是有用的;但是如果我们有5000万个,去掉10个,甚至去掉1000个都没有太大的问题。
转变之三:不再探求难以捉摸的因果关系,转而关注事物的相关关系。分析大数据主要为了预测未来“是什么”,而不是“为什么”。因为很多时候我们以为我们找到了事情背后的原因,实际上却没有找到。更多时候知道了“是什么”就足够了。例如知道流感将会扩散到哪里就足够了,我不需要知道为什么;知道什么时候在网上购买机票能够获得最优惠的价格就足够了,我不需要知道为什么此时价格最低。
二、大数据带来的变化
大数据从根本上改变我们认识世界和改变世界的方式。很多传统的习惯将被颠覆,很多旧的制度将面临挑战。举例来说:
第一,科学探究的思路和方式受到挑战
探究是新课程改革中的一个热词,是促进学校教学与科学研究相融合的实践举措。科学探究的基本路径是:发现问题,提出假设,制定方案,实践探究,分析数据,得出结论。之所以会梳理出这样一个探究的路径,与我们对问题知晓的信息过少有关。换句话说,对所要研究的事物,我们知道的数据很少,需要从这些很小的数据出发,通过猜想和假设,进行试探性的研究,如果研究得出的结果和自己的假想是一致的,则说明我们的假说是正确的,这些假说会上升为对该事物描述的知识,我们掌握该事物的数据也随之增加。
利用测量所获得的点滴数据,从一个局部来推测世界是怎样的,这是科学探究的基本思路和方式。长期以来,我们总是通过这样的方式来认识世界,对其有宗教般的信仰。尽管我们知道,决策者总是先有了想法,才会提出假设。如果决策者自身对所研究的事情存在着偏见,所提出的假设就很难得到实证的支持,这往往会导致探究花费了很长的时间、很大的物力和财力,也常常劳而无功。但科学研究者还是坚定不移地沿着这条道路前行,学校在教学中也将其作为科学研究的基本规范来传授。
在大数据时代,这样的研究方式收到了极大的挑战。先举个事例来说吧。手机辐射是否能够致癌?关于这个问题,无论我们的假设如何,实验的设计都很难进行。首先,样本选择过少,没有统计学上的意义;其次,不能拿人做研究对象;第三,短时间的研究很难观察到变化。有了大数据之后,这样的难题就可以迎刃而解了。前段时间,丹麦就进行了这样的研究。丹麦拥有1985年手机推出以来所有手机用户的数据库。他们从这个数据库中分析了1990年至20xx年拥有手机的所用用户的数据,同时,他们还收集了这一期间医院收集的所有癌症患者的数据,然后分析手机用户是否比非手机用户有更高的癌症发病率。这两个数据库本身是完全独立的,在作分析之前从来没有想过可以做这样的研究。结果表明,使用移动用户和癌症风险增加之间不存在任何关系。20xx年10月,这一研究的结果发表在《英国医学杂志》上。
上述的案例告诉我们,在获得了大量的数据,能够对事物的整体进行全面的认识之后,假想就没有意义了,我们可以直接根据全面的数据做出结论。
《大数据时代》读书心得体会 篇8
信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变„„我们这样评论着的信息时代已经变为曾经。如今,大数据时代成为炙手可热的话题。笔者在这说明信息和数据,只是试图首先说明信息、数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?大数据时代带给了我们什么?
信息和数据的定义。维基百科解释:信息,又称资讯,是一个高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有统一的定义,但是信息具备客观、动态、传递、共享、经济等特性却是大家的共识。数据:或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类。数据指计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。从定义看来,数据是原始的处女地,需要耕耘。信息则是已经处理过的可以传播的资讯。信息时代依赖于数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。这是否是《大数据时代》一书所未曾阐述的背景材料?
在《大数据时代》一书中,大数据时代与小数据时代的区别:1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。
数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力„„可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
《大数据时代》读书心得体会 篇9
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了Google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的H1N1的爆发地与传播方向以及可能的潜在患者的事情。Google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时Google的预测与政府数据的相关性高达97%,这也就意味着Google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本<总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了IBM追求高精确性的电脑翻译计划的失败与Google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系Google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以Google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。