《大数据时代》01 什么是大数据?

网上有关“《大数据时代》01 什么是大数据?”话题很是火热,小编也是针对《大数据时代》01 什么是大数据?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。

今天我们第一本解读的是《大数据时代》这本书。

大数据是这几年特别火的一个词,那究竟什么是大数据呢?

字面意思可以理解为大数据就是数量巨大的数据,而这些巨大的数据再结合云计算、人工智能、物联网等技术会对于我们的生活、工作都会带来翻天覆地的影响。

芝加哥大学商学院教授、麦肯锡公司创始人,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

而我们今天所讲的这本《大数据时代》是国外大数据研究的先河之作,本书作者舍恩伯格被誉为“大数据商业应用第一人”。舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。对于身处于大数据时代额我们可谓是会产生异常极大的思维方式的变革。

舍恩伯格最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

下面我们就进入到《大数据时代》这本书中去吧。

首先来看第一个话题大数据的思维变革

大数据与三个重大的思维变革有关,而这三个转变是相互作用的。

一.不是随机样本,而是全体数据

解释一下就是分析事物相关的所有数据,而不是仅仅依靠分析少量的数据样本。

二是不是精确性,而是混杂性

就是要接受数据的纷繁复杂,而不再追求准确性。

三是不是因果关系,而是相关关系

即不再追求难以摸索的因果关系,转而关注事物的相关关系。

这三个在大数据时代思维变革的转变我们会在接下来节目中一一讲解。

今天我们这一节先讲解:不是随机样本,而是全体样本,这一思维的变革。

小数据时代的随机抽样

为什么这么说呢?在我们过去技术并不发达的时候,只能用少量数据来进行随机采样是最高效的方式,即利用最少的数据来获取更多的信息。

在19世纪时美国的人口普查中,因为数据的变化超过了当时的人口普查统计分析能力,有人提出到数据无比庞大时可以进行有目的的选择,具有选出代表性的样本是最恰当的方式,这就是随机抽样。并且还非常有见解的提出:采样分析的精确性是随着采样随机性的增加而大幅的提高与样本的数量增加关系并不大,也就是说,随机采样样本的随机性比数量的多少更为重要。

而在当时,政府确实也采用了随机调查的方式来对于经济和人口进行了200多次小规模的调查,除此之外,在商业领域也会采用随机调查的方式来抽取部分商品来检查商品的质量安全。

随机抽样取得了巨大的成功,成为了现代社会,现代测量领域的主心骨,但这只是一条捷径,是不可能收集和分析全部数据情况下的选择,他本身就有很多的缺陷。

随机抽样的缺陷

第一,它的成功依赖于采样的绝对随机性,但在实现中绝对的随机性是非常困难,一旦分析过程中存在任何“偏见”,分析结果就会相去甚远。

第二,随机采样不适宜用于考察此类别的情况,也就是说随机抽样,一旦继续细分错误率会大大增加,比如说你想调查大学生玩手机的情况,您采取的调查结果可能会有3%的误差,但如果又把这个调查结果根据性别地域、收入来进行细分,那结果就会变得更为不准确。

因此当人们想要了解更深层次的细分领域的情况,采用随机采样的方法显然是不可取的,在宏观领域起作用的方法,在微观领域上失去了作用,随机采样就像是模拟照片,打印再远看会是非常不错,但是一旦聚焦在某个点,就会变得模糊不清。

全部数据的采样方式

现在我们正在步入了大数据时代,我们需要一中新的数据采集模式----全数据模式,即样本等于总体。

我们这个时代收集数据,并不像过去那样困难,手机导航、社交网站、微博、微信这些随时随地或主动或被动的收集你所产生的信息,并且通过计算机就可以轻而易举地完成数据处理。

采取全部数据的采样方式,可以不用考虑随机抽样所考虑的随机性,并且在细分领域也会发挥极大的作用,一个很好的例子,就是日本国民体育运动相扑之中所产生的非法操控比赛结果。

相扑比赛和其他比赛有所不同的就是选手需要在15场比赛之中的大部分场次获得胜利,才能保持排名和收入。这样一来就会出现收益不对称的情况,比如说一个7胜7负的选手,遇到一个8胜6负的选手,比赛结果对于第一个选手会比对第二个选手更为重要。列维特和达根发现在这种情况下,需要赢的那个选手,最可能会赢,这是为什么呢?有没有可能是选手的求胜心呢?当然有可能,但并不是完全!有数据显示需要赢的选手,求胜心,也只能把胜率增加25%。并且对于数据进一步分析发现,选手如果帮助上一次失利的一方的话,当他们再次相遇时,对方会回报回来。

这种情况在相扑界是显而易见的,但若是随机抽样就无法发现这个情况。而大数据通过分析所有比赛,用极大的数据来捕捉到这个情况。

还有关于大数据应用的例子是:2009年,谷歌公司将5000万条美国最频繁的检索词条和美国疾控中心在2003年至2008年季节性流感传播实际数据进行比较,成功预测了甲型H1N1流感的出现。

现在2021年,利用大数据来预测新冠肺炎的发展情况,已经成为我们日常新闻报道的一部分了。

在大数据时代的到来,让我们可以利用技术,从不同角度更细致的观察和研究数据的方方面面,使我们的调查更为精准。

回顾一下我们这一节所讲的过去的调查是采用小部分的数据来进行抽样调查,这一方法有显著的缺点

首先是抽样分析依赖于采样的随机性,而一旦数据出现”偏见“,结果便会大相径庭

第二抽样分析也只适用于宏观分析,对于更加微观的调查结果并不理想。

如今的技术环境已经有了很大的改善,在大数据时代进行抽样分析就是在汽车时代骑马一样,我们要分析与事物相关的而所有数据,而不仅仅是少量的数据。

以上就是我们本期全部内容,下一期我会讲到大数据时代下思维变革的后两个思维变革。

我的节目首发平台是公众号“悦读深入思考”关注还有更多内容

大数据其实就是海量资料巨量资料,这些巨量资料来源于世界各地随时产生的数据,在大数据时代,任何微小的数据都可能产生不可思议的价值。

要理解大数据时代的定义,首先需要明确大数据的定义,大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。

大数据的三个特征,分别是规模大、运转速度快及数据多样性。通过对这三个方面的研究,不仅可以更容易的观察到数据的本质吗,有利于软件处理平台的有效运转。

关于“《大数据时代》01 什么是大数据?”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!

本文来自作者[左丘文浩]投稿,不代表盛龙号立场,如若转载,请注明出处:https://m.snlon.net/sn/30956.html

(107)

文章推荐

  • 皖北是什么地方

    网上有关“皖北是什么地方”话题很是火热,小编也是针对皖北是什么地方寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。问题一:皖北包含哪些城市[编辑本段]1.皖北区域安徽省淮河以北的县市以及跨淮的县市,包括安徽省的合肥、宿州、淮北、亳州、阜阳、蚌埠、淮南七市的

    2025年10月01日
    178305
  • 珠海小众文艺景点

    网上有关“珠海小众文艺景点”话题很是火热,小编也是针对珠海小众文艺景点寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。 在珠海生活的人,周末总想找一些文艺的景点去拍拍照,那么有哪些小众景点适合拍照的呢,下面我们一起来看看吧。珠海小众文艺景点推荐

    2025年10月13日
    174312
  • 金丝熊怎么养

    网上有关“金丝熊怎么养”话题很是火热,小编也是针对金丝熊怎么养寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。金丝熊是仓鼠的一种,原产叙利亚、黎巴嫩、以色列等地,1938年引入美国后才正式成为宠物分类,二十世纪九十年代在中国浙江建德等地引种饲养,性格较暴躁,毛

    2025年10月13日
    235317
  • 北京餐馆北京十大老字号饭店

    网上有关“北京餐馆北京十大老字号饭店”话题很是火热,小编也是针对北京餐馆北京十大老字号饭店寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1、北京有多少家餐馆:2、北京小吃店有哪些3、北京十大顶级餐厅排行榜北京有多少家餐馆:北京有14998家餐馆.。根据查询相

    2025年10月21日
    157318
  • 穿衣镜放什么地方合适

    网上有关“穿衣镜放什么地方合适”话题很是火热,小编也是针对穿衣镜放什么地方合适寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。穿衣镜是我们大部分家庭里面都会准备的一种产品,因为人们在出门之前都要检查一下自己仪容仪表,看看自己今天的装扮是否怪异,或者自己的装扮是

    2025年11月22日
    143304
  • 去疤痕的简单方法是什么?

    网上有关“去疤痕的简单方法是什么?”话题很是火热,小编也是针对去疤痕的简单方法是什么?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一般来说,我们的皮肤受伤之后都是会结疤的,而这些疤痕如果裸露在外是非常影响美观的,所以很多人就希望能够将自己身上的疤痕给去掉,

    2025年12月29日
    97301
  • 枣庄国资委是干什么的

    网上有关“枣庄国资委是干什么的”话题很是火热,小编也是针对枣庄国资委是干什么的寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。枣庄市委宣传部文秘科员401010112600枣庄市委宣传部普通管理科员40101021900枣庄市委政策研究

    2026年01月16日
    85311
  • 教程分享“微乐好友房怎么让系统发好牌”(详细开挂教程)

    【无需打开直接搜索;操作使用教程:1、界面简单,没有任何广告弹出,只有一个编辑框。2、没有风险,里面的黑科技,一键就能快速透明。3、上手简单,内置详细流程视频教学,新手小白可以快速上手。4、体积小,不占用任何手机内存,运行流畅。微乐家乡麻将免费开挂详细了解请添加《》(加我们微)1、用户打开微乐家乡

    2026年02月12日
    64310
  • 实测教程“微乐卡五星开挂下载安装”(免费)开挂辅助教学(最新辅助开挂教程)

    1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自动连接,用户只要开启软件,就会全程后台自动连接程序,无需用户时时盯着软件。 3、安全保障,使用这款软件的用户可以非常安心,绝对没有被封的危险存在。 4、快速稳定,使用这款软件的用户肯定是土豪。安卓定制版

    2026年02月17日
    52305
  • 行测申论满分多少

    网上有关“行测申论满分多少”话题很是火热,小编也是针对行测申论满分多少寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。国家公务员考试,行测和申论各满分100分,行测考试时间为2个小时,申论考试时间为3个小时;省考每个省份情况也会有所不同,以陕西为例,行测和申论

    2026年02月21日
    34313
  • 真实辅助“微乐麻将挂试用一天”(免费)开挂辅助教学(最新辅助开挂教程)

    了解更多开挂安装加图片二维码是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐跑得快万能开挂器通用版下载可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义大贰小程序系统规律,只需要输入自己想要的开挂功能,一键便可以生成出大贰小程

    2026年02月28日
    101312
  • 真实辅助“微乐捉老麻子开挂教程”(免费)开挂辅助教学(最新辅助开挂教程)

    >>>您好:,软件加微信【添加图中QQ群】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的,添加客服微信【添加图中QQ群】安装软件.1、起手看牌2、随意选牌3

    2026年03月05日
    29317

发表回复

本站作者才能评论

评论列表(3条)

  • 左丘文浩的头像
    左丘文浩 2025年12月25日

    我是盛龙号的签约作者“左丘文浩”

  • 左丘文浩
    左丘文浩 2025年12月25日

    本文概览:网上有关“《大数据时代》01 什么是大数据?”话题很是火热,小编也是针对《大数据时代》01 什么是大数据?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,...

  • 左丘文浩
    用户122508 2025年12月25日

    文章不错《《大数据时代》01 什么是大数据?》内容很有帮助