【冬吴相对论】第347期:大数据(上)

    片花一:大数据涵盖了哪些海量信息?为什么说大数据时代人类所有无意识的生产和消费行为都是以生产数据为底色的,也都是可以被挖掘、化验、分析和解读的?这将对人类的社会生活方式产生怎样的影响?读书在未来社会为什么会成为一种行为艺术?什么是反馈经济?大数据时代,你在你的服务商面前为什么是没有隐私的?欢迎收听冬吴相对论,本期话题 --《大数据(上)》

    片花二:大数据的核心为什么是从因果性到相关性思维模式的变革?什么是黑箱理论?在大数据时代,为什么我们不用探明事物之间的因果关系,仍发现事物之间的相关关系就可以预知未来,解决问题?大数据是怎样提高公共事务的决策效率的?什么是啤酒尿布效应?大数据时代的商家为什么总能准确地发现消费者的隐形需求?欢迎继续收听冬吴相对论,本期话题--《大数据(上)》

    下载【冬吴相对论】第347期:大数据(上).mp3

    播出时间:经济之声2013-03-3011:30-12:00

    主 讲 人:吴伯凡 主 持 人:梁 冬

    梁冬:坐着打通经济生活任督二脉,大家好,欢迎收听《冬吴相对论》。我是梁冬,对面依然是《21世纪商业评论》发行人吴伯凡,伯凡你好!

    吴伯凡:大家好!

    梁冬:最近因为我们在做诊所的时候,就开始发现,后台的这个数据系统和这个IT系统很重要,于是开始在做一些研究。正好一个朋友,就是做某一家公司的CFO,后来跳槽去了一家医疗软件系统。于是我就想去问问他,结果聊下来突然发现他正在做一件很重要的事情,他在做什么事情呢?他把他们的这个软件,就是医院的管理软件卖给不同的医院。我觉得这个东西本来就是软件行业做的事情嘛,但是他说,假如今年正好流行一个病,比如说SARS又来了,有一百家医院接到了这个东西,但是就有两家医院最先接到。而且那个量一下上起来之后,也许他就会很快的根据这个后台的数据,他们作为后台的运营商,就会知道哪些流行病突然会起来,提前的他可以反馈给其他的医院,作为预警。第二,在一百个医院里面总有5%的医院,治疗效果是比较好的,如果允许的话,他可以把后台的解决方案变成是一个基本的知识,给拷贝到其他地方去。再有一个,就是任何一个病人在不同的医院就诊的时候,如果他是有一个随身携带的关于这个人的ID卡,在不同医院看病治疗,他都会形成一个巨大的一个永远跟随的一个数据库,这也是很有趣的。所以我觉得说,他告诉我的,这就是所谓的大数据时代的一个思考模式。

    吴伯凡:嗯。在过去很早,几十年前,你看病都要有一个病历,这个病历上面还写几个字,我记得,什么个人病历注意保存。原因就是你以前的各种各样的就诊、用药的一些信息,治疗的整个过程,它都记录在这上头。然后后来的医师,通过看你这个病历,他就能够看到你现在这个病的来龙去脉。这也是一种小数据,就是针对于个人的那种小数据。但现在的医疗、还有金融,包括天气,它现在都进入了一个大数据时代。这个大数据是什么意思呢?就是说,海量的,我们过去没办法想象的那种数据。我们对这个大数据这个大,可能不容易理解。这么说吧,在2013年这一年,据预测整个地球上互联网流通的这个数据,如果把它刻成光盘的话,那么把它码成五堆,每一堆的高度相当于地球到月亮的距离。

    梁冬:换句话来说,就是五倍于地球到月亮的数据,如果连成一条线的话。

    吴伯凡:对对对,把这些数据印成书的话,这些书就铺在地上可以铺52个美国,这叫大数据。以前我们人类是不可能想象有这么多的数据的。在印刷术没有发明以前,那么人类能够有的信息是非常少的。书也就是那几本,比如说《圣经》这个原意就是书的意思——Bible,就是书的复数形式。《圣经》它不是一本书,是多本书汇集而成的,就叫书,很多书而已。你可以想象那个时候人们心目中书就是那一本书。

    梁冬:地球上的书都形成差不多,你看《论语》,本质上跟《圣经》差不多,是吧?就今天发生的事儿,老师怎么说。

    吴伯凡:在印刷术没有发明以前,它就没有这个书的爆炸,后来这个书就爆炸了。每年,我们中国一年出的书,都是十几万种,二十万种,且不说每一本书它要印多少万册,是吧?但现在的书,记录的这个数据这个信息,它这个份额越来越小,从7%下降到2%,大量的都变成数字化的了。

    梁冬:就是未来读书,就跟现在我们听京剧一样,那是一个很奢侈、很高级(的事)。现在还有人装腔作势地跑去听《牡丹亭》,是吧?其实就跟以后有个人装腔作势的拿本书一样,那是一个奇怪的行为,那是行为艺术。这个事情很可能在我们有生之年能看见——老吴,你能想象吗?

    吴伯凡:就像说我们现在在地铁里看见一个人拿着那个竹简的书一样,那就带有很强的行为艺术的特征了。

    梁冬:到时候看你们《21经济报道》那些报纸,乃是上古时期的人才看的了。你刚才举的这个例子,就是包括互联网上的数据,是吧?而且现在还有个数据是我们没有意识到的。比如说,我们觉得我们在手机上看到一个东西,这个是一个信息,但是你在哪里看,你在什么时间看,因为你的行为本身而产生的数据,变成了更重要的一个东西。

    吴伯凡:对,你是谁,你在哪里看,你在什么时间看,你先后看过几次,你甚至是跟谁分享过。所有这些东西,你是在无意识状态下,你在生产数据。这种叫反馈经济,现在有个说法,就是信息出来,然后你再进行反馈,而且是无意识的反馈。

    梁冬:就是你在窗边看风景,看风景的人在看你。

    吴伯凡:嗯,对。现在就是这样一个时代,就在被动无意识状态下,生产数据。

    梁冬:而且最近还有一个很有意思的东西,大家可能都没有意识到。就是中国移动不是在介入所谓的金融行业嘛,包括中国电信和中国联通,都在和各个金融机构在合作,什么意思呢?就电子钱包,以后很可能就是你的手机就是一个“嘟嘟卡”,进门禁的也是“嘟”那么一个东西,seveneleven买东西也是“嘟”那么一下,你坐地铁也“嘟”那么一下,都用手机去“嘟”。这就是意味着很可怕的数据啊,你的电话号码本也是云端存储的,你的每一个行为也被“嘟”了一下,是吧?

    吴伯凡:对,你每天都在早请示、晚汇报,不仅是早请示、晚汇报,每一刻你在睡梦中也在制造数据,这种马上要推出来这种可佩戴终端,就那个手表,它是24小时跟踪你的,你睡眠的状况,你甚至做没做梦,做梦多长时间,都有可能反馈到这个云端去。

    梁冬:对,这还是一个比较原始的,在不久的将来,是吧?你做了什么梦,都会反馈到终端。老吴,啊——真是睡无葬身之地,哈哈。

    吴伯凡:像书,这样是一个典型的亚终端。所谓亚终端就是说,它不提供反馈的,你看这个书看多少遍,别人也不知道。但是你看电子书,你使用一个电子的服务,你使用一个APP,你每次使用的过程它都是在记录,生产数据。而且它可以被分享,可以被挖掘,可以被分析,可以被解读。就是人类所有的生产行为,它的底色背景都是在生产数据,甚至不是生产行为,你消费行为也是在生产数据。这就产生了一个我们以前完全没法想象的,就是大规模,无时无刻,无处不在的制造、生产、分享数据的这样一个过程。

    梁冬:这也就令到那些在后面,隐隐的、远远的掌握所有这些无意识数据的人的那种价值就会出来。最近不是出了一个新闻嘛,就是这个360被《每日经济》报道,报道了一个什么事呢?具体它报道的对不对,还是说像360说的是个抹黑,或者《每日经济》报道认为的,那不是我们了解的,我们在旁边没有办法作判断,既不能证实,也不能证伪。但是从常识上来说,不是360可以做这个事,我认为所有的互联网公司大一点的,都(在)技术上是可以干这个事的。

    吴伯凡:我发现这个在信息时代是很有意思,只要你攻击别人,你把别人当靶子,你立即就会成为靶子。

    梁冬:这话在《圣经》里面是有什么对应的话吗?

    吴伯凡:没有。不要论断他人,你如何论断别人我将如何论断你。

    梁冬:这是《圣经》里面这样说吗?哇,看来年轻时读点古书还是有点道理。稍事休息,马上继续回来,坐着打通经济生活任督二脉,《冬吴相对论》。

    片花:大数据涵盖了哪些海量信息?为什么说大数据时代,人类所有无意识的生产和消费行为都是以生产数据为底色的,也都是可以被挖掘、化验、分析、和解读的?这将对人类的社会生活方式产生怎样的影响?读书在未来社会为什么会成为一种行为艺术?什么是反馈经济?大数据时代,你在你的服务商面前为什么是没有隐私的?欢迎收听《冬吴相对论》,本期话题——“大数据”之上期。

    梁冬:坐着打通经济生活任督二脉,大家好,欢迎收听《冬吴相对论》。我是梁冬,对面是老吴。老吴刚才讲到一个话题,就是由于大数据时代来临了,于是就引申了最近关于360这个事情,我们不判断360到底有没有做什么,但是从常识上来说,我认为不光是360,几乎所有的大的互联网公司都可以干360被描述成那样的事情。

    吴伯凡:这次就是说,你像那个食品安全问题,每一次关于食品安全的案例,都是对国人的一次化学知识的普及,是吧?我们学会了很多化学名词,三聚氰胺、苏丹红等等。这次关于网络安全的,也相当于一次科普。

    梁冬:全民科普,它是微信推出来的,瞬间三亿多人全部看到了,是吧?

    吴伯凡:对。我参加了几次会议以后,我发现,就所有针对360的指责其他公司都可以做,而且我看到的各方面材料好像也都在做。就你在你的服务商面前没有太多的秘密的。

    梁冬:完全脱光了,真的。你想想看嘛,我们每天用中国移动打电话,是吧?或者中国联通,中国电信,无非就这三个,是吧?再用微信,用微博,然后你还用银行刷卡,道路导航那个系统。这几个数据一锁定,哇……

    吴伯凡:所以大数据,它往往跟隐私联在一起。是因为这个大数据它能够有一种技术,能够从这个数据里头进行分析和“化验”,打引号的“化验”。比如说我们喝水的时候,我们不知道这是H20,我们身上有什么样的“多巴胺”又是什么,各种各样的东西,我们自己是不理解的,我们自己是不知道它的化学成分。

    梁冬:用而不知嘛。

    吴伯凡:日用而不知。但是有本事的人,有本事的机构,他是能够进行化验的,他是能够解读你的。所有你会在无意识状态下透露出许许多多的你不愿意告诉别人的东西,殊不知你已经告诉了。所谓隐私,其实是你不愿意让别人知道的信息。所谓侵犯隐私权,就是主动的用各种手段,获知别人……

    梁冬:不愿意告诉你。

    吴伯凡:不愿意告诉你的信息。你发现这个现在隐私的边界,变得非常模糊了。这背后也是大数据时代的一个逻辑。

    梁冬:我以前不太了解,中医说望闻问切,说这个人看一下之后,大概就知道这个人得什么病。我以前觉得这些都是骗子,后来跟着一些中医看吧,我发现有一些老中医,他一看,大概就知道这个人得什么病,而且开的方子真的有效的时候呢,我就在问这是为什么。他说,很简单。比如说,一个人长得肝经火旺的,青筋暴露,然后又很瘦,通常这个人可能胃有问题,或者肝火旺。而且因为以前他有治过跟这个长得差不多得病人,而且也治好过了。所以他看这个人,他就基本上判断跟这个差不多,再做一些其他的数据的检测。他就很快就能够换算出来,这个人的体质和他的现在的身体的状况。

    吴伯凡:最近看这个《大数据时代》,就那个维克多•迈尔•舍恩伯格写的这本《大数据时代》里头,他就说这个背后是一个很重要的哲学问题。为什么说这是一个哲学问题呢?就我们过去都是在探知各个事物之间的因果关系。对这个因果关系了解以后,我们去利用它,我们去解决问题。我们学了化学,我们知道一个化学方程式,我们就可以去用它去生产化肥或者是医药。就在大数据时代,它是根据一些相关性,它不是因果性,这两个是很不一样的。我们以前节目里头也讲到过,比如说“雄鸡一唱天下白”。它是个相关性,它不是个因果性。公鸡一叫,哎,天亮了。公鸡很自恋,会认为自己把那个天给叫亮了。它不是因果关系,它是一个同步关系,是一个相关性。就是说,在一个事情发生之前的一些事件,如果它反复地出现,这种关联性反复地出现,我们就用不着去了解,他们之间是不是存在一种因果关系,或者这个因果关系的机理是什么,我们不清楚。但是我们就直接根据这两个事件之间的关联性,一旦出现前面的一个事件,或者一个信号的话,我们可以推论后面的,它因为它是反复出现的。

    梁冬:对。所以就是很多现在朋友都这样说,在一个聚会上,如果几个陌生人,突然谈起来他们都在听《冬吴相对论》,那么基本上都是爱知识、善良的人。难道听《冬吴相对论》就是一个原因,善良、有知识是结果吗?不是。是因为《冬吴相对论》和善良、有知识的人它形成了某种相关性。他本身就是这个人,跟听不听我们没关系,只不过它具有相关性。所以你讲的这个话题,其实本质上就是说我们要突破简单的因果思考律。

    吴伯凡:嗯!如果你在农村里头生活久了你就知道这跟农谚,农民用的那些谚语,那个是很管用的。

    梁冬:你每次都在我面前炫耀你的农村生活,太讨厌了。哈哈……

    吴伯凡:我跟你说吧,要下雨了,那时候又没有天气预报,那个农民他根据很多迹象,他没有那些技术,气象学,他不懂这些。他就是凭这个农谚叫“蚂蚁搬家蛇过道”。就是蚂蚁开始搬家了,蛇突然从路的这边到那边去,“燕子低飞蛤蟆叫,大雨不久会来到”。就是这几个迹象,燕子低飞,这个还真灵,就是前不久,我去了那个一趟西双版纳。我们下午准备搞一个露天的一个晚会,搭了那个台子……

    梁冬:哈哈哈,也不说上午搞一个露天晚会呢?呵呵。

    吴伯凡:我们就傍晚的时候,就准备那个露天晚会。

    梁冬:就跟我们以前广院里有个校歌,就是,“校园的大路两旁,有一排年青的白杨”,哈哈。多么脑残的句子啊,大路两旁,有一排白杨,哈哈。下午搞了一个篝火晚会,来来,继续说。

    吴伯凡:准备搞一个晚会,就在那儿我就看见那些工人们在忙碌,在搭台子,在搞各种各样的弱电设备、音频视频的。但是我就无意当中看见旁边的,就那些燕子飞来飞去,飞来飞去。我说这不对啊,可能要下雨。他们旁边人说,你可别开玩笑,说下雨我们就惨了。我说这个燕子飞得这么低,可能要下雨。

    梁冬:呵呵,这个农一代太高级了。哈哈……

    吴伯凡:结果这真是我们那天,我们就没有……

    梁冬:没搞成。

    吴伯凡:那个晚会真没搞成,劈头盖脸一顿把我们这个晚会就给取消了。

    梁冬:所以以前我们总是说有些人是巫师,他有预言的能力。其实很可能,就是以前有一些人,他琢磨,他建立关联性,他不见得知道因果。

    吴伯凡:实际上我们现在,你仔细分析因果也是能够分析出来的。但是农民一般他不分析这个因果,他只知道,燕子低飞有可能就要下雨,蚂蚁搬家就要下雨。如果这几个因素都合在一起,那就极可能要下雨。这个原因经你后来分析,燕子为什么低飞,是因为湿气重了,气压低了,那个空气就比较潮湿了,那个昆虫的翅膀,变潮湿了以后,它飞不高。

    梁冬:低空飞。

    吴伯凡:贴近地面的地方飞。那燕子它要去捕食它们的时候,它显然也要低空的飞,这是个因果关系。但是我们很多时候,发现一个迹象跟另外一个迹象之间背后的那个因果关系太复杂了,没法获知。

    梁冬:但是你不知道因果,你也可以用它。

    吴伯凡:可以用它,这叫“黑箱”。就是说,你给出一个命令,那边一个结果,黑箱里头是怎么运行的,你是不清楚的。

    梁冬:你知道这个在中国古代有一句话叫“取类比象”,说你看到的那个燕子低飞,蛤蟆叫,那叫“象”,它是一个现象。

    吴伯凡:其实气象就是这样来的。

    梁冬:气的象。你要借由这个象去推那个气,我们称之为叫“气象”。稍事休息,马上继续回来。坐着打通经济生活任督二脉《冬吴相对论》。

    片花:大数据的核心为什么是从因果性到相关性思维模式的变革?什么是黑箱理论?在大数据时代,为什么我们不用探明事物之间的因果关系,只要发现事物之间的相关关系就可以预知未来,解决问题?大数据是怎样提高公共事务的决策效率的?什么是啤酒尿布效应?大数据时代的商家为什么总能准确地发现消费者的隐性需求?欢迎继续收听《冬吴相对论》,本期话题——“大数据”之上期。

    梁冬:坐着打通经济生活任督二脉,大家好,欢迎收听《冬吴相对论》,我是梁冬,对面依然是《21世纪商业评论》发行人吴伯凡,老吴你好!

    吴伯凡:大家好!

    梁冬:之前我们提到的一个话题,就是说从大数据时代里面,我们发现了一种有趣的哲学命题。就是说,以前我们受过严格科学训练的人,总是想要知其然而知其所以然。讨论一件事情的前因和后果,似乎过多的认为两个事物之间,存在着因果律。但其实两个事物之间很可能不见得是因果律,而是相关律。

    吴伯凡:背后有一系列的非常复杂的因果关系,但是我们看不到,我们只知道这个结果。两个事件之间的一个……

    梁冬:关联性。

    吴伯凡:一种关联性。

    梁冬:而不是因果性。

    吴伯凡:那么,而不是因果性。这是这本书里头,《大数据时代》它认为从因果关系到相关关系的思维变革才是大数据的核心。

    梁冬:这就是我对中医所谓的“象”思维的最重要的思考。很多人都说中医不科学,的确中医很多地方不科学,或者是不能用以往我们所理解的科学去理解。但是我现在越来越有信心的原因就是说,因为中医它是建立在一种所谓的生活经验层面上的,当然它有它后面的逻辑,未必能够被现代的很多的科学主义所认同。但是,毕竟有很多民间中医,他知道说,哎,当你得了这个病之后,我拿这个药。我也不知道什么原因,反正嚼烂了之后,贴上去它就能好,是吧?它就变成了一个关联关系。

    吴伯凡:相关关系。在《大数据时代》这本书里头举了很多的例子,比如说“流行病学调查”。这个词我最早听到是在十年前。就SARS的时候,就天天在说流行病学调查。这个调查我当时在想,这个调查很危险的一件事情,你深入到一线去调查,这非常危险的。而且这个数据到底准确不准确也是很难说的。它的覆盖范围要非常的广,要不然你可能是以偏概全,你弄出来的一个数据好像是言之凿凿,实际上是一个幻觉。还有就是说,调查的时候挺危险的,你想那个时候,中央电视台那个柴静为什么出名啊?是因为在SARS期间嘛……

    梁冬:哦,是吗?

    吴伯凡:她就能敢出生入死的去做各种各样的新闻调查,那还不是流行病学调查。但是现在由于大数据的技术越来越发展的话,我们就可以有一种新的方式来做这样的调查了。比如说在美国的药店系统是很发达的,而且这些药店联网,因为它要跟医院联系起来,因为好多医院它是不准卖药的。它不像我们中国。

    梁冬:诊所你卖的是服务,你就收那个诊金,是吧?药店卖的是药。

    吴伯凡:对,我们是以药养医嘛。

    梁冬:这是中国当今医疗制度改革最核心的问题。

    吴伯凡:对对,他们是不允许的,在美国是很严格地分离的,它几权分离的。在医疗领域里头,就你开药方的人跟最后卖药的,它是两个利益主体。所以,医院、药店还有药……

    梁冬:保险公司。

    吴伯凡:保险公司,因为最后付款的是保险公司。他们之间的数据联通得非常好而且反应特别快。这样就意味着在某一天,如果出现数据上的一个异常,它在全国都能反映出来。就是一般在大型的流行病出来的前两周。比如说感冒,某些局部已经开始感冒骤增了。因为流行病它不是说突然,几点几分流行病来了,它是一个缓慢的一个过程,由慢到快的一个过程。在此之前,在整个这个数据系统上,是可以看到那个东西的。它的相关性,是能够看到的。

    梁冬:那个叫正在发生的未来。

    吴伯凡:嗯,对。这就是一种智能,是一种新的智能。它跟人工智能还不一样,就人工智能是有意地去设计一些智能,设计这个人工智能的人,他对里头的机理他是要清楚的。但是大数据透露出来的某种珍贵的信息,它是无意当中透露出来的。在流行病学调查里头,它的作用非常大,那政府的办事效率它就大得多。我们搞流行病学调查,一般都是只能是这个病流行起来了,我们开始去关注它,我们在开始在搜集数据,也有用,但是它用处已经是远不如防患于未然在那个未然状态的……

    梁冬:这就是我节目刚开始的时候说到的,我的那个朋友,现在在做这个医疗软件系统的动因。因为以前他们是卖软件的,就是像比尔•盖茨他们都是卖软件的公司,是吧?其实某种程度上是卖一个所谓的软件版权。但是现在当它变成一个云服务的时候,它可以把后台的终端数据和前端一个客户每天生产的这些数据之间进行比照,随着它的系统规模越来越大,它就能够更有效的采集流行病的这个趋势,并且对治疗方法也可以进行某种的瞬间的排比优选。我觉得这个事情,如果它变成了一个全国联网的一个巨大的系统的话,那么基本上来说,很多的疾病可以在很早期的时候就被予以了解并且控制。

    吴伯凡:对。大数据的特点,就是说我们以前的调查都是抽样调查。它现在是全数据调查,全体性数据,而不是抽样性数据的调查。第二它是以前强调是精准,我们一定要搞明白这个因果关系。而大数据它是强调一个效率,就像我看见那个燕子低飞了,我就知道,哎哟,要下雨了。用不着去翻书,认真的研究整个下雨的来龙去脉,它就强调的是一个决策的效率。

    梁冬:这个相关关系,它带来了某种程度的预测。

    吴伯凡:所以它的本质,大数据的本质,它都带有预测的这种特点。由此我想到原来我们好像又回到了……

    梁冬:原始社会。

    吴伯凡:对,有一点点。就是说……

    梁冬:你会发现说,原始社会的很多特征重新在我们这个时代回来了,社区。

    吴伯凡:过去叫部落。

    梁冬:部落化。对吧?第二个就是类巫型的东西,这个巫师可能自己也不知道是什么原因,但是他可能做出某种的判断。现在的一个数据分析师,他也不见得知道这个原因,但是他可以根据相关性……

    吴伯凡:他不是一个医生,他知道流行病要发作了。过去是医生才能这样说的,是吧?在远古时代,最有地位的就是那些巫师。他有时候是瞎猜的,有时候是一种长期在这种环境里头,他培养了一种对潜信息、隐信息高度的敏感。

    梁冬:还有一个就是他的老师,可能告诉了他一些相关性的观察方法。因为我在学中医的过程当中,我的老师教给我的就是你怎么样能够把那些大家觉得不相关的事情建立起某种关联性。

    吴伯凡:对,这个就是到大数据时代让它开始又显现了,它是个螺旋式上升。“回归”是打引号的,它是一种在更高层面上的“回归”,这叫螺旋式。比如说,以前我们说的啤酒尿布效应,为什么啤酒的销量跟尿布的销量它相关性那么大。可能你最后反反复复地研究才知道,它们之间为什么有这种关联。

    梁冬:其实这个东西在以前,在一个小小的系统里面,比如说,你是沃尔玛的这个收银系统,你可以每天把每一个客户的单子都打一遍,对之进行比照。你会发现,超过百分之五十的人买了啤酒的人还同时也买了尿布。你会觉得它这个相关性很高,你可以把相关性作各种的加权,透过这种数据的回归,你建立某种的曲线比类关系,这个就是典型的统计回归的方法。

    吴伯凡:对,过后你再来研究因果关系你是可以把它往后推,但是你不知道这个因果关系的时候你也可以用这样一种相关性。因为这后来,大家研究出来了,才知道为什么会有相关性,是因为就一般的情况下买尿布……

    梁冬:男人去买。

    吴伯凡:就小孩尿湿了,家里头的那个尿布都没得换了的时候,妻子是需要照顾孩子的,这个时候丈夫就必须要去买尿布。一般男人是不爱逛超市的,超市对他们有吸引力的地方就是啤酒。他就是买尿布的时候,他顺手他就要买啤酒,这个因果关系是后来才发现的。

    梁冬:所以,你研究过吗?在超市,SevenEleven这样的店,在收银台前面卖哪几个东西,它为什么这几个东西放在那里,它是有相关性的。

    吴伯凡:对啊,口香糖和保险套,是吧?

    梁冬:对啊。

    吴伯凡:这个它很神秘,说起来很神秘。在美国,这是一个真事儿。有一天,有一个人,就跑到这个Target,就是美国另外一家像沃尔玛这样的大型超市。对这个商店的人破口大骂,说你们简直胡闹,给我17岁的女儿发送那个婴儿用品的这些信息,你们简直是胡来,你不是让小孩学坏嘛。但过了一个月以后,那个人来道歉了,他的女儿果然怀孕了。原因是因为女孩,她怀孕以后,她买东西就是,第一个月、第二个月、第三个月,她如果这些商品它都关联……

    梁冬:有一个序列的话。

    吴伯凡:有一个序列的话,紧接着她就会去买婴儿用品。

    梁冬:婴儿用品,呵呵。

    吴伯凡:它这是数据里头显示的,所以它发现他的女儿已经开始买前面这几样东西的时候,它就给她推送。

    梁冬:就换句话来说,商店Target比你爹更了解你女儿。所以我们今天这个话题,用三十分钟左右,讲到这个大数据时代来临,它所产生的剧烈的变化。核心关键点就是说,我们要从一种简单的对因果关系的思考转换到对相关关系的思考。也许我们很多时候会发现你根本不知道它的因果关系,但是你也可以利用相关数据之间的关联性,洞察一些隐秘的联系,然后为你所用,慢慢以后你也许可以发现它的原因是什么。如果你不能发现,但也不能够妨碍你可以去站在神一样的角度思考这个问题。好了,感谢大家收听今天的《冬吴相对论》,我们下一期同一时间,再见!



    返回列表 百拇医药 杜义华 2012-2015年