注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

杨鸿智-后现代理论医学博客

《后现代医学》、《正反馈医学》、《自体原位器官重构技术》

 
 
 

日志

 
 
关于我

这是一个宣传后现代理论医学的博客.后现代理论医学是以系统理论为指导的新医学.该理论认为,在生命组织中干细胞是决定机体功能状态最基本的因素.通过调节机体内环境和为干细胞提供再生所需要的物质和能量,就可以使干细胞在患者体内原位再生,实现器官重构,使器质性病变得到治疗.现在,已经在北京医药信息学会内成立了后现代理论医学专业委员会,杨鸿智是主任委员.

网易考拉推荐

(8)大数据的认知框架  

2013-07-15 20:25:43|  分类: 干细胞病 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

8)大数据的认知框架

2013-03-22 15:28

赵国栋/易欢欢

清华大学出版社

 

提要:

 

1.“三大发展趋势、六种商业模式”是本书解读大数据的认知框架。

 

2.“数据成为资产”是最核心的产生趋势,以数据资产为核心演绎出租售数据、租售信息、数据使能、数字媒体、数据空间运营和大数据技术提供商六类商业模式。

 

3.围绕数据资产,产业间拉开融合、分立的大幕。具体到信息产业内部,表现为靠近最终用户的公司,在产业链拥有越来越大的发言权。携用户优势,具备向产业链上游逆向整合的潜力。同时产业链上游企业则积极向下游拓展。整体上呈现垂直整合趋势。

 

4.泛互联网化是积累数据资产,形成竞争壁垒的重要范式。大型公司如苹果、谷歌、亚马逊都是泛互联网化范式的典型公司。这也是有小型公司发展壮大的契机和路径。

 

资本市场观察大数据的态度是中立的,最基本的出发点是要识别哪些是真正创造价值的公司,而哪些又是“挂羊头,卖狗肉”骗股东、股民钱的“坏人”。所以必须深入到细节、必须洞察未来趋势、必须提出自己完整的理论和模型,不能人云亦云。说白了就是练好一双火眼金睛,给妖精们当头一棒,让取经人拿到真经。

 

2011 9 月份,我们注意到业界在大数据领域的发展动向后,随即开始了系统的调研分析,先后走访了IBM、甲骨文、EMC、微软等行业巨擘,和国内A 股上市公司、领风气之先的互联网公司、各大咨询机构、高校、研究所充分交流。连续发布了三篇大数据专题研究报告,持续跟踪海内外大数据领域的进展,逐步形成了相对完整的认知框架。此框架最早发布在券商报告《大数据时代三大发展趋势和投资方向》中,几经修改,如图1-12所示。

 

围绕数据和最终用户,笔者观察到信息产业的发展具有三大趋势:第一,数据成为资产;第二,行业垂直整合;第三,泛互联网化。数据成为资产,更强调数据的战略意义;行业垂直整合趋势在数据运用层面,通过搜集大量的用户数据,更贴近用户,更理解用户,为其提供更适当的服务;泛互联网化驱动大数据飞轮效应的第一步,是收集数据的重要渠道,没有泛互联网化的应用软件和硬件设备,公司就难以获得用户的行为数据。三大趋势的提出,拓展了大数据主题的研究范围,开辟了新的视角和逻辑来观察信息产业内公司成长路径和投资价值。成为我们分析研究的顶层逻辑的要素之一。

 

数据成为资产

 

数据成为资产是本书的重点内容和华彩章节,第三、四、五章都与数据资产内容相关。数据已经成为工业化与信息化深度融合的关键枢纽,成为推动产业融合兼并的战略资产,成为各地方城市转换发展思路的新思维,成为推动公司跨行业转型的根据地,成为数学与工程实践结合的最佳演练场。

 

在信息时代,数据将成为独立的生产要素。有人把“数据”比喻为工业时代的石油,但笔者认为“数据”和农耕时代“土地”的属性更加接近。如果企业拥有某类相对完整、全面的数据,退可偏安一隅,进可跃马中原。

 

谷歌、Facebook、亚马逊这三家互联网巨头,积累了不同的数据资产。谷歌为全世界的公开网页建立了最为庞大的索引;Facebook 拥有的社交网络,积累了全世界最为庞大的人际关系数据库;亚马逊网站上沉淀了大量的商品信息,成为互联网上最为庞大的商品数据库。不同的数据资产,决定他们不同的战略选择和商业模式。他们在某种程度上,甚至取代了IBM、微软等传统的老牌巨头,在引领产业的发展方向。

 

拥有独一无二的数据资产的公司,将会获得难以置信的发展的速度,发育出令人叹为观止的商业模式。事实上他们具备了颠覆、冲击其他行业的压倒性优势。除了上面提到的互联网巨头外,本书中还谈到了雅昌公司的案例。这家从传统印刷行业起步的公司,通过年复一年、日复一日的漫长积累,形成了人类历史上空前的“艺术品数据库”。凭借这些数据资产,雅昌涉足出版、展览、收藏、移动互联网、线下实体博物馆等多个行业。其未来亦难以估量。

 

行业垂直整合

 

第二大趋势是行业应用的垂直整合。如图1-13 所示,新兴产业往往是以垂直整合的态势开疆拓土,但产品成熟后,产业链上专业分工则激发出惊人的创造力,并且成本也逐渐降低,优势逐渐转向水平分工格局。但是当下,信息产业中行业垂直整合趋势明显,是大数据效应改变产业竞争格局的一个缩影。了解这个趋势,可以解释很多公司的成长逻辑。真真是“三十年河东,三十年河西”。在这个趋势下,越靠近终端用户的公司,在产业链中拥有越大的发言权。微软的股价十年横盘,苹果股价却一飞冲天,两大巨头之间的恩恩怨怨此起彼伏是这个趋势最好的注脚。

 

过去大家计算机,关注的是CPU 主频、内存、操作系统等;现在入手iPad,直观感受是酷不酷,没有人问iPad CPU 是几个核。这标志着消费者的关注重点已经迁移到产品能否满足自身的个性化需求。在企业级市场也一样有相同的趋势,不要讲你的数据库、主机又出了什么新功能。客户更多会问,你们能不能满足我业务的需要?这个趋势的出现有两大原因:第一,通用的平台型软件逐渐同质化;第二,用户对自身业务的关注超过了对计算能力的追求。

 

其实很多人都没有意识到软件同质化①的问题。笔者观察到,几乎每个大型的商业软件都有对应的开源软件,而且这些开源软件的功能和性能也已经可以满足大部分客户的需求。在第六章列了一张开源软件和商用软件的对比表,以及开源软件的统计数据。此处不赘言。需要提醒的是,谷歌、Facebook 这种世界级的平台,其核心技术架构都是开源软件唱主角。开源软件的兴起和繁荣客观上也加剧了软件的同质化。在这个趋势下,拥有大量的客户,了解客户业务需求的公司,将会迎来一波大的发展机遇。

 

行业应用垂直整合的内容在第六章展开论述。

 

泛互联网化

 

在讲述泛互联网化趋势时,提炼了一个重要思想——泛互联网化范式。在和产业界人士交流的过程中,笔者反复强调大数据并非只是大型公司的游戏,小公司、传统企业也一样可以搞得精彩纷呈。泛互联网化范式,为其提供了现实可行的理论基础;亦是目前为止,实现大数据战略的最佳实践。

 

在泛互联网化范式中,强调终端、平台、应用“三位”加上“大数据”这“一体”,如图1-14 所示。这四个方面都可以成为盈利的主要来源,但是,如果要取得竞争先机,则需要明确,主要靠哪部分盈利?需要补贴哪个方面?甚至在不同的发展阶段,盈利的主体也不尽相同。根据公司主要盈利来源的不同,可以把简单归类成五种模式,分别是强终端模式、强应用模式、强平台模式、强数据模式、以及混合模式。

 

泛互联网化范式,批判工业时代的标准化思维,指出利用科技手段碎片化应用,满足用户个性化需求才是王道。应用的碎片化,恰恰可以解决标准化产品和用户个性化服务间的矛盾。泛互联网化内涵非常丰富,以碎片化为例,事实上不仅仅应用呈现碎片化趋势,服务、内容都可以碎片化适应新型媒介需求。譬如,教育如何满足人们利用零星时间学习知识的渴望呢?限于本书的篇幅,仅在第七章来阐释,先给出范式框架,再通过与各行各业的深度交流,不断补充发展。本书第二版将会补充这部分内容。

 

提醒读者注意的是,传统企业如果灵活运用泛互联网化范式,往往能取得意料之外的高速增长。说一句很玄的话,“运用之妙,存乎一心。”

 

六种商业模式简述

 

围绕数据资产,我们考察不同行业的盈利方式和经营策略,归纳总结了六种商业模式。

 

1)租售数据模式:简单来说,就是售卖或者出租广泛收集、精心过滤、时效性强的数据。这也是数据成为资产的最经典的诠释。按照销售对象的不同,又分为两种类型:一是作为客户增值服务,譬如销售导航仪的公司,同时为客户提供即时交通信息服务;二是把客户数据有偿提供给第三方,典型的如证券交易所,把股票交易行情数据授权给一些做行情软件的公司。

 

2)租售信息模式:一般聚焦某个行业,广泛收集相关数据,深度整合萃取信息,以庞大的数据中心加上专用传播渠道也可成为一方霸主。信息指的是经过加工处理,承载一定行业特征的数据集合。

 

3)数字媒体模式:这个模式最性感,因为全球广告市场空间是5000 亿美元,具备培育千亿级公司的土壤和成长空间。这类公司的核心资源是获得实时、海量、有效的数据,立身之本是大数据分析技术,盈利来源多是精准营销和信息聚合服务。

 

4)数据使能模式:这类业务令人着迷之处在于,如果没有大量的数据,缺乏有效的数据分析技术,这些公司的业务其实难以开展。譬如,阿里金融为代表的小额信贷公司,通过在线分析小微企业的交易数据、财务数据,可以计算出应提供多少贷款、多长时间可以收回等关键问题,把坏账风险降到最低。

 

5)数据空间运营模式:从历史上来看,传统的IDC 就是这种模式,互联网巨头都在提供此类服务,但近期网盘势头强劲。从大数据角度来看,各家纷纷嗅到大数据的商机,开始抢占个人、企业的数据资源,海外的Dropbox、国内的微盘都是此类公司的代表。这类公司的发展空间在于可以成长为数据聚合平台,盈利模式将趋于多元化。

 

6)大数据技术提供商:从数据量上来看,非结构化数据是结构化数据的5 倍以上,任何种类的非结构化数据处理都可以重现现有结构化数据的辉煌。语音数据处理领域、视频数据处理领域、语义识别领域、图像数据处理领域都可能出现大型的高速成长的公司。

 

 

 

数据科学——改变探索世界的方法

2013-03-22 15:34

赵国栋/易欢欢

清华大学出版社

 

提要:

 

1.越来越多的事物不断的数字化。使得人们可以从大量的数据中,发现隐藏的自然规律、社会规律和经济规律。从这个角度来看,大数据将拓展人类的视野。

 

2.大数据给科学和教育事业的发展提供了前所未有的机会,同时也提出了前所未有的挑战。它将对现有的科研和教学体制带来大幅度的变革,对科学与产业之间的关系、科学与社会之间的关系带来大幅度的变革。

 

深入思考大数据带来的颠覆性的影响,其根源就是越来越多的事物数据化了。图像、声音、人类的情绪和基因组,看起来风牛马不相及。但是信息科技的发展都把他们神奇地变成了“0”、“1”的不同组合,也就是“数据”。

 

当网页变成数据,谷歌具备了令人大跌眼球的全文搜索能力,在几个毫秒之内,就能让人们检索世界上几乎所有的网页。当方位变成数据,每个人都能借助GPS 快速到达目的地。当情绪变成数据,人们甚至根据大家快乐与否判断股市的涨跌。这些不同的数据可以归结为几类相似的数学模型,从而使得“数据科学”成为一门具备普遍适用性的学科。譬如生物信息学、计算社会学、天体信息学、金融学、经济学、电子工程等学科,都依赖数据科学的发展。

 

事实上,数据科学还带给大家观察世界的新方法——从大量的数据中,揭示世界运行的规律。2008 年《连线》杂志主编克里斯?安德森①就指出“数据爆炸使所有的科学研究方法都落伍了”,用一系列的因果关系来验证各种假设和猜想的研究范式已经不实用了,如今它已经被无需理论指导的纯粹的相关关系研究所取代。安德森指出:“现在已经是一个有海量数据的时代,应用数据已经取代了其他的所有学科工具。而且只要数据足够多,就能说明问题。如果你有一拍字节的数据,只要掌握了这些数据之间的相关关系,一切就都迎刃而解。

 

安德森的观点引起轩然大波,但是的确值得深入思考。从牛顿力学到量子力学,科学家们建构了精巧的模型,原则上来讲几乎可以解释日常所有的自然现象,量子力学提供了研究化学、材料科学、工程科学、生命科学等几乎所有自然和工程学科的基本原理。但是狄拉克①指出,如果以量子力学的基本原理为出发点去解决这些问题,那么其中的数学问题太困难了。如果人们利用更为简单的数学模型,利用大量的数据则可以得到在工程实践中完全可行的结果。

 

人们在研究自然语言处理方面走过的弯路,为安德森的观点提供了有利的证据。20 世纪50 年代,几乎所有的科学家都认为如果让计算机来充当翻译,就必须像人一样,让他理解词句的含义。于是提出人工智能的概念,让计算机来学习的人类的各种规则。这种方法很快在70 年代走到了尽头。但是基于大量数据、运用概率模型的统计语言学的出现使得自然语言处理柳暗花明。如果没有这些概率统计模型,风靡一时的Siri(个人语音处理)等应用,就不可能实现。

 

本书第九章将系统的阐述大数据给科学和教育事业提供的前所未有的机会。我们将指出,第一,数据科学将成为科研体系中的重要部分,并逐渐达到与包括物理、化学、生命科学等学科在内的自然科学分庭抗礼的地位。第二,数据科学研究和市场、产业有着密切的联系。在数据科学领域,从科学原理的发现到产业化所花费的时间远远短于传统科学的领域。第三,数据科学同样和人们的日常生活、与社会紧密关联。

 

 

  评论这张
 
阅读(236)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017