注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

杨鸿智-后现代理论医学博客

《后现代医学》、《正反馈医学》、《自体原位器官重构技术》

 
 
 

日志

 
 
关于我

这是一个宣传后现代理论医学的博客.后现代理论医学是以系统理论为指导的新医学.该理论认为,在生命组织中干细胞是决定机体功能状态最基本的因素.通过调节机体内环境和为干细胞提供再生所需要的物质和能量,就可以使干细胞在患者体内原位再生,实现器官重构,使器质性病变得到治疗.现在,已经在北京医药信息学会内成立了后现代理论医学专业委员会,杨鸿智是主任委员.

网易考拉推荐

(9)大数据面临的挑战和机遇  

2013-07-15 20:29:07|  分类: 干细胞病 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

9)大数据面临的挑战和机遇

2013-03-22 15:38

赵国栋/易欢欢

清华大学出版社

 

提要:

 

1.大数据将强烈冲击人们的观念,旧有僵化思维将导致公司在竞争中落了后手。片面地、孤立地、静止地看待大数据都是缺少大数据思维的典型特征。

 

2.大数据时代“自主版权”将退居次席。信息技术本身的重要性让位于数据资产的重要性。

 

3.数据治理必须提到重要的地位,宏观层面国家解决“数据割据”问题需要顶层设计;企业则需要在“数据孤岛”间架起桥梁;微观层面则需要注重“数据质量”,包括数据的正确性、完整性、一致性。

 

4.目前缺少必要的法律法规界定数据资产的归属和使用,客观上存在发挥数据资产商业价值与侵犯个人隐私之间的矛盾;缺少大数据人才,缺少系统的学科建设亦是制约大数据发展的关键因素。

 

大数据概念刚刚提出,有人击节赞叹,认为“数据人”的春天到了,也有人质疑为炒作,认为不过是业界和资本市场又一次发神经而已;但更多的人是茫然的,并不知道这个概念对自己的业务意味着什么。本节主要澄清一些概念和误读,探讨大数据落地存在的障碍。

 

重新审视“自主版权”

 

大数据时代,产业重心发生了迁移。信息产业的重心由基础软件向应用软件过渡,信息技术本身的重要性向数据资产的重要性过渡。而应用软件领域,恰恰是中国软件企业的强项。利用好开源的基础软件,实现在应用软件领域的突破,带动基础软件领域的进步,是中国信息产业的发展方向。

 

“智慧出,有大伪”。多少人假“自主版权”之名,却从未超越开源软件的功能?信息产业的创新,是亦步亦趋么?微软有操作系统,我们就必须搞“自主版权”的操作系统?多年的拨款,支持“创新”,为我国信息产业技术提升带来哪些进步呢?幸而我们有一个华为,看看华为老板任正非怎么说。

 

2012 7 月份,任正非与华为实验室的干部和专家座谈。有人问:“当前在终端OS领域,AndroidiOSWindows Phone 8 三足鼎立,形成了各自的生态圈,留给其他终端OS 的机会窗已经很小,请问公司对终端操作系统有何期望和要求?

 

“如果说这三个操作系统都给华为一个平等权利,那我们的操作系统是不需要的。为什么不可以用别人的优势呢?微软的总裁、思科的CEO 和我聊天的时候,他们都说害怕华为站起来,举起世界的旗帜反垄断。我给他们说我才不反垄断,我左手打着微软的伞,右手打着CISCO 的伞,你们卖高价,我只要卖低一点,也能赚大把的钱。我为什么一定要把伞拿掉,让太阳晒在我脑袋上,脑袋上流着汗,把地上的小草都滋润起来,小草用低价格和我竞争,打得我头破血流。我们现在做终端操作系统是出于战略的考虑,如果他们突然断了我们的粮食,Android 系统不给我用了,Windows Phone 8 系统也不给我用了,我们是不是就傻了?同样的,我们在做高端芯片的时候,我并没有反对你们买美国的高端芯片。我认为你们要尽可能的用他们的高端芯片,好好的理解它。只有他们不卖给我们的时候,我们的东西稍微差一点,也要凑合能用上去。我们不能有狭隘的自豪感,这种自豪感会害死我们。我们的目的就是要赚钱,是要拿下上甘岭。拿不下上甘岭,拿下华尔街也行。我们不要狭隘,我们做操作系统,和做高端芯片是一样的道理。主要是让别人允许我们用,而不是断了我们的粮食。断了我们粮食的时候,备份系统要能用得上。”

 

在国家“信息安全”的背景下,我们的确是要搞操作系统,万一别人不给我们用了呢?不能被人卡脖子。这是国家或者和华为一样体量的公司,不得不在安全层面思考的一个问题。但是过分强调“自主版权”的操作系统是否是任正非口中“狭隘的自豪感”呢?

 

国家的数据安全,应该建立在“自主可控”的软件、硬件之上,并非一定是“自主版权”的软件、硬件。自主可控与自主版权仅仅两字之差,但导致的产业方向,截然不同。

 

华为过去没有自己操作系统,也没有自己的芯片,但是硬是在广阔的“应用市场”,打开一片天地。利用“应用”带来的市场地位、积累的研发实力,开始向产业链上游扩张。这是一条实实在在的路。华为的成功和战略选择,带给信息产业宝贵的经验,就是扎扎实实做好应用,切切实实积累技术。华为并不是在平地起高楼,充分利用了“开源软件”,是华为在基础软件领域,快速赶上的原因之一。在开源的Hadoop(大数据主流技术)社区重要贡献公司名单,排名第七。是贡献最大的中国公司。

 

过分的强调“自主版权”,使一些“头脑灵活”的公司嗅到“商机”。去开源软件社区,下载几个软件,改改界面,换一个标识,就成了“自主版权”软件,拿来骗取国家的科技补贴。这样的公司就是国家的蛀虫,产业中的败类。第一,欺骗国家,第二,违背开源社区的精神。这些公司的出发点从不是着眼于实际的应用中,他们只是骗取国家的创新扶持的拨款。他们的技术从开源社区“偷窃”而来,从无超越开源软件的可能。

 

相反,哪些埋头解决客户的实际业务问题,利用开源软件弥补自身基础软件的短板,在实际应用中,不断的修改、完善、升华开源软件的公司,才是中国的信息产业的希望,他们才有可能借助应用为王的时代,实现反超。

 

充分利用开源软件,尊重开源社区分享、合作的精神,发展“自主可控”的基础软件、基础硬件产品,才是一条正路。事实上,中国绝大多数的软件公司,都在利用开源软件。最值得学习和推崇的是华为公司。第一,他们大张旗鼓的在用,尊重开源精神。第二,他们不断地反哺开源社区,促进开源软件的发展。反哺开源软件,是一种态度,更是一种能力。如果公司不能超越开源软件,是谈不上反哺开源的。除华为之外的第二类是偷偷的用,模糊版权问题,谈不上反哺开源社区。第三类则最为恶劣,明明是拿的人家开源软件,非要说自主版权,这种行径与偷盗无异。幸好中国有一些有志于技术的年轻人,自发地成立开源技术小组。我衷心的祝福他们在开源的道路上,走的更远。

 

中国的互联网公司在使用开源软件方面做出了表率。淘宝网光棍节一天的销售额达到191 亿,这在世界上都是独一无二的。这套以开源软件为基础构建、开发的后台信息系统可以说承受了最大的压力。。京东商城也是如此,2012 年初,京东开始“去贵族化”(抛弃昂贵的商业软件)的努力,以开源软件为主,重新构建了其信息系统。我们在和其CTO 交流的时候,他感到非常欣慰,因为这次光棍节的购物,京东的信息系统没有出现任何性能问题。海外的最大的电子商务公司亚马逊、最大的搜索引擎谷歌、最大的社交网站Facebook,无一例外都选择了开源软件为主,构建信息系统。而且大数据技术,本就是开源软件唱主角。既然如此复杂的业务,如此巨大的交易量,都可以使用开源软件,我们为什么要花大把大把的金钱,给那些提供昂贵产品的公司呢?京东商城恰好又是非常典型的例子:京东的CTO,是从大名鼎鼎的甲骨文(Oracle)公司挖来的,但也正是他主导了京东“去甲骨文”的历程。

 

开源软件,是送给中国信息产业界的一份大礼,我们要大大方方的接受他,改造他,支持他。这是一种态度,更是一种能力。校正公司对待开源软件的态度,引导公司加强开源软件研发、改进,支持开源事业,则是信息产业政策需要认真对待的一个课题。开源软件既然是送给我国信息产业的一份大礼,那么如何收下,如何用好,就是需要政府和产业界共同面对的大命题了。

 

缺少大数据思维和意识,没有紧迫感

 

曾经有人问,发展大数据要采用哪些技术,有什么产品?事实上:大数据首先是一种思维方式,其次才是判断产业发展趋势和选择公司战略,最后才谈得上技术实现的问题。有四种典型的片面认识阻碍企业家完整的认知大数据:第一,认定是炒作;第二,片面理解;第三,视野狭隘;第四,唯技术论。这些都是缺少大数据意识的表现。尽管还有其他各种客观原因,但是企业家的思想认识,是阻碍大数据获得深入应用的最重要因素。

 

第一,认定无非是另一次炒作。这是最常见的一种误读。其流毒在于阻碍了人们去耐心认真的研究大数据的由来和机理。IT 业和资本的确有炒作的传统。对千年虫连篇累牍的报导和宣传,除了让IBM 等大赚一笔外,结果发现问题并没有事前描述的那么耸人听闻。物联网也曾经是资本市场的宠儿,但现在却已风光不在。如果因此就把大数据归于炒作一途,肯定会与机会失之交臂。大数据与以往的技术概念有显著的不同,最大的差异是大数据已经远远超越技术的概念,是互联网、智能终端、社交网络发展到一定阶段的必然产物。以往,信息技术总是在围绕提升企业运营效率打转,而大数据促使商业智能真正走向企业的决策中枢。

 

第二,片面的理解。有人一听说大数据,就说十多年前我们就有多少多少数据。以前都说海量数据如何如何。的确,海量的数据是大数据的特征之一,但海量数据并不等同于大数据。大数据更强调数据的多样性、及时性。网络日志、文档、视频、图片等都是大数据关心和处理的对象。更重要的是,大数据技术总是要求尽可能快的发现有决策价值的信息。快的度量单位是不能超过1 秒。厂商在介绍大数据概念时,往往介绍三个“V”特征:Volume 体量大,至少要到PB 级别(1PB 等于1024 TB,大约相当于地球观测系统五年的数据);Velocity,实时要求高;第三个Variety,强调数据的多样性。还有厂商增加一个VValue,意思是说大数据有价值。这些都是对的,但不免过于片面。

 

第三,狭隘的视野。仅仅埋头在自己的一亩三分地,是难以领略大数据全部魅力的。它首先是超越行业的,一定会促使新的行业诞生,也一定会令一些行业消亡。几乎所有行业的竞争格局都将被大数据所颠覆。其次它是超越技术的,无论是开源的Hadoop,还是各厂商力推的新产品,都不足以反映大数据的全貌。作为投资人,或者公司的决策者,如果不能确立这是行业竞争的战略要地思维,则不足以妄谈大数据。

 

以企业在线服务市场为例,这个看起来很朝阳的产业,并没有在中国取得引人瞩目的成长。国内最大的几家公司,营业收入大约在1 亿元左右。前段时间和业内人士辩论能否免费为企业提供在线服务。大多数业界人士认为企业市场与个人市场不同,企业客户担心免费服务的质量,不收钱人家反而不敢用云云。事实上,我看到已经有公司免费为企业提供在线的企业管理服务,其盈利模式变成为他的在线客户提供金融贷款业务。在线业务加小额贷款服务已经成为极具颠覆性的商业模式,这种商业模式如果进展顺利,传统的在线服务商,将面临行业性的灭顶之灾。这种新模式,其核心竞争力体现在拥有大量的、真实的客户运营数据。借助对这些数据的收集分析,预测客户的运营风险,最大限度的降低借贷违约风险。阿里巴巴公司刚刚提出的平台、数据、金融的战略,则是大数据前景的最佳诠释。

 

广告产业将重新洗牌。大家都知道广告预算至少有一半被浪费掉,可悲的是不知道浪费的是哪一半。借助大数据,广告将变得及时和精准,而且能够评估量化每个渠道的广告效果,看起来具有非常诱人的前景:广告主大大节约资金,消费者得以避免垃圾广告的骚扰。理论上,如果大数据技术得到充分运用,那么我们每个人将不会收到垃圾信息。在日常消费中,冲动型的购买决策越来越普遍。商家必须在消费者最感兴趣的时候,及时触发刺激消费者的购买欲望。离开大数据的支持,这种精准的营销则难以实现。

 

制造业将重新定义核心竞争能力。在制造业发展的不同阶段,其核心竞争力是不同的。在发展初期,产品质量是非常重要的因素,就是能够做到人有我优。这个阶段的关键资源是拥有先进的生产设备。产品同质化后,对于渠道的掌握和控制成为生命线,关键资源是优质经销商队伍。当渠道成熟到一定的阶段,谁能掌控终端,谁将占据竞争优势,关键资源终端营销团队。考察制造业关键资源的迁移,我们发现它逐渐向最终用户端迁移。换句话说,谁能掌握最终用户,谁就能笑傲江湖。这方面例子还有很多,各行各业都不在少数。对此本章不在赘言,后续章节均有详细描述。

 

第四,唯技术论。大数据是一种思考方式,和有没有数据、数据量的大小、使用什么技术,不存在严格的正相关。没有最新的技术,也可以通过数据资产来获利;即便拥有最先进的技术,缺少数据思维,没有数据资产,往往也徒劳无功。不能单纯的认为只有哪些围绕hadoop(泛指大数据技术)开发的新兴公司,才是大数据公司。也不能认为没有技术的就不是大数据公司。相反,在大数据领域,那些拥有稀缺性数据资产的公司,往往可以指点江山,独领风骚。大数据既不等于数据挖掘也不等于统计分析,更不等于人工智能。但是这些技术和算法都需要大数据的支持。使用同样的算法,如果利用全部的数据集,而非小样本量,甚至得出截然不同的结论。这就是大数据的魅力。他可以在宏观尺度上把握潮流,也可以在微观颗粒上预测未来。

 

数据治理缺位

 

数据割据、数据孤岛和数据质量,是典型的三大数据治理问题。

 

因为制度、地方主义、部门主义等人为因素造成数据分散的现象,我称之为“数据割据”;因为技术差距、历史遗留问题等形成的数据分散的现象,称之为“数据孤岛”。数据割据现象更多存在于国家各部门、各地方之间;大型企业内部也会存在数据割据现象。譬如气象部门详尽的天气观测数据,是研究大气规律、做天气预报的第一手资料。但是这些数据因为各种各样的原因在气象局那里睡大觉。理论上讲,科学院的大气物理研究所是可以拿到这些观测数据的,否则,大气所的科学家们怎么支持气象局的工作啊?根据“有关部门的有关规定”,大气所的确也能够接触到这些数据。但实际操作中,要拿到些有用的数据,不拖个半年是不行的,而且就算到手了,也是鸡零狗碎的,没什么用途。这就是典型的“数据割据”现象。

 

有家公司专门为淘宝网上的商家提供在线的服务。这些服务需要淘宝开放数据接口。早期,如果不使用淘宝提供的服务器是没有任何障碍的,但现在这项服务有50%的时间是无法连通的。我们自然无权指责淘宝的经营策略,但这种因先发优势进而形成数据割据的局面,的确令人担忧。

 

美国政府在消除数据割据方面可谓用心良苦。除了系统性的提出国家层面的数据战略外,一些做法也值得借鉴。具体方法参见本书第三部分的详细介绍。

 

我国政府面临更加严峻的数据割据困境。数据保护主义不过是部门保护主义在信息领域的延伸而已,必须出台国家级别的顶层设计,由上而下地破除阻碍数据分享的藩篱,并建立数据共享,成果分享的利益分配机制,才有望从根本改善数据割据的问题。

 

数据质量的好坏,直接影响数据资产的价值。数据质量主要包括数据的真实性、完整性、一致性。数据质量的解决非一日之功,需要技术、制度、文化等等方方面面的努力。如果把数据认认真真的当成资产对待,数据质量,就是需要面对的第一个问题。

 

数据资产的界定与安全

 

随着数量越来越多的数据被数字化,在跨越组织边界而流动着,一系列政策问题将会变得越来越重要,这包括但不限于隐私、安全、知识产权和责任。显然,随着海量数据的价值愈加明显,隐私是个重要等级(尤其是对消费者来说)不断提高的问题。个人数据(例如健康和财务记录)经常能够提供最重要的人类福利,例如,帮助精准确定适当的医疗或者最恰当的金融产品。然而,消费者也将这些类别的数据视为最敏感的个人隐私。显然,个人和其生活所在的社会将不得不努力在数据隐私和数据的功用之间权衡取舍。

 

另一个密切相关的担忧是数据安全,例如,如何保护竞争方面的敏感数据或应保持隐私的其他数据。最近的例子表明,数据被盗不仅暴露消费者个人信息和企业保密信息,甚至还会暴露国家安全秘密。鉴于严重的数据被盗事件有增无减,通过技术和政策工具解决数据安全问题将成为关键。

 

海量数据日益提升的经济意义也昭示了一系列法律问题,尤其是当其与如下事实联系起来时:即数据与许多其他资产具有根本性的差异。数据可以与其他数据结合起来完美而轻松地复制,同样一份数据可以由多个人同时使用。这些是数据与实体资产相比的独有特征。有关数据所附带的知识产权的问题不容回避:何人“拥有”某份数据,某一数据集附带着何种权利?数据的“公平使用”的定义是什么?此外,还有与责任相关的问题:当一份不准确的数据导致负面结果时谁应负责?要充分发挥海量数据的潜力,此类法律问题需要澄清,也许会随着时间的推移逐步澄清。

 

缺乏大数据人才

 

就算政府和企业界认识到大数据可以释放经济的下一波增长潜力,认识到数据资产是关乎企业未来的命脉。但是如果想要成功运用大数据技术,达成企业战略目标,最大的制约因素往往是大数据人才的匮乏。这一点已然成为推广利用大数据技术的阿喀琉斯之踵不过许多高校近期的举动令人欣慰。北京大学、上海交通大学、中国人民大学、北航等高校都在设立数据科学的专门研究机构和相关专业,未来,也许数据科学家将成为令人尊重的职业。

 

 

  评论这张
 
阅读(227)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017