大数据学术论坛嘉宾精彩发言摘登 机遇与挑战并存
机遇与挑战并存
——大数据学术论坛嘉宾精彩发言摘登
嘉宾参与讨论大数据相关论题。
“贵州把全国重要的IT行业、企业、运营商都凝聚在一起,建立一些全国的大的数据中心,非常了不起,这将是贵州重要的物质基础。但仅仅只是建立大数据中心是远远不够的,要运用这些数据来解决问题,使数据变成生产力、变成财富,使数据产生价值。”
“贵州应该抓住大数据这个机遇,把数据进行电子化后,将不敏感、不保密的数据开放出来,这将促使普通大众能够利用大数据进行创新、创业,让老百姓真正在大数据中得实惠。”
……
5月27日,大数据学术论坛在贵阳国际生态会议中心举行,此次论坛的主题是“融合、跨界、基础、突破”,来自政界、业界、学界的嘉宾们围绕“大数据及其在智能城市建设中的应用”、“中国大数据产业发展面临的机遇与挑战”以及“大数据存储系统的几个关键技术”等方面,聚焦大数据的具体运用和未来发展,并为贵州如何利用大数据推动经济发展建言献策。
中国工程院院士、北京邮电大学信息与通信工程学院院长刘韵洁——
大数据不挖掘不应用就没有价值
“贵州把全国重要的IT行业、企业、运营商都凝聚在贵州,建立一些全国的大的数据中心,非常了不起,这将是贵州重要的物质基础。大数据在智能城市发展的过程中价值非常大,但大数据如果应用不好,它的价值等于是零。所以应用和不应用,挖掘和不挖掘,差别非常大。贵州只建立大数据中心是远远不够的,要运用这些数据来解决问题,使数据变成生产力、变成财富,使数据产生价值。”昨日,中国工程院院士、北京邮电大学信息与通信工程学院院长刘韵洁在就大数据及其在智能城市建设中的应用发表演讲时这样说道。
“比如说交通拥堵,贵州就可以利用大数据来解决,利用人和车每时每刻位置的信息。以智慧交通为例,目前我国交通最大的问题就是拥堵,智慧交通系统可以搜集每辆车的位置信息,反馈到交通主管部门,交通主管部门可以实时做出应对措施,通过车联网告知车主应该选择哪条路线,既不堵又能节约时间。
刘韵洁特别指出,在公共安全方面,智能城市技术大有可为。“比如洪灾,气象部门预测基本是准的,地理地貌信息也是有的。计算机可以模拟算出在某一段时间下多少雨,哪些地方就可能会出现灾情。一旦出现危情,系统就自动监测到并发出疏散通知,这就能将人员和财产的损失降到最低。”刘韵洁说。
“随着大数据的不断发展,今后,我们的手机,还可能就是我们的随身私人医生。比如通过测血糖等数据,告诉用户活动少了,要多运动,少吃肉,多吃菜。”刘韵洁院士在谈到智能医疗的发展时展望道,随着穿戴式智能设备的发展和物联网技术的升级,每天生活离不开的手机今后有望增加一个功能,成为用户的“私人医生”。他表示,从目前的研究进展看,这种手机私人医院的功能目前主要停留在比较简单的身体数据监测上,但随着技术的发展,这位“私人医生”将会越来越称职。
刘韵洁说,智能城市建设不可能一蹴而就,可从当前城市建设当中最紧迫的、关切到老百姓安全的一些问题着手。刘韵洁还认为,智能城市建设要有远景、总体规划和实施步骤,而且要结合当地的环境和条件来实施。此外,在信息网络方面,他还建议国家给予高度重视,因为这是智能城市建设的一个重要基础条件。
清华大学计算机系教授郑纬民——
应用和存储缺一不可
在大数据学术论坛上,清华大学计算机系教授郑纬民介绍说,大数据存储有四个要求:第一,高可用,数据能够随时访问,不丢失。也就是数据存起来以后,你什么时候来都给你,这叫高可用,这是第一个要求。第二,成本低,对磁盘容量要求低,这么多数据尽可能少用一些硬盘。第三,性能,访问速度快。第四,低开销,不是说价钱,说的是对CPU、网络资源自占用少。
“目前IT行业的发展非常迅速,在Web2.0时代、或者邮箱、FTP等应用上,传统的存储应用都遇到了瓶颈。而在清华大学,已经研发出了一款名为MeePo的公有云。通过个人、办公等应用的共享,可以实现资源的优化。更为特别的是,MeePo可以实现无缝集成,非常方便。”他说,MeePo主要有三个模块:一是个人空间,每个注册用户享有20GB的个人空间,可以离线使用,这其实是普通电脑中C盘、D盘外的一个存储空间;二是社区空间,学校教育处、就业指导中心、跳水队等可以申请建立社区,并拥有1TB的初始社区空间,其中的内容社区内的用户可以共享;三是公共社区,这是系统自建的社区,向全部用户开放,包含课程视频、学习软件、影音资料等。
“MeePo系统存储容量为300TB,是一个很大的云。而与DropBox、华为网盘等不同的是,MeePo不只是存储平台,还是一个资源平台、社交平台、支撑平台。”郑纬民表示,目前,MeePo已有注册用户2万多个,注册社区500多个,目前数据总量近90TB。
针对当前容灾技术存在的结构相关、恢复耗时两个问题,郑纬民提出了采用分布式RAID技术、存储删冗技术来解决,从而实现大数据存储系统的低成本要求,同时通过在线存储阵列扩展方法实现存储系统的高性能。通过这些关键技术手段,在保证数据高可用性的同时,又能解决最小化存储容量需求。
中国信息通信研究院副院长刘多——
建立规则做好顶层设计 开放数据促进数据交流
“目前美国、英国、新加坡、欧盟等发达国家和地区已制定数据驱动经济战略,通过开放政府数据、投入巨资支持研发等行动,大数据促进经济发展的作用也已显现,已成为各个国家经济增长的新引擎。”中国信息通信研究院副院长刘多说,现在大数据时代已经来临,机遇就在面前,对于信息化程度、大数据核心技术等方面都与发达国家有不小差距的中国,要抓住这次宝贵机会,需要尽早出台国家大数据发展战略,做好顶层设计,做好数据开放、产业布局、技术创新、法律法规等方面的工作。
“大数据的发展与信息化程度息息相关,数字化是第一阶段。电子化是数据化的前期阶段,数据没有进行电子化、数字化,便谈不上进入网络化或者大数据时代”。刘多说,与东部发达地区相比,贵州的信息化程度还比较低,要发展好大数据,首先要做好数字化、网络化等基础性工作。
数据要挖掘、应用才能产生价值,但首先要有信息源。在刘多看来,现在大数据资源还处于“无序”和“死锁”两个阶段,没有完全打通。
“一方面是气态的流动,存在数据黑市交易、个人信息外泄严重、数据资产权益不清、资产得不到有效保护等无序状况,另一方面数据又是固态冻结状况,比如政府数据开放程度低、有数据的企业不敢开放、合法机构难以获取稳定数据。”刘多认为,现在在大数据应用方面出现“大互联网企业和政府部门两头热、企业应用冷”的状况,也是由于存在数据孤岛的问题。
“由于内部数据孤岛、外部数据短缺、技术人才不足、法律合规性等问题,像电信金融等这类具有非常大量的数据的企业在数据应用方面的进展仍很缓慢。”刘多认为,数据最理想的状态应该是像水一样的液态,拧开水龙头数据就能进行合规的流动,大数据产业才能有序地、可持续地向前发展。
数据交易是存进数据流动的重要形式,现在交易市场已在萌芽。4月14日,全国首个大数据交易所——贵阳大数据交易所正式挂牌运营并完成首批大数据交易。对于如何活跃数据交易市场,刘多建议,首先要把法律和规则建立起来,再一个是发展产业。
“如果没有格式标准、交易规则、定价机制、仲裁等,交易是不可能多的,有了法律和规则,数据才不会被滥用、隐私才可能受到保护。”刘多说,产业发展了才能激活买方和卖方市场。
“贵州、贵阳现在大力发展大数据产业,政府部门除了在资金等方面支持产业发展,更要营造环境,这需要首先做好政府数据开放工作。”刘多说,美国等通过政府数据开放极大地促进了数据的应用、创新公司的发展,如果政府各部办委局能突破困难,打破数据壁垒做好数据开放工作,让更多的企业和个人来利用、挖掘这些数据、开发相关应用,对产业发展、新的科技企业诞生将会有很大的促进作用,实现大众创新、万众创业的目标。
专家发言点击:
中国惠普软件集团首席技术官魏喜勇:大数据运用最终都是为了民生,为老百姓服务。目前,惠普与贵阳已经做了许多行业方面的大数据应用,比如说健康大数据、农业大数据、金融大数据、教育大数据等等。
特别是健康大数据,目前已经开始打通9家市立医院数据,建立全市统一的电子档案库。市民未来可直接通过医疗云平台进行医保相关操作,医保单位及医院也可通过后台对数据进行统一管理和结算,在为市民带来极大便利的同时也将大幅节约贵阳市在医疗保障体系上的人力及物力等的投入。未来,医疗云还将计划覆盖贵阳市辖区内70多家县级医院,为更广泛的民众带来福利。
重庆邮电大学副校长刘宴兵:智慧旅游的发展离不开大数据,贵州拥有很丰富的旅游资源,贵州应依靠大数据分析出有利的旅游资源,让智慧旅游得以“智慧”发展,让老百姓了解到这座城市旅游的客源市场在哪里、哪些产品是游客关注的,为精准营销提供重要的数据支撑,为决策营销产生颠覆性的作用。
国务院发展研究中心技术经济研究部第二研究室主任田杰棠:发展大数据产业要解决两方面的问题——一是怎么构建大数据产业发展的产业环境,二是怎么做好传统行业的改革,给大数据产业更多应用机会。
中西部在发展新一代新兴技术应用中有后发优势,尽管西部传统行业落后于东部,但新兴产业的发展阻力可能会低一些。如今贵阳在大数据产业发展方面做了很多工作,比如成立大数据交易所,建立互联网医院,公开政府数据等都是很好的探索。
贵州、贵阳很可能是未来大数据发展的高地和希望,要做好基础设施建设,设定好大数据龙头企业和地方政府之间的合理利益机制,形成共生的机制,以龙头企业带动地区产业发展,在发展大数据的过程中要坚持改革和创新的精神。
软通集团副总裁黄立:通过最近几年在智慧城市顶层设计、运营实施工作方面的探索,我们发现城市大数据是智慧城市的核心。
城市大数据的特点首先是融合,尽管每个城市开展了信息化工作,但仍有很多信息孤岛,这些孤岛间的数据融合和整合却是很缺乏,首先需要打破信息孤岛,让数据集中起来、整合起来。
城市大数据的另一特点是跨界。城市大数据的数据量是最大的,基本上一个三级城市的数据量就超过10个PB,包括人口、产业等各方面的数据,这些数据都是跨界的,可以利用这些大数据定义出智慧城市在民生、产业等方面要做的事情。
城市大数据最难的是“突破”。银行、金融、电信等行业做大数据做得比较早,但怎么让它“变现”、产生更大的价值却是一个非常新的领域。
我们在贵阳做了跨境电商的一些探索,跨境电商其实跟城市大数据是密切相关的,它需要的数据不是某一方面的数据,而是涉及到人口、产业等多方面。通过跨境电商让产业取得突破,带动一些龙头企业带来经济效益,可以“变现”,这样大数据才能持续发展,才有生命力。
中国联通信息化与电子商务事业部副总经理范济安:中国联通在发展大数据方面具有集中化运营、平台能力大、数据内容广泛、数据加工和挖掘能力强、多应用支撑的特点。自2013年以来,中国联通搭建了在传统数据仓库之外的hadoop(即分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。)分时存储计算集群,从28个节点发展到1200个节点。而且,这个集群不是独立的孤岛式的集群,通过利用hadoop工具,形成了一体化的运营。数据价值必须要通过应用发挥出来,我们数据平台的特点不是简简单单的支撑一个应用,而是多应用的支持。在去年一年,在这个平台上,利用我们的数据,利用我们的数据产品,联通相继支撑了客户维系,精准营销,跨越的互联网金融,个人征信等业务。同时,也积极地做好数据开放工作,提供行业的洞察报告,比如,为国家统计局人口流动的分析等。
任重 记者 常青 樊成琼/文
记者 徐其飞/图