在日前举行的“第十届国家信息化专家论坛”上,众多专家阐述了对“开放数据与大数据发展”的看法。
工业和信息化部副部长杨学山表示,大数据概念的出现让人类社会看到了信息、能源和材料三者走向等量齐观、共同推进经济社会发展的曙光,但大数据目前还处于应用的低级阶段,业界对大数据的概念认识和应用本身都还有很多的不足与问题。这些问题不解决,大数据很难发挥其应有的作用,也很难落地,必须认清大数据的本质,把握两个关键的技术方向,处理好三个关系。
杨学山提出了两个关键的技术发展走向。首先,在内容属性上,要突破语义解析技术,让大数据结构化。其中需要突破模式识别、自然语言理解、语义分析、知识体系化等各个技术环节,重点从应用的角度,利用已有的信息集合,开发相应的理论和工具。其次,在物理属性上,要在芯片、软件、整机、系统等技术上取得突破。现有的主流芯片架构不适应处理大数据的需求,对处理过程中流量极其大、密度极其低、计算极其少的特征,需要大空间、低密度、非计算的处理能力。因此,从芯片到操作系统,都必须进行创新。
在大数据下一步的发展进程中,杨学山提出要处理好三种关系:一是昨天、今天和明天的关系,也就是推动大数据技术和应用的平滑升级,不能把发展的拐点变成了断点,这样既是对过去发展的否认,也是对未来发展的损害;二是局部和全局的关系,大数据只是信息技术体系中的一个部分而非全部,其发展必须与信息技术体系发展的全局相结合;三是求实和创新的关系,创新的立足点要放在求实上,求实际、求实效、求实用,否则创新就成了口号,反过来变成发展的阻力。
中国工程院院士、中国互联网协会理事长邬贺铨也表达了对大数据看法,他认为,大数据挖掘技术是大数据时代竞争的焦点,其能深化信息技术应用,催生新应用新业态出现,提升管理和决策的智能水平。
“我们需重视数据挖掘利用,不仅是大数据价值挖掘,还有对中小数据的挖掘同样值得重视。不仅是非结构化数据,对相对简单的结构性数据挖掘也能有大价值。”邬贺铨说。
就目前大数据应用而言,邬贺铨认为,我国一些部门和机构拥有大量数据,但以邻为壑,宁愿自己不用也不愿提供给有关部门共享,导致信息不完整或重复投资。
“我国在自主可控的大数据分析技术与产品方面,与发达国家相比有不少差距,国内企业在数据库、数据仓库、商业智能分析等领域基础薄弱,尤其是大数据方面已远远落后与外国先进企业。”
为促进我国未来大数据的发展,邬贺铨强调,我国企业需要自主掌握大数据开发技术,另外,信息化要从重视硬件到软件,再到重视数据的利用,需要制定国家大数据发展战略,
国家统计局总工程师郑京平在大会的主题发言中称,大数据的趋势是势不可挡的,对政府统计来说这是机遇也是挑战,但大数据直接应用于政府统计有局限性,大数据有巨大潜力,政府统计要张开双臂热情拥抱大数据。
郑京平在《政府统计将如何应对大数据挑战》的发言中指出,大数据呈现数量大、速率快、多样化、不稳定等特点。“得益于信息化、网络化、数字化,大数据发展迅猛,将会成为最重要的数据信息战略资源,‘大数据战略’将成为下一个‘石油战略’,”郑京平说,“对政府来说,大数据将成为宏观调控、国家治理、社会管理的重要信息基础。”
“大数据正在挑战传统的政府统计方式。大数据的服务领域正在从商业领域渗透到公共服务,有些直接渗入到政府统计的传统服务领域,官方统计作为公共统计数据信息主渠道的地位正受到挑战。”郑京平表示。
但他同时平指出,大数据为统计学提供了更加宽广的舞台,促使政府统计变革,提高统计数据质量,拓宽了政府统计数据信息的搜集渠道。
[时间:2014-02-19 来源:飞象网]