1个多月前,在中国西北角——甘肃敦煌,同方知网技术公司总经理王明亮先生向济济一堂的国际出版、图书馆界人士激情阐述了“大数据出版与大数据图书馆”的设想。彼时,敦煌400多人的会场座无虚席,鸦雀无声,安静地聆听大数据时代隆隆作响的脚步声。
而大数据对数字出版意味着什么?它带来怎样的发展空间和未来?这是一个令人充满遐想、又近在咫尺的问题。
以阅读为起点,在数字技术的支撑下,一本书的数据究竟会有多大?从当前数字出版产品的形态看,读一篇小说,或许5M绰绰有余;查阅学习资料,也许涉及300M文献;享受一段声光电多媒体读物,可能总计不足1G……因此,数字出版目前典型的特点是“小数据”生产与制作,数字出版产品能够带给读者更多的是碎片化的知识、相关的兴趣点以及多姿多彩的阅读体验。至于阅读的深度挖掘、知识的重新组织,乃至阅读信息本身的智能型分析与匹配、数据之间的关系,读者阅读兴趣产生的数据,则正是大数据浪潮下,数字出版开启的瑰丽想象。
在不远的将来,数字出版或许应该首先是数据出版,它整合、梳理大量内容资料,全面、细致囊括相关知识,是海量数据、庞大数据库的有效管理。其次,它将是数据关系的智能服务,它能够智能挖掘、匹配一切阅读兴趣,为读者的沉浸阅读、深入学习提供内容和工具,是满足阅读需求的数据综合服务。最后,数字出版必将成为大数据出版,即以内容为基准,包含各种服务的PB级大数据;处理速度迅速、涵盖多种类型以及信息感知无处不在、随机变化但智慧关联。
数字出版自发端以来,迅速将白纸黑字的传统出版改造成为多媒体表现、多维度服务、多角度关联、多终端传播的立体形态。但数字出版当前无疑仍处在初期发展阶段,这种依托于技术不断变革的产业,在时代的召唤和技术的推动下,正一脚踏在大数据时代的门槛上,一如王明亮先生的分析与判断。
[时间:2013-08-29 来源:中国新闻出版网/报]