大数据时代图书电商的机遇与挑战

大数据时代图书电商印刷

   随着移动互联网、物联网、云计算等新兴技术的发展,社交媒体、智能终端和视频监控等媒介设施迅速普及,全球数据量呈爆炸性增长。据国际数据公司(IDC)统计,仅2011年全球被创建和复制的数据量即达1.8ZB,相当于有史以来所有印刷材料数据量的近万倍,而这样庞大的数据量每两年将翻一番。海量数据蕴涵着高昂价值,运用新兴技术整合数据已成为惠普、IBM、微软、阿里巴巴等国际巨头战略转型的重要规划之一。著名咨询公司麦肯锡 2011年发布名为《大数据:下一个创新、竞争和生产率的前沿》的研究报告,认为数据已经渗透到了每个行业和业务职能领域,逐渐成为重要的生产要素,对海量数据的运用,预示着新一波生产率增长和消费者盈余浪潮形成。2012年3月,美国政府发布了“大数据研究与开发计划”,将之列为继“信息高速公路计划”之后的又一重大科技发展部署。种种现象表明,大数据时代已经来临。

 
  大数据时代,任何产业和企业组织都面临着新一轮的机遇和挑战。由于大数据与互联网及网民的天然接近性,IT业和营销行业首当其冲。在出版领域,图书电商是以IT身份而从事营销业务的典型代表,如何直面挑战、乘机求进,不仅事关其自身发展,也与整个出版业未来发展方向息息相关。
 
  大数据的定义、特征与内涵
 
  根据麦肯锡的定义,“大数据”是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。之所以“无法”抓取、管理和处理,缘于大数据的四个基本特征。其一,数据量巨大。数据量级已经从GB(千兆字节)和TB(万亿字节)发展到了PB(千万亿字节)、EB(百亿亿字节)乃至ZB(十万亿亿字节)计量的地步。科学家估算,如果将2013年全球存储的数据刻录在只读光盘上,可以堆成五堆,每一堆都伸向月球。其二,数据类型多样。除少量由传统数据库累积的结构化数据之外,还包括各类互联网、物联网应用所产生的文字、图片、视频、图像与地理位置信息等半结构化和非结构化数据,后者占比达75%以上。[1]其三,实时快速。数据快速产生、增长和流转,例如即时通讯工具中产生的数据流,要求实时存储和处理,如果事后追溯则价值流失。其四,价值高但密度低。大数据包含着大量冗余信息,必须披沙拣金才能有所获益。例如,社交网站中多数日常交流信息价值稀薄,但联合国的“全球脉动计划”在巨量日常信息的基础上,使用自然语言解密软件对网民进行 “情绪分析”, 可以预测失业率、 疾病爆发等现象,有益于经济和社会发展。
 
  原本“无法”抓取、管理和处理的数据集合,如今得以愈来愈多地运用,这是大数据时代的意义所在。因而,“大数据”的内涵,不仅止于“庞大的数据集合”,而且包含对数据的存储、处理、分享、挖掘、分析等技术与能力。大数据技术中,社交网站、物联网的应用,使用户的行为轨迹、情绪变化以至万事万物的所处状态都可以数据化;以 Hadoop (能够对大数据进行分布式处理的软件框架)为代表的非关系型数据库系统使不同行业、不同类型数据之间的联系、交换和利用更加便捷;云计算等分布式运算架构技术使快速、低成本分析巨量数据成为可能。大数据内涵的核心,事实上在于如何应用大数据。这正如《驾驭大数据》的作者Bill Franks(比尔 ·弗兰克斯) 所说:“重要的不是数据,而是如何使用数据;大数据的核心是发现价值。”
 
  大数据为图书电商带来机遇
 
  图书电商,如当当、卓越亚马逊、京东商城以及各出版机构自设的网络书店等,目前已经成为我国图书销售的主流渠道。但在激烈的市场竞争中,图书电商普遍陷入价格战和库存量过高、物流成本过大的泥淖之中,自身发展受限,甚或对出版业生态构成损害。如何进一步提高营销效率、拓展盈利,并扩大在出版领域的影响力,是图书电商亟须解决的紧要问题。大数据在这些方面有着显著的应用价值。
 
  1.进行精准营销
 
  精准营销是营销主体将产品和服务等相关信息精确、准时传递给目标用户,以提高营销效率并降低成本的行为或过程。在传统的“小数据”背景下,用户数据相对匮乏,数据分析效率偏低,导致营销的精度有限,不仅浪费了资源,而且推送的无效信息对用户形成干扰,影响消费体验。大数据时代,图书电商的互动交易平台本身具有多种功能,能够对用户点击、浏览、评论、试读、收藏、购买等行为进行数据记录。用户在微博、微信、QQ群等社交媒体上的所有网络行为也都会留下“踪迹”,形成包含个人信息的数据。图书电商广泛获取此类数据,必要时进一步结合第三方交易平台、数据服务机构提供的相关数据,进行历时性分析、语义解读等技术处理,就能够全面了解用户群体乃至个体的属性、交易行为、社交关系图谱等相关信息,挖掘其需求、偏好、习惯以至情绪特征,从而精确化、智能化地确定在何时、何渠道、以何种方式和终端推送信息和服务,找到具有实效、线路最短的营销接触点。
 
  从产品的角度看,经大数据分析,营销主体可以迅速找出哪些产品之间高度相关,用户可能连带购买,也可以发现某些产品具有高度替代性,用户不可能同时购买,从而对营销内容进行新的优化组合。在洞见产品与用户的基础上,无论是图书推送、样张试读,还是广告信息传达,都将大大提高准确度和实效性。即使书评撰写,也可以汇聚更多用户自发生成的碎片化内容,再进行针对性组合和分发,提高其个性化和针对性,增强对目标读者的说服力。据报道,亚马逊现在完全可以运用大数据运算代替专业的书评人员来推荐图书。[2]亚马逊自称,其销售额的1/3都来自于它的个性化推荐系统。[3]借助大数据,亚马逊创造了更为精准与美妙的用户体验,提升了效率与效益。
 
  在大数据精准营销模式下,图书电商的库存与运输成本也将随之降低。传统营销中主要依靠既往销售数据和主观经验决定库存量和运输方式,其滞后性和误差率推高了成本。大数据营销以即时、全面的数据提高决策效率和精确度,甚至可以对某些区域短时段内的社会热点、天气变化、交通限制等问题作出预判,及时调整图书存量与运输方案,从而节约成本。亚马逊基于大数据自行定义的自动补货模型,有效地改善了完全依靠人工的订货、补货模式,提升了库存管理的效率。农夫山泉使用思爱普(SAP)公司研发的大数据系统 HANA管理运输网线,降低了35%的运输成本。[4]基于大数据的科学、精准的营销渐成趋势,日益取代过去基于直觉的粗放式的营销决策。
 
  2.拓展盈利模式
 
  图书电商当前主要以图书网络发行兼及少量广告为主要盈利模式。盈利模式单一,而市场空间有限,是行业内恶性竞争的重要原因。大数据时代,数据之于企业,不再是商业活动的附属品,而是极其宝贵的核心资源,对之进行收集、分析、利用等任一环节都能创造出新的价值。2012 年1月,瑞士达沃斯论坛发布名为《大数据,大影响》的报告,宣称数据已经成为一种新的经济资产类别,如同货币和黄金一样。依托大数据,图书电商有望拓展出多种盈利模式。
 
  其一,数据产品销售。图书电商依托互动交易平台和微博、微信、论坛等社交媒体与成千上万的用户密切交流,具有收集用户数据的便利条件。这些数据产生于以交易为主旨的深入的交流互动过程中,因而信息的价值含量更高。经广泛收集、分类整理和重新聚合的数据集合,蕴涵着丰富的用户及市场信息,对出版及相关行业具有极高的商业价值,具备销售盈利的可能性。例如,百度通过搜集整理网络游戏玩家的搜索热点,建立网游用户行为数据库,销售给网络游戏运营商,获得了不菲的盈利。这一模式堪称“数据资产化”理念的直接体现。
 
  其二,数据分析服务。基于大数据集合,图书电商运用数理统计、数据挖掘、语义分析等科学方法,对隐藏于图书流通、读者行为、交易过程等数据背后的特点、规律、变动趋势进行分析、判断,将品牌美誉度、市场占有率、竞争对手状态等分析结果定期提供给出版商等客户,帮助其深入洞察市场变化,及时作出科学决策。例如,阿里巴巴2012年7月推出名为“聚石塔”的大数据分析平台,为入驻用户提供诸如买家访问量、访问频率、商品与品牌偏好、跨店铺点击等数据及相关分析,为自身与用户都带来了巨大的商业利益。
 
  其三,图书电商也可以建成数据分析、分享、交易平台,构建平台强大的数据采集、存储、运算、分析功能,为出版商等客户提供策划、营销、决策等多方面服务,同时获得相应的盈利。大数据时代,以利用数据价值为核心,新型盈利模式不断涌现,图书电商把握机遇、放宽视野,就能找到新的利润增长点。这正如“大数据时代预言家”维克托·迈尔-舍恩伯格所说的:“数据的真实价值就像是漂浮在海洋中的冰山,第一眼只能看到冰山的一角,但是绝大部分隐藏在表面之下。”图书电商应高度重视数据,进而去开掘冰山一样无法估量的财富。
 
  3.强化产业链优势地位
 
  在文化创意产业范畴中,出版产业链大致表现为“作者创意—内容策划—生产制造—行销推广—衍生增值—用户消费”的链条形态。根据“微笑曲线”原理,居于产业链两端的企业能产生高附加值,利润率最高,居于中间位置的企业利润率最低。图书电商归属于其中“行销推广”环节,产业链位置决定其盈利状况不容乐观。图书电商近年来的发展成果主要应归功于社会、产业的快速网络化,而未来要进一步发展,则应借助新兴的大数据技术调整自身在产业链中的地位。具体说来,图书电商应适当涉足产业链高盈利环节,如创意策划、衍生增值等,而大数据为其提供了可能。
 
  大数据时代,图书电商参与内容创意与策划大有可为。当前条件下,多数图书策划是编辑人员依据行业经验和对某一领域热点的敏感度进行的,在读者定位、作者水准、推出时机、市场需求量等方面往往存在偏差,影响图书质量和市场效果。而在大数据条件下,图书电商在互联网营销过程中能够获得大量用户的交易数据和网络应用数据,运用大数据智慧分析,能够洞察用户的阅读需求,准确把握市场热点,发掘有价值的选题,并以潜在读者的视角遴选恰当的作者人选,规划装帧设计。如此一来,以数据引领策划,以需求驱动生产,市场成功率可获提高。图书试读也可作为完善策划的一个环节。例如,亚马逊新推出试用的产品,总会大量收集用户的访问、评论、购买、推荐等各种数据,Kindle电子书阅读器里也会记录哪些内容被反复阅读和标记强调,经大数据智慧分析,能够评估其问题所在、受欢迎程度,然后决定该如何修正。科学的策划方案和修正意见,对作者和出版机构而言都极其重要,掌握这些宝贵信息的电商可以借此对产业链上游产生影响,或者达成合作。
 
  值得一提的是,图书创意与策划机构有时也针对一些重大选题展开市场调查,但其准确度远不及大数据分析。究其原因,传统调查主要使用抽样、问卷获得的概括性数据或者既往的交易数据,以部分代替整体,必然存在一定的偏差。而完善的大数据系统所能收集的,除了这些结构化数据,还包括大量文字、图片、音视频等相关的非结构化数据,作为数据“整体”则更为准确。此外,大数据中包含的社会化媒体信息多属于自发的思想和情绪流露,较之传统调查中被动答问更为客观,因而也更具参考价值。
 
  在衍生增值环节,图书电商可以围绕大数据进行数据产品销售、数据分析服务,或者建成数据分析、分享、交易平台谋取增值。对此前文已经论及。总之,依凭贴近终端用户这一核心优势,充分重视应用大数据,图书电商有望融入出版产业链两端的高盈利区域,在自身发展的同时,对整个出版业产生更大的影响。
 
  图书电商面临的挑战
 
  机遇总是伴随着挑战,当前图书电商要有效利用大数据,首先要直面数据采集渠道受限的问题。大数据来源主要包括:①媒体数据,尤其是互联网、社交媒体产生的数据;②企业的生产、销售、管理等数据;③政府部门的产业政策、公共服务、税收、财政等数据;④物联网、各种传感器及摄像头产生的数据;⑤民众个人、家庭留存的文字及音像数据。然而,目前政府信息的公开性不够,开放的、公共的社会网络环境还未形成,权威、可信的第三方数据统计机构缺位,使得很多数据难以获得,影响大数据的完整性和综合性。图书电商在期待环境改善的同时,唯有尽可能充分地应用社交网站等网络媒体,以合作、购买等方式获得广泛的外部数据,并使之与企业内部运营数据互联互通,以扩大数据采集量,强化多源数据的彼此关联与印证,为大数据分析打下较好的基础(见下图)。
 
  其次,图书电商必须大幅提高大数据分析与可视化呈现能力。大数据的意义不在于拥有庞大的数据量,而在于对之进行专业化分析以便应用。然而,“这种数据不同于以往传统的问卷调查数据,它们更庞大、更复杂,而且通常是非结构性的”;“有些行业的数据涉及上百个参数,其复杂性不仅体现在数据样本本身,更体现在多源异构、多实体和多空间之间的交互动态性,难以用传统的方法描述与度量,处理的复杂度很大”。[6]因而,新兴技术工具十分重要。麦肯锡名为《大数据:下一个创新、竞争和生产率的前沿》的研究报告列举了26项适用于众多行业的分析技术,包括A/B 测试、关联规则学习、聚类分析、众包、遗传算法、自然语言处理、神经网络、模式识别、预测建模、情感分析等。图书电商应搭建高性能的分析技术平台加以融合使用。技术平台的分析处理只是基础,要从模棱两可的数据中综合信息并导出可理解的内容,更需要兼通技术、出版、营销业务的高素养人才,才能将有价值的发现应用到营销战略规划和具体运营之中。更进一步,大数据分析结果需要以简明清晰、形象生动的方式予以呈现,才能便于理解,吸引用户关注,枯燥的数据罗列和冗长的报表不利于数据产品等衍生增值方式推广。这就需要运用数据可视化技术,涉及计算机图形学、虚拟现实技术、动画技术等。而无论数据分析师还是数据可视化人才,当前都很缺乏。新型技术升级与人才培养相结合,真正提升大数据分析与呈现能力,是图书电商面临的紧要任务。
 
  另外,数据安全、隐私保护也是图书电商在大数据时代面临的问题。在大数据采集、分析和应用过程中,必然涉及个体用户的性别、年龄、地址、收入、消费偏好、行为特点等信息,大数据的强大功能甚至能获取一些企业、机构的未公开信息,如管理不当,将对社会和自身带来严重的负面影响。美、英等50 多个国家和地区已经以法律形式规范了个人信息数据的管理与使用,如美国的《消费者隐私保护法》、欧盟的《关于个人数据自动化处理之个人保护公约》等,而我国尚未出台类似的法律。[7]这种现状虽然在短期内有利于大数据应用和相关探索,但从长远看,用户个体出于对隐私安全的担忧和防范,会减少供给真实信息,从而造成大数据中冗余成分过多,阻碍其健康发展。另外,法律边界模糊,也容易引发争端。因而,在法律暂时缺位的环境中,图书电商应遵循基本的商业伦理,尊重用户隐私权,在具体操作中制定恰当的企业、行业规则,注意技巧和方法,不因商业利益对用户造成伤害,以期获得长远价值。
 
  总之,大数据时代已经到来,图书电商应尽快更新观念,从战略的高度把握这一机遇。从现在开始,重视各类用户数据的采集、整理、分析和应用,以之为中心,重构业务流程和组织结构,提高对用户需求的感知能力和响应速度。随着大数据环境日益成熟,驾驭大数据的能力逐步提升,图书电商有望在新时代续写华章。

[时间:2013-11-26  作者:于春生  来源:中国新闻出版网]

黄品青微站