地方出版业布局大数据的思考和探索

出版业大数据

  在新闻出版广电总局大数据建设的总体思路和顶层设计越发清晰的背景下,地方出版机构应充分利用国家支持大数据产业发展的优惠政策,从用户需求端着手,探索用户画像和产品服务的匹配推送,逐步推进大数据出版的产品化、品牌化、资本化运营。贵州出版集团数字出版中心副主任、数字出版“融智库”首批专家成员张忠凯在这篇文章中阐明了地方出版业布局大数据可行的思路和对策。

  2017年3月,国家新闻出版广电总局(简称“总局”)“新闻出版大数据应用工程”入选国家发改委促进大数据发展重大工程支持项目。随着总局十三五期间对大数据建设“资源编码化、生产数字化、运营数据化、服务知识化”顶层设计的越发清晰,部分中央部委出版社已从自身资源特点出发,有序推进大数据建设。对地方出版业来说,如何借助国家和行业对大数据发展的政策支持,在总局指导下,按照“互联网+”思维,以“技术+”为支撑,实现“内容+”、“信息+”、“知识+”的出版业大数据布局,成为当前抢抓战略发展机遇、推动业务转型升级的一项重要课题。
 
  一、地方出版业布局大数据的主要理念思考
 
  中宣部改革办高书生巡视员在谈到当前的文化大数据建设时有一个很形象的描述,认为基于用户需求端大数据建设的文化消费是“嗷嗷待哺”,基于产品开发端大数据建设的文化资源是“锈迹斑斑”,应当通过业务的全流程再造,加速“文化生产”的转型升级来带动“文化消费”。作为文化大数据生产、供应、保障的重要力量,地方出版业应当怎样认识大数据,进而有效布局呢?从布局大数据的理念出发,主要有以下三个方面:
 
  首先,大数据的核心是“全覆盖”,不是“规模大”。很多人一谈到“大数据”,概念就是“规模要很大”——整齐的机房,成排的服务器,以T为单位计算的海量数据。从地方出版业来说,第一没有必要高额投入大数据基础设施建设,第二自身资源数据远未达到“海量”要求,于是布局大数据就显得“大而空、不切实际”。实际上,“大数据”的理念核心不是“规模大”,而是“全覆盖”,强调对用户需求侧或产品供给侧一定专业领域、一定用户群体或者一定时空范围相关全集数据的采集和整理,通过对“全覆盖”数据的有效分析,达到对事物发展认识的准确统计、预测和进一步的应用服务,这是“大数据”的工作原理。即“大数据”不同于“抽样数据调查”,要求对事物相关数据进行“全貌”展现。由此可见,地方出版业布局大数据,首先考虑的是能不能在用户需求侧或产品供给侧一定领域内获得尽可能“全覆盖”的大数据,数据采集、汇聚“全覆盖”的可行、可操作是地方出版业布局大数据的基础。
 
  其次,地方出版业布局大数据应当从用户需求端着手,推进“大数据出版”建设。地方出版业布局大数据不同于中央部委出版社。中央部委出版社由于在专业出版领域积累了相对全面的资源数据,因此可以从产品供给侧着手,建立权威、专业、全面的资源产品“大数据”,并通过垂直领域提供用户服务。例如知识产权出版社,在全国知识产权总局指导下,建立“发明专利”大数据,为用户提供专利申请、维护等方面的应用服务,这样的资源是地方出版业不具备的。因此,地方出版业布局大数据不要从自身拥有的出版资源出发,开展“出版资源大数据”建设,而是考虑从用户需求端着手,积极探索采集一定领域内的用户全集数据,通过大数据分析对用户进行精准画像,从而依托自身内容资源,有效推进基于大数据分析的用户画像和产品服务的匹配推送,开展“基于用户需求端大数据的出版产品建设”。简而言之,是做“大数据出版”,而不是“出版大数据”。
 
  第三,地方出版业布局大数据应当在总局指导下主动出击。总局近两年来通过全面调研和系统研究,已经形成了相对清晰的新闻出版大数据体系建设思路,并在数据建设、知识服务、数据灾备、数据标准、项目试点、重点实验室等方面形成了一定的大数据建设行业布局。地方出版业布局大数据,应当在总局指导下主动出击,即按照总局对新闻出版大数据体系建设的顶层设计,以科技支撑为手段,以数字出版为过程,以融合发展为状态,选择适合的切入点,推动大数据布局的“数据+”、“内容+”、“信息+”、“知识+”业务流程建设。在建设过程中能够通过省新闻出版相关部门协调,与总局保持密切的工作联系,确保大数据布局符合总局建设思路。在这里要强调的一点是,布局大数据从理念上说,对地方出版业是一个抢抓机遇的发展契机,因此不能“等靠要”,一定要主动出击,建立符合总局思路、反映自身特色的大数据规划,通过夯实基础、有效布局、工作对接争取总局在大数据建设政策、授牌、项目等方面的具体支持。
 
  二、地方出版业布局大数据的工作思路解析
 
  从地方出版业布局大数据的工作思路出发,主要有以下两方面:
 
  首先,越是大数据,越要从具体的点切入。我们对大数据做一个形象的比喻:大数据就好比一本新华字典,地方出版业布局就好比主动寻找查阅新华字典的用户,如果有的用户总是查以“三点水”为偏旁部首的字,而地方出版业又正好具有带“三点水”字的出版优质资源,那就可以有针对性地策划这样的主题阅读推荐和产品订制服务,实现对用户的匹配推送。由此可见,地方出版业布局大数据,不是去做一本“新华字典”,而是基于一定范围内能够采集获得的用户全集数据,结合自己的资源优势,从一个具体可行的点切入,以“大数据分析为主,结合编辑经验”逐步改变过去那种以“编辑策划为主,结合抽样数据调查”的业务流程,通过布局“大数据出版”逐步提高地方出版业的选题质量、全媒体产品开发效率和“地方文化主阵地”经济社会效益。所以,布局大数据,不是做“大而空”的“花架子”,而是通过有效的数据分析,从具体可行的点切入,建立大数据出版模型,并在产品开发和用户推送的实践过程中不断修订完善。
 
  其次,“大数据出版”的产品化、品牌化、资本化推进。地方出版业布局大数据,应当按照产品化、品牌化、资本化的思路有序推进。即第一立足于开发基于用户需求端大数据分析的出版选题和全媒体产品,在产品得到用户认可后,再逐步打造形成地方出版业“大数据出版”的特色品牌,进一步为机构用户或个人用户提供品牌服务。第三,在“大数据出版”形成良好的商业模式和盈利能力后,借助国家财政的基金、文投等政策红利和资本“杠杆”效应,推进“大数据出版”的资本化运营,成为地方出版业股改上市或吸引投资的亮点。
 
  三、地方出版业布局大数据的具体对策探索
 
  从地方出版业布局大数据的实操对策来说,当前可以从以下三方面开展探索:
 
  首先,建立“不求所有,但求所用”的“融合”专业团队。布局大数据对出版业是一个全新领域,有待积极的创新和探索,这方面整个出版业可以说人才资源都很薄弱,没有成熟经验,属于“趟石头过河”。地方出版业相对于中央出版业来说,在人才队伍、资源、经验等各方面,劣势更加明显。地方出版业布局大数据,首先要解决的,是一个“我该怎么做”的问题。这就需要建立一个团队来进行充分论证。从实操上说,建议地方出版业从数字出版部门和具有市场图书销售经验的编辑部门,抽调骨干力量,组建专职团队,此外再外聘三支“兼职”团队:一是能够采集用户数据的基础团队;二是能够开展数据分析、建模的技术团队;三是出版业内对大数据已经形成一定研究的专家团队。这三支团队,对地方出版业来说,就是“不求所有,但求所用”,通过三支兼职团队和一支专职团队的有效融合,努力打造地方出版业可行、特色、可持续的大数据布局采集、加工、建模、应用、修订、完善业务全流程。从事实上说,地方出版业依靠自身力量很难完成大数据的有效布局,应当借助外力,建立一支高质量的“融合”团队,通过多层次、多形态的合作方式来共同完成对大数据布局的“攻坚克难”。
 
  其次,通过策划项目争取国家政策支持。通过项目把国家对出版业的支持细化、实化、具体化,已成为当前传统出版业的共识。在2017年1月召开的中国出版发展报告会上,总局规划发展司朱伟峰司长把“新闻出版大数据建设”明确列入“2017年项目工作支持的8个重点方向”。地方出版业布局大数据,可以通过策划项目来争取国家政策支持,以项目带动来推动布局。但要注意的一点是,十三五期间国家政策和资金支持的项目,一定是“实施在建项目”,而不是“策划拟建项目”,也就是说,地方出版业布局大数据,项目必须提前策划、充分论证并组织实施,国家政策支持的,是你“正在做”然后“帮你做”的项目,不是“你想做”然后“给你做”的项目。
 
  第三,稳步投入,注重投产比。地方出版业布局大数据初期存在的最大风险是,基于用户需求端大数据分析在数据模型构建、选题策划及产品匹配推送等方面可能存在一定偏差,即基于大数据分析完成的产品策划及销售可能与数据分析结果有较大出入。这与用户需求端大数据分析是一项全新课题,数据模型从理论到应用的实践过程中还需要不断修订完善有很大关系。因此,地方出版业布局大数据应当稳步投入,注重投产比的合理性。特别是初期应对资金投入进行合理规划,对人力、数据采集、产品开发、服务器管理等进行细致的成本测算,避免不合理的“烧钱”,并通过前期众筹、大V推荐等对产品推送进行有效的用户测试,从而降低布局大数据的整体运营风险。
 
  2017年是实施“十三五规划”的重要一年,也是供给侧结构性改革的深化之年,大数据建设是“十三五”期间推进供给侧结构性改革的重要措施。总局数字司张毅君司长在谈到2017年工作重点时也指出,将构建“新闻出版大数据应用工程”,指导组建“新闻出版大数据中心”。在这样一个形势和背景下,地方出版业直面挑战、把握契机,从具体的点切入,稳步推进,并通过项目锻炼形成自己的专业团队,就能够在出版的“大数据”领域拥有自己的“一席之地”。

[时间:2017-04-13  作者:出版商务周报  来源:出版商务周报]

黄品青微站