XIVIL和 DAM技术跨媒体出版



肖建国



  生于 1957年,现任北 大方正集团公司副董事长、方正电子有限公司总裁、方正技术研究院院长

1995年 12月,任北大方正技术研究院院长

1998年7月,任北京大学计算机学院教授

2000年6月,任北大方正集团公司副董事长

2000年8月,任北大方正电子有限公司总裁



  DAM为“数字资产管理”的英文缩写它还有另一个名称是“内容管理”(英又缩写为CM)。DAM随着跨媒体出版的发展越来越多地受到出版界的重视。 DAM已不仅仅是数字信息存储管理的工具它正逐渐演变为工联网时代出版系统的核心。DAM给跨媒体出版带来的技术上的进步在中国出版用户的应用中已经得到充分的证明。



一、信息生存周期的变化使DAM走上信息发布的前台

  互联网在影响传统出版的编辑、制作、发行的同时更深刻地影响了所出版的信息本身。出版信息的载体不再是单一的纸介质媒体出版信息的组织不再是简单的线性结构尤其重要的是出版信息的生存周期也随着互联网的出现而被大大改变了。报纸在完成了它的第一个生存周期后它的数字形式将开始报纸新闻信息的更长的基干互联网的第二个生存周期。数字化的出版信息被检索、被重用被交易被改写已成为一种潮流和趋势。



  在这种潮流和趋势下跨媒体出版技术便应运而生了。制作一次发布多次成为出版界追逐的目标。在这样的需求下传统的文档管理系统数据库系统都显得有些力不从心。好在基于 XML的 DAM系统恰好可以满足跨媒体出版的要求。首先带有无数据的XML文档使出版信息的重用成为可能其次XML文档没有与出版信息表现相关的数据使出版内容理论上可以在任何媒介上发布。DAM系统在跨媒体出版系统中责无旁贷地担负起营理XML文档的责任。互联网使DAM走上信息发布的前台走向跨媒体出版的技术核心。



二、DAM是跨媒体出版系统的基础

  应该说DAM并不是专门为跨媒体出版所准备的只有特殊设计的、符合特殊功能要求的DAM才适合跨媒体出版的要求。一个符合这种要求的DAM系统可以由下图表示



  在上图所示的系统中出版信息的 XMLgA构化处理、XML数据的存储与检索以及出版信息的跨媒体发布构成了该系统的技术核心.



  应该说直到今天绝大部分常用的文字编辑排版软件都是面向打印和印刷的。要使这些软件输出的结果数据存储到OAM系统中就必须进行归一化处理使这些数据转换成为XML数据。实现这种转换的自动处理是人们一直追求的目标目前的技术离人们的期望还有相当的距离以至于这种数据转换的需求衍生出一个专门转换数据格式的数据加工行业。在将数据以 XML格式存人 DAM系统的数据仓储系统的同时对存入的数据进行编辑也是必须的。一个易用的XML编辑器便显得十分重要。



  出版信息的XMLtg构化为实现自动的跨媒体出版打下了良好的数据基础。给XML数据配上用干显示XSLT的样式数据出版信息在互联网上的发布问题即可以解决。但XML数据印刷和光盘的发布还要费些周折特别是在RIP还不支持XML输出的现在。一种可选的方法是通过软插件技术把 XML数据直接嵌入到排版软件的版面上由排版软件实现XML数据到PS数据的转移。纸介质的发布问题解决后将PS转换为PDF光盘发布的问题也迎刃而解。



  跨媒体的信息发布仅仅是DAM提供信息重要的应用的一个方面出版信息的检索挖掘交易都可以在DAM系统中得到实现使出版信息的生存周期得到有效的延长。DAM技术与跨媒体出版技术的有机结合给电子出版技术的发展描绘了一个广阔的发展空间。



三、基于 DAM的方正跨媒体出版系统

  方正电子从1995年开始就将DAM技术及 SGML技术应用于跨媒体的出版系统目前开发出的产品包括服务于中国报业的跨媒体出版系统和服务干辞书出版的跨媒体出版系统。方正电子的报业跨媒体出版系统如下图所示

  

  在上图所示的新闻 DAM系统中采用了基于 MML的 NITF格式作为核心数据标准从而保证了跨媒体出版在数据上的可行性。XML过滤程序将新闻记者采写稿件常用软件的输出格式转换为NITF格式。XML编辑器实现已有稿件的编辑和新稿件的编写。这个系统的输出毫无疑问是跨媒体。



方正电子的辞书出版的跨媒体出版系统如下图所示(图略)

  这个系统是从 1995年开始开发的当时还没有 XML因而采用了 SGML。辞书是属于生存周期比较长的一类出版物但某些专业词条的局部修改又是必须的。设计这个系统的初衷是期望满足印刷再版和光盘出版的需要,幸好当初选择了 SGML使得将该系统的发布能力扩展到互联网成为非常自然的结果。该系统的特点在于它实现了印刷辞书电子数据格式到SGML格式的自动转换。



四、对DAM在跨媒体出版领域的展望

  DAM在出版领域已经给出了令人信服的应用但仍有许多问题有待研究和解决。DAM系统中的数据分析功能通常是通过数据挖掘技术来实现的。传统的数据挖掘技术主要是基于纯文本数据和关系数据库中的结构化数据,对于DAM中的XML数据如何进行数据挖掘?这是一个值得研究的问题。基于DAM的跨媒体出版所面临的另一个需要解决的问题是自动摘要问题。由干发布介质的不同导致DAM中的内容不能简单地直接发布尤其是对于小屏幕的发布设备更需要将较长的内容信息缩写成较短的发布信息。只有实现了内容的自动缩写功能才能满足在小屏幕发布设备上的自动发布功能的需要。在专门面向DAM的文字编辑工具软件被广泛接受之前将面向印刷打印的排版软件的输出结果自动转换成面向跨媒体出版的DAM数据的需求将持续存在。如果自动格式转换的问题不能很好地解决这个问题会成为阻碍出版DAM发展的瓶颈问题。



  由于跨媒体出版的特点出版信息自身的特点使得面向出版的DAM系统具有目前其他信息管理系统所不可替代的优势。从这一点上讲无论DAM系统本身还是DAM应用系统潜在的应用需求将不断增长特别是由于互联网信息发布的超媒体特性使得面向互联网信息发布的DAM系统必须具有除文字图像图形以外的视频音频、动画的数据描述、管理和发布功能。好在通用 DAM厂家已经在这方面开发出了很多产品,为跨媒体出版应用 DAM技术的发展打下了坚实的基础。

[时间:2001-06-04  作者:肖建国  来源:《中国印刷》第七届世界印刷大会特刊]

黄品青微站