Adobe揭开元数据平台——XMP的面纱

(Adobe Unveils its Metadata Framework——XMP)

  Adobe公司为了满足在内容文件的内部承载元数据,开发了一套通用的平台结构,可以应用于Adobe推出的各种桌面应用软件中,在生成的文件中嵌入元数据。该产品既为eXtensible Metadata Platform(XMP),它会成为流行的PDF工具吗?

  第一批支持XMP的产品有Adobe Acrobat5,和刚刚推出的InDesign2以及Illustrator10,同时Adobe公司还许诺很快将在Photoshop、GoLive中加入支持XMP的插件,最终实现Adobe的所有桌面产品都支持XMP。

  另人感兴趣的是,Adobe将公开发行XML的参数,并向获得特许执照的开发商发布开发工具,希望得到更多地支持,最终成为行业标准。

什么是XMP?
  元数据——关于数据对象的信息——通常被存储在数据库中,并带有一个指针指向相关的文件。尽管可以将元数据看作数字文件的一个标签,但它们并不是文件本身,不能跟随文件一起移动。它们是以软件开发商所定义的一种形式工作的,而不是用户定义的。如微软的Word软件包含一些属性页,用来记录文件的标题、作者、创建日期和其他一些元数据。Word以二进制和RTF格式的形式存储这些属性页,每个文件格式保存文件的形式都各不相同,如TIFF图像文件将元数据放在文件开始的地方。

  XMP为了能一致地将元数据写入头文件或机器可读的标签中,创建了一组规则约定,并将它们打包成一个二进制内容对象。这些标签没有改变对象内部的数据,而是一个可精确编辑的外部包装。Adobe已经决定使用基于XML的标签语法,并有意识地为创建各种变化的标签(不是固定的标签定义)制作一套结构,这些变化的标签可以由一种扫描软件读取。

  这些机器可读的标签——由桌面出版软件编写,如Illustrator或InDesign——成为文件的一个组成部分,当文件从一个软件转移到另一个应用软件的时候,标签也跟随着转移到另一个软件中去。

四个组件
  XMP作为一个平台,包括多种书写标签定义的方式。目前主要包括4个组件:
  1.XMP框架结构。XMP描述组件是由互连网协会(World Wide Web Consortium-W3C)开发的RDF(Resource Description Format)的子集。RDF是描述资源描述元数据的标准方式,如目录或编写目录的信息。与XML文件类型的定义或规划相比,RDF不需要在每次修改某个标签的时候都重新定义文件的类。
  2.XMP包。为了将元数据从一个应用软件转移到另一个应用软件,Adobe公司的XMP软件包技术也遵循了W3C的标准。XMP包是一个工具,利用它将XML元数据封装到应用文件的内部。
  3.Schema(分类)。标签中使用的实际类别和术语通常在XML分类中定义。Adobe为XML设计了13个核心分类,包括Dublin Core,媒体资源管理、数字版权等等。集成有XMP文件的部门还可以将自己的分类包含进XMP包中。
  4.取样软件。读这些二进制格式的文件需要有专用的软件。Adobe在市场上广泛散布一种软件开发工具箱,对于有特许资格的公司来说可以免费获得。该工具箱内包含扫描和解析XMP标签的软件。Adobe公司极力主张应用XMP的人士快速获取这套工具,以便可以尽快编写自己的XMP工具。(如几个开发资源管理的公司正在编写可以读取XMP标签的软件,并可以自动地将元数据作为一种资源装载到自己的数据库中,等待由系统查询。)Adobe分别为苹果平台和Windows平台准备了各自的软件开发工具包。

如何使用XMP?
  XMP对桌面和服务器软件有一定的影响,也会对其他的软件开发商、集成商和咨询顾问造成一定的影响,当然也对用户有影响。

  在桌面软件方面。第一个支持XMP的桌面软件是Adobe公司开发的软件,在去年5月随着Acrobat5的面市而出现,就是在那时Adobe宣布他们已经在PDF浏览器中加入了支持XML代码的功能,这是最新的特征,同时也是PDF1.4的一个组成部分。

  刚刚推出的Illustrator10和InDesign2中也加入了对XMP的支持。Photoshop和GoLive很快也会作出反应,Adobe公司的最终目的是在其所有的产品中均建立对XMP的支持。

  除了Adobe公司自己的软件外,他们还向其他开发商推荐XMP,希望他们也能将XMP嵌入到JPEG、TIFF、GIF、EPS、PNG、XML和HTML文件中。对于HTML和XML,嵌入的方法将和W3C推荐的将XML装入HTML文件中的方法一致。

  到目前为止,XMP还没有直接的竞争对手,如Quark、Corel或Macromedia都还在盘算着加入到XMP的竞争中。由于没有相类似的产品与Adobe相抗衡,迫使用户要么自己开发一个替代产品,要么只好采用Adobe的产品。累积这样的支持实际上是XMP成功的保证,如果没有它,可能XMP只能是对Adobe的产品有用,而对另外领域内不兼容的产品就不适用了。

第三方服务器产品
  率先采用XMP的用户中大多为集成商,VAR和开发商生成一种与InDesign相连接的系统。例如Managing Editor公司的TruEdit产品是一套低端的杂志编辑/制作系统,利用XMP来更新InDesign和InCopy文件的元数据。同样,希望大多数的报业系统开发商也能与InDesign和InCopy达成利用XMP的协议,作为将元数据从桌面转移到数据库中的一个通道。

  资源管理系统开发商也非常热切地与XMP合作。Artesia、MediaBIN、NorthPlains和WebWare公司承诺他们将支持XMP,并显示与Adobe软件中的元数据进行交换的技术。对于这些开发商,XMP为他们解决了错综复杂的问题,Artesia公司解释:XMP使他们公司用一种丰富的、全面的、均一的方式支持Adobe公司的套件。在XMP之前,Artesia公司就在他们的产品(TEAMS)中建立了一定的智能化来分别处理每种媒体类型。

  内容管理开发商,尤其是Adobe公司的同盟,如Documentum和Interwoven,都基于同样的原因融合了XMP。

与作业传票相连接
  作业传票上包含有关于文件的元数据,但是Adobe将XMP元数据看作是信息的类别,这些信息有可能在发送到打印机的时候被RIP所忽视。但标注作业传票ID可能会改变这种现象,它能使生产系统提取正确文件的作业传票。

自动装载过程
  尽管Adobe宣布可描述的XMP是对象承载文章环境的一种方式,但意识到单一内容对象在它的生命周期内可能有多个环境是非常重要的。由于对象在创作和生产过程中不断地被移动,而且在不同的出版物中有不同的关联环境,与之相对应的元数据域以及它的数值也发生变化。在一些情况下,如作业传票,可能应用的是完全不同的元数据。XMP将使集成商在Adobe软件内部生成定制的属性页变得更加容易,但由于每个组织有自己独特的元数据需求,因此仍然需要终端用户定制各自的属性页。一旦指定了类别,用户的接口也生成了,XMP就可以帮助用户省略许多多余的步骤。

为什么XMP如此重要?
  Adobe是第一个将用户定义的元数据嵌入到流行的桌面出版软件中的开发商。这是一个非常重要的举措,因为即使到现在还没有开发出承载元数据的标准方法,如从一个应用软件到另一个应用软件的状态信息;也没有将来自桌面出版软件的元数据载入数据库的标准方法;同样也没有定义或扩展由某个桌面软件保持的元数据域的标准方法。因此无论Adobe是否能说服其他开发商采纳这个平台,都显示了将问题放在表面,提出问题并尝试解决问题的态度和决心。

  XMP作为一个潜在的标准已经做了很多事情,到目前为止,还没有竞争对手出现,它帮助Adobe公司加入到满足用户定义的分类当中,它在确定如何书写字节的时候遵循W3C的惯例。

  缺点是Adobe公司的基本元数据集对于许多应用软件来说不太够用,所以用户与他们的集成器一起还将进一步定义分类开发出个性化的元数据,他们现在正朝着这个方向努力。另一个缺陷是XMP与老软件中的二进制不兼容,因此工作流中所有涉及到XMP文件的软件都应该被升级,否则不能读取文件。鉴于此原因,头批应用XMP的软件中加入了“包装剥离器”来去除外部的标签。

总而言之,还需要花一定的时间才能体会到XMP对业内的影响,但长远来看,朝着处理元数据的方向迈进是正确的一步。

[时间:2001-12-25  作者:必胜网  来源:必胜网]

黄品青微站