全球数字出版格式大全

  在数字出版成为出版业的热门话题,随之而来的数字出版格式开发热潮和竞争也进入了一个高速发展的阶段。在这支开发大军中,既有传统的软件开发商依托已有成熟技术登陆这一领域,也有移动阅读设备开发商利用其硬件普及性加入这场大战,更有一些对数字出版着迷的出版人以极大的热情开发了许多功能各异的数字出版格式供人们免费使用。

  对于正处在青春期迅速成长,激情四射的数字出版业而言,现阶段每种电子出版格式都有它的支持者和领先者。尽管关于“哪种格式是最好的”的争论越来越激烈,但,对于出版人而言,有一个主旨不能忘记,那就是一切出版模式都是为了满足读者的需求。不同类型的出版物读者,对图书的使用功能有着不同的要求,因地制宜,以客户为中心才是出版人在选择数字出版格式时最重要的原则。

  本文中,笔者搜集了截至2009年8月全球正式对外公布的27种数字出版格式,以期与国内出版同仁共同分享。以下就让我们比较一下这些用于数字出版创建和发布的各类格式。对于今天的出版人来说,电子格式是给传统出版业带来附加使用价值的手段。因此,在了解或判断某种数字出版格式时,我们应该着重了解它能实现的新兴功能,而不应单一的横向比较。

  格式细说

  *  格式名称:纯文本文件格式Plain text files

  文件格式:文本文件

  发布文件后缀:.txt

  以纯文本格式创建的e-book具有压缩比高、文件小的优点。比如一本《圣经》只有4兆大小。纯文本文件格式自带的ASCII标准允许此类文件在Unix、苹果、微软视窗、DOS等其他系统上自由的进行内部格式转换,这一点是目前许多数字出版格式无法比拟的。

  *  格式名称:超文本标记语言Hypertext Markup Language

  文件格式:超文本文件

  发布文件后缀:htm;.html

  HTML是一种标记语言,被使用于当前绝大多数网页中。使用HTML的e-book可以方便的通过任意一种Web浏览器进行阅读。这种文件格式的规范是由W3C组织维护以及完全免费开放的。 作为标记语言,HTML添加了许多特殊的标识性元素(否则它就只是纯文本编码字符集了,就像ASCII或UTF – 8一样)。因此,作为一种易于格式化的文件,它可以利用纯文本编辑器或程序编辑器通过手工编写生成。目前,市场上有许多HTML生成应用软件,这些软件大大简化了HTML文件的编写过程,它通常不要求编写者掌握太多复杂格式方面的细节知识。HTML格式不要求描述整个网页,也不需要特别的设备来将多种不同类型的文件(如图片等)存储一个单独的文件中。通常使用HTML格式的e-book一般按章节进行存储。

  HTML的缺点在于它不是一种十分有效的信息储存格式,对于某个指定的内容,即便只是纯文字内容,它需要比许多其它格式更多的存储空间。[next]

  *  格式名称:亚马逊Kindle Amazon Kindle

  文件格式:Kindle

  发布文件后缀:.azw

  亚马逊公司在发布掌上阅读器Kindle的同时,也创造了AZW格式。AZW格式利用一系列稍有不同的序列号,基于移动便携(Mobipocket)标准而产生的,并且它具有独自的DRM(数字版权管理)格式。在Kindle上,e-book的购买是通过EvDO通讯协议(这种通讯系统被亚马逊称为耳语网络Whispernet)进行无线传送,所以用户在下载过程中不会看到任何AZW后缀的文件。

  *  格式名称:开放式电子包Open Electronic Package

  文件格式:开发式eBook

  发布文件后缀:.opf

  OPF is an XML-based e-book format created by E-Book Systems.

  OPF是由E-Book系统创造的,基于XML的e-book格式。

  *  格式名称:TomeRaider

  文件格式:TomeRaider

  发布文件后缀:.tr2;.tr3

  TomeRaider是一种专用e-book格式。目前TomeRaider为Windows系统、Windows移动(又称掌上电脑)系统、Palm,Symbian以及其它平台开发了多种版本。维基百科也以TomeRaider作为e-book格式,提供所有文章的完整版电子文件,有些甚至涵盖几乎所有的图片。TomeRaider3电子书阅读器对于每种平台,功能差异也很大。如:Windows系统和Windows移动系统版本支持完整的HTML和CSS;Palm系统版本只有限地支持HTML(例如,不支持表和多字体),以及对CSS的支持也被移除。对于Symbian系统,只有老TomeRaider2格式对其支持,但它不具备图片显示以及提供分类检索功能。尽管在支持的所有平台上,对TomeRaider格式的电子书浏览效果有些差异,但在Tomeraider主页上声称已有超过4000电子书可供下载,其中包括了网络电影数据库和维基百科的免费版本。

  *  格式名称:Arghos Diffusion

   文件格式:Arghos Diffusion

  发布文件后缀:.tr2;.tr3

  ARG格式是由法国公司Arghos Diffusion开发的一种基于XML的专用格式。ARG文件使用专有的DRM和加密方法,并且只能用Arghos阅读器进行读取。它支持多种文本、音频或视频等输入格式,如PDF、WMA、MP3以及WMV,并且支持多种互动功能,如书签,高级纯文本检索和动态文本突出显示等

  *  格式名称:翻转书Flip Books

  文件格式:Interaxive media

  发布文件后缀:.fb

  “翻转书”是一种特别e-book类型,它实际上是以一种 “翻转”方式展示的虚拟网页。使读者在阅读图书电子版时感觉就像翻开一本真正的书或杂志。全球第一个动态翻转图书阅读器是由Interaxive Media公司为加拿大Nishe Media公司于2004年开发的,因此这种阅读器也被称为“Nishe书页”。第一个版本中的个别部分有加拿大Cybaris公司开发,并于2004年8月第一次公开展示。此后不久,市场上出现了许多模仿“翻转书”的产品,这都要归功于Macromedia公司开发的Flash中先进功能—集成Flash组件的硬编码的应用。 

  该格式的初始软件系统时至今日依然是独一无二的,它是一个完整的基于服务器的CMS系统,支持e-book的创建、发布以及通过Web服务器进行远程浏览,无需安装任何客户端软件。 Nishe Media公司于2004年倒闭时,将剩下的未完成的软件留给Interaxive Media公司在香港继续进行开发。虽然没有在亚洲之外广泛使用,但现在它已发展到了版本3.0,已经是一个基于服务器的电子图书平台。它的专利技术一直被最初开发者—瑞安.萨瑟兰独自持有,他也是Interaxive Media公司的创始人和拥有人。

  *  格式名称:NISO Z39.86

  文件格式:DAISY

  发布文件后缀:DTB[需要引用]

  DAISY是一种基于XML的电子图书格式,它是由DAISY国际集团图书馆分部为具有阅读纸制书障碍的人们所开发。DAISY主要关注于两个主要类型e-book的实现,分别是音频电子书籍和文本电子书。DAISY格式的一个子部分已经通过了美国法律,成为教学辅助材料国家标准,并且免费提供该格式的电子版K – 12教材给美国广大残疾学生。 [next]

  *  格式名称:小说图书FictionBook

  文件格式:小说图书

  发布文件后缀:.fb2

  小说图书一种最新流行的基于XML的e-book格式,它由数字出版爱好者,进行开发支持。具体信息可以参看httphaali.cs.msu.rupocketpcFictionBook_description.html

  *  格式名称:自主文本编码Text Encoding Initiative

  文件格式:自主文本编码Lite

  发布文件后缀:.xml

  自主文本编码Lite是目前非常流行的基于自主文本编码(同时也基于XML以及基于SGML)的电子文本格式。开始应用于主流虚构小说的数字出版。

  *  格式名称:Plucker

  文件格式:Plucker

  发布文件后缀:.plucker

  Plucker是一款免费的阅读器软件,它拥有相关的文件格式,并且提供专门的支持软件将HTML文件、网站或RSS种子自动生成为plucker文件。这种格式可以被认为是一种压缩的HTML文档,与微软开发的的CHM格式类似

  *  格式名称:压缩HM Compressed HM

  文件格式:微软压缩HTML帮助文档格式

  发布文件后缀:.chm

  CHM格式是一种基于HTML的专用格式。该格式支持多页和嵌入式图片,并以专用的元数据进行发布,同时也可将它作为一个单独的压缩文件使用。这一特点弥补了HTML格式中中,一个站点由多个HTML文件和相关的标准格式的图像文件构成的繁琐性所带来的不便。

  *  格式名称:便携文档Portable Document

  文件格式:Adobe便携文档

  发布文件后缀:. pdf

  这是一种由Adobe Systems创建的文件格式,最初被用于存储和编辑可打印出版文档而提供一种标准表格。该格式来自于PostScript,当时没有“像循环”的语言特性,只是添加了一些像压缩和密码这样功能的支持。由于PDF文件可以很容易地在多种计算机平台上被用户浏览和打印,它成为万维网中非常普遍的文件格式。目前Adobe公司免费提供该格式的规范。

  由于PDF文件可以嵌入字体,图像和其他文件,并可包含一个或多个可缩放的页面图片,因此此类文件可以用于出版说明书、产品手册、杂志文章,乃至一本书。

  由于这种格式开发伊始是为了在标准纸张上进行打印而设计的,因此无法避免普通文本不能自动适应不同的屏幕宽度的缺陷。这一短处,使得它所承载的内容不太方便在有限的屏幕大小和分辨率下浏览,如在手机和掌上电脑上。目前,Adobe通过在Acrobat阅读软件中增加重排功能来解决这个问题,但为了使这项功能起作用,在创建文件时必须标记可以重排,这也意味着现有的PDF文件将不具备重排能力。在Adobe Acrobat的Windows移动(又称掌上电脑)版会自动在同步过程中将PDF文件标记重排功能。这个标记过程不会发生在被锁定的PDF文件上。当使用Windows Mobile设备中Acrobat时,这一标记的过程必须在该设备和Windows Vista进行同步后才会发生。

  多种Adobe的产品都支持创建PDF文件,如Adobe Acrobat和Acrobat Capture,还有一些第三方产品,如PDFCreator,OpenOffice.org,和FOP以及其它几个编程库同样可以创建PDF文件。Acrobat Reader软件(现在简称为Adobe Reader)是Adobe产品经常用来浏览PDF文件,以及第三方的浏览软件如xpdf也很不错。 Mac OS X中也具有内置的PDF格式支持模块,它包括为了创建PDF文件部分,它也是打印系统的一部分,和用于显示的内置预览程序。

  最新版本的技术说明书中添加对表格、评论、超文本链接的支持,甚至具备互动元素,如表格输入按钮、触发声音和视频。这些功能可能不被老版本或第三方浏览软件所支持,并且有些不能转移打印。

  PDF文件也被以下这些电子图书阅读器所支持,具体有iRex iLiad,、iRex DR1000、Sony Reader、 Bookeen Cybook、Foxit eSlick 和Amazon Kindle DX。[next]

  *  格式名称:PostScript

  文件格式:PostScript

  发布文件后缀:. ps

  PostScript是一种页面描述性语言,电子和桌面出版领域中用它来定义内容和打印页面的布局,其具体通过一个渲染程序进行组合并创建实际输出位图。许多办公室打印机直接支持解释PostScript,打印出结果。因此,该格式也在Unix世界中得到广泛使用。

  *  格式名称:DjVu

  文件格式:DjVu

  发布文件后缀:.djvu

  DjVu是一种在存储扫描图片方面具有专长的文件格式。它对低彩色图片具有很好压缩性能,就像文本文档一样。每个文件可以包含一个或多个页面。

  该格式长期以来一直默默无闻,但现在有很多免费工具可以处理这种格式,它的处境也开始发生变化。

  包含页面图片被分为不同的层(如多色、分辨率低、低压缩比的背景层,和简单色,高分辨率,高压缩比的前景层),每个层最以最有效的方法进行压缩。该格式解压缩也很快,甚至比基于矢量的格式都快。

  DjVu的优点就是它可以采取一个高分辨率扫描图片(300-400像素),足以为支持全屏阅读和打印,存储也非常有效。 一打300像素黑白扫描图片可以不超过1兆字节进行存储。

  *  格式名称:微软LIT Microsoft LIT

  文件格式:微软阅读器

  发布文件后缀:.lit

  具有数字版权管理保护功能的LIT文件只能在专用的微软阅读程序中使用,作为.LIT格式,不同于简单的微软CHM格式,它包括数字版权管理功能。其他第三方阅读器,如Lexcycle Stanza,也能够读取未写保护德LIT文件。还有一些Lit转换工具,可以将.lit文件转换成HTML文件或OEBPS文件。

  微软阅读器使用具有专利的ClearType显示技术。可以通过键盘、鼠标、手写笔,或通过电子书签进行读者导航。目录图书馆在个性化的“主页”中记录着读者阅读记录,并且图书使用ClearType进行显示以提高可读性。每一个用户可以在任意页添加注释和笔记,可以使用一个简单的指令来创建一个大字体的电子书,或在读者页中创建自由格式绘图。内置的字典方便用户查找单词。

  *  格式名称:    eReader(前Palm数字媒体花生出版社)

  文件格式:Palm Media

  发布文件后缀:. pdb

  eReader是一种用于浏览掌上数字媒体电子图书的免费程序。它可用于iPhone,Palm操作系统,Symbian,黑莓,Windows Mobile掌上电脑智能手机,桌面Windows以及苹果系统。读者可以像读纸质书一样,在同一时间显示一个页面的文本。eReader支持嵌入超链接和图像。此外为iPhone和iPod Touch开发的Stanza应用程序可以读取加密和非加密eReader文件。

  该公司网站- ereader.com自主维护基于eReader格式的电子书,大部分需要购买才能下载,只有一小部分书目可以免费下载。所有付费的图书都是经过加密,将购买者的全名和信用卡号码作为加密的关键信息。此信息不保存在电子书文本当中。通过单向哈希方法进行加密,因此对用户的私人信息不构成任何被窃取的风险。

  该程序支持书签,脚注等功能,用户可以在任意页用书签标记,对任何一个文本和自己喜欢部分的做脚注,甚至是评论,这部分脚注都可以作为独立文件导出为备注文件。

  该文件格式还自带一个综合参考词典(包括具有476,000个单词的韦氏辞典,包括发音键),并且支持使任何文字文本在字典中突出显示。某些鲜见的商业字体也可通过单独购买和下载获得。

  2009年7月20日,Barnes & Noble公司宣布eReader格式正式用于eBooks的发布载体。Palm数字化程序的更新版本将支持苹果iPhoneiTouch,黑莓,苹果OS X和Windows平台,将可以在Barnes & Noble eBooks网站上提供下载。

  *  格式名称:    桌面作家Desktop Author

  文件格式:DNL阅读器

  发布文件后缀:.dnl;.exe

  桌面作家是一套能创建具有虚拟翻页效果的数字网络图书的电子出版软件。这款软件可以基于图书的数字网络建立虚拟化的网页。该格式可以写入任何出版类型的数字网络图书,包括手册、电子书、电子相册、电子贺卡、数字记事簿、在线简历、智力测试、考试、实验、表格以及调查问卷。 桌面作家将e-book打包成一个“.dnl”或“.exe”文件。每一个打包后的文件都是可以独立执行的文件,不需要任何其他程序来支持它运行。 DNL文件可以被任意网页浏览器或DNL阅读器单机运行查看。

  DNL格式也是e-Book格式的一种,随着开发的逐步完善,它被人们广泛认为是可以在未来完全替代纸质阅读感官体验的数字出版格式。DNL e-Book是DNAML Pty Limited公司开发,这家澳大利亚的公司成立于1999年。DNL e-Book可以通过桌面作家软件或桌面通讯员软件进行制作。[next]

  *  格式名称:牛顿电子书Newton eBook

  文件格式:牛顿电子书

  发布文件后缀:. pkg

  俗称“苹果牛顿的书”,每个单独的牛顿打包文件可包含多本图书(例如,一套三本书的三部曲可以打包在一起)。所有可运行牛顿操作系统的相关系统(最常见的包括牛顿MessagePads,eMates,西门子秘书工作站,摩托罗拉马科斯系统,数字海洋海马系统和Tarpons)都自带有内置的软件来支持浏览牛顿电子书。

  牛顿包格式是由牛顿公司开发,不过在公司正式发布前,公司被苹果电脑公司所兼并,因此这款格式的知识产权目前隶属苹果公司。该格式是完全免费开放的,因此许多数字出版技术商都针对它开发了阅读器(开发一个牛顿电子书转换器甚至已经被视为某些大学毕业测试级水平的指定项目)。

  牛顿电子书不支持数字版权管理或加密功能。但是它所支持的内部链接、内容和索引的多表关联、嵌入式灰度图片,甚至一些脚本功能,也是其他格式不能企及的。牛顿电子书利用Unicode编码,可支持多国语言显示。实际上,牛顿电子书包含多个视图模式,根据情况可以将同一内容以不同的方式进行展示(如在不同的屏幕分辨率时)。

  *  开发厂商::方正电子Founder Electronics

  文件格式:阿帕比阅读器

  发布文件后缀:.xeb;.ceb

  阿帕比是方正电子开发的格式。这是一种流行的中文电子书格式。它可以被阿帕比阅读器软件所读取,并且使用阿帕比出版软件可以创建此格式的电子书。.xeb和.ceb文件都属于二进制编码文件。伊利亚特电子书阅读设备就集成了阿帕比电子书'浏览器'。

  *  格式名称:iPod Notes

  文件格式:iPod media

  发布文件后缀:.notes

  Notes是iPod重要功能之一,它可以将简短的文字说明显示在iPod屏幕上。由于屏幕大小的限制,它只能写4096个字节,目前有一些工具可以将较长的纯文本文件转为notes格式。基本HTML也是可以转化的,但除此之外,只有纯文本格式。

  *  格式名称:Libris

  文件格式:移动信息设备模式

  发布文件后缀:.lbr;.bin

  Libris是一款专为移动设备(如手机)开发的数字出版物格式,基于Java语言的电子书阅读器。Libris可以运行大多数的支持MIDP的可执行Java的设备上。这种格式的电子书可以按设备屏幕进行调整,并且在显示时,使用高品质的反锯齿字体。这种格式支持加密或采用无限制模式。Libris内容可能使用MakeLibris工具来创建。Libris阅读器还支持PalmDoc格式。

  *  格式名称:Mobipocket

  文件格式:Mobipocket

  发布文件后缀:.prc;.mobi

  Mobipocket电子书格式是基于开放电子书的标准,并采用XHTML,支持JavaScript和框架结构。它也支持原生SQL语言对嵌入式数据库进行查询操作,以及与其相应的电子书阅读器。维基百科德语版的电子书就采用Mobipocket格式进行出版发行。

  Mobipocket阅读器拥有一个主页图书馆。读者可以在一本电子书的任何部分添加空白页,并且手写添加注释包括注解、书签、校对、笔记以及绘图等。此格式可以很好得组织标记这些内容,并在下一次阅读时从原位置显示。 Mobipocke阅读器还具有电子书签和内置字典。

  该阅读器可以全屏模式进行阅读,并且支持多款PDA,通讯器以及智能手机。 Mobipocket产品同样支持Windows,Symbian,BlackBerry和Palm操作系统。在Linux和苹果系统中,可以使用Okular和FBReader等应用程序,对未加密的文件进行读取。

  亚马逊Kindle的AZW格式即是以Mobipocket格式为基础,再添加一种略有不同的序列号而产生的。目前Mobipocket也正在开发将.epub格式转换为.mobi的项目,此项目称为mobigen。

  *  开发厂商:国际数字International Digital

  格式名称:EPUB

  文件格式:IDPFEPUB

  发布文件后缀:.epub

  .epub或OEBPS格式是由国际数字出版论坛(IDPF)为创建电子图书而开发的开放性标准。它结合了三种IDPF开放标准:

  开放式出版物结构(OPS)2.0,用描述内容标记(无论是XHTML或Daisy DTBook)

  开放式打包结构(OPF)2.0,它用于在XML中描述.epub。

  OEBPS容器格式(OCF)1.0,它用于将所有文件捆绑在一起(重新命名为一个ZIP文件)。

  目前,这种格式可以被索尼阅读器、BeBook、Adobe Digital Editions、Lexcycle Stanza、BookGlutton、AZARDI、Android 系统上WordPlayer以及Mozilla Firefox中附带OpenBerg Lector所读取。其他一些阅读器软件程序也正在实现对这种格式的支持,如dotReader、FBReader、Mobipocket、uBook和Okular。另一个.epub阅读器:Lucidor已经进入beta版测试阶段。

  2008年,BookGlutton推出了服务器端从HTML到EPUB格式转换器。

  Adobe数字编辑器也使用.epub格式作为其电子书格式,并且通过其专有的ADEPT机制提供DRM保护。但是最近开发的INEPT架构和脚本可以利用反向工程技术跳过此编辑器提供的DRM保护。

  *  格式名称:宽带电子书Broadband eBooks

  文件格式:索尼传媒

  发布文件后缀:.lrf;.lrx

  此数字图书格式被索尼公司所使用。这是一种享有专利的索尼公司独家使用的格式,经索尼公司解码后与一种高阶未对外发布的阅读器软件配合使用,可以在非索尼的产品上阅读该格式的内容。LRX文件可以被扩展以支持DRM加密的电子书。

  *  格式名称:SSReader

  文件格式:SSReader

  发布文件后缀:.pdg

  此数字图书格式被用在著名的中国数字图书馆公司—超星数字图书馆上。它是一种专用光驱图片压缩和捆绑格式,和阅读次数OCR插件模块。该公司扫描了数量庞大的中国国家图书馆的藏书,这成为其服务的主要资源。目前此格式的详细信息尚未公布。现在还有一些其他的商业电子书格式也在中国数字图书馆中使用。

  *  格式名称:多媒体电子书Multimedia eBooks

  文件格式:Eveda

  发布文件后缀:.exe or .html

  多媒体电子书格式可以将多媒体和文字等多种内容形式组合在一起。这个词可以用作名词或形容词,来描述具有多种内容形式的媒介。目前,几种形式媒体的配置只能以Adobe Flash技术的基础上来实现。其翻页技术也应用到保护传统图书的序列声明上。

  “多媒体电子书格式”这个词是相对于单一媒体,如那些只利用传统的形式印刷的书籍。多媒体电子书格式包括了文字、声音、还有图片、动画、视频以及交互内容等形式相结合。此格式用于创建文学小说作品,有时,也可添加一种视觉音频元素和互动内容产生一种新形式的创意。用户(如读者)有机会参与整个事件中产生每个特征,去体会为某段叙述或图片配的音乐部分带来的感受。这种以若干媒体形式来对内容进行展示的形式将极大地扩展了艺术和创造力的波及的深度。

[时间:2009-11-24  来源:数字出版在线]

黄品青微站