PDF文件与电子版图书


  随着数字化技术的飞速发展,基于纸张印刷的传统图书受到了重大的挑战。国外很多大出版社,在出版传统图书的同时,都有内容完全相同的光盘与之配套,供有不同需求的读者选购。与传统的图书相比,电子版图书有很多独特的优势,如所占的存储空间小、保存时间长、便于查找、复制方便(在某种意义上也是它的缺点)等。目前国内对电子版图书的出版已出现了很好的势头。但制作电子版图书必须选择一种文本存储格式,而选择一种理想的文本格式则是产品在技术上取得成功的关键。

  

电子版图书及其要求


  电子版图书是数字化技术的产物,系指储存在非纸张媒介上的电子文本。所谓非纸张性媒介。目前多指磁盘或光盘类截体,其电子文本或存储在因特风的服务器上供读者新闻记者下载,或以只读光盘的形式在市场上发行。

  以电子文本为形式的图书应具有哪些基本要求呢?

  首先,产品的通用性。在读者新闻记者作品时,产生产者不应规定读者必须使用何种类型的电脑、使用何种操作系统或使用哪一种特写软件。所出品的光盘,应该既能在普通PC机上阅读,也应该能在“苹果”机上使用;既可在Windows9.X/NT平台上操作,也应该兼容服务器使用的UNIC系统。

  第二,不应仅包括书籍中的文字部分。一本好的传统图书也不是只有文字,而是图文茂的,这一点对于某些类型的读物,如儿童读物、美术作品、工程技术资料等尤为重要。

  第三,阅读时不需使用额外软件,尤其是不需要另外购买软件。

  第四,文件体积越小越好,对需要进行传输,如在线阅读或通过电子邮件发送时,尤其如此。文件的体积小,网络占用的时间就相对较短,这一点对于目前我国网络带宽较窄的实际情况尤为适用。

  第五,保持文件的完整性,内容不容易被篡改,不易复制或用于其他非法目的。

  第六,能够打印。这是传统图书不具备的功能。

  
目前流行的文本文件格式


  目前常用于编写文本的文件格式不处乎有以下三种:(l)纯文本格式(TXT格式);(2)微软的Word格式(DOC格式),以及相关的其他格式;(3)网页格式(HTML超支本格式)。其他格式如WPS格式、WRI书写器格式、RTF格式等,由于可以转化成DOC格式且特点相近,因此可以归为一类。

  第(1)种:纯文本格式,它是最基本的格式,简单、对系统要求不高,但只能传达文字内容,不支持图形,并且需要文本阅读器才能阅读。

  第(2)种:Word格式,它是目前广泛使用的文字处理格式,可以嵌入如图形、图像、照片甚至声音等各种对象(Object)。但其目的是进行文字处理,因此阅读上必须使用Word文字处理软件,并同时可在阅读时对内容进行改写。另外,从阅读的目的考虑,不同版本的Word文件之间并不能很好地相互兼容,也就是说,有不同的Word文件,要用不同版本的Word阅读。

  第(3)种:网页格式,这种格式目前主要用于网页和网络上的电子期刊,具有用于出版电子版图书所需的全部特点。这种格式需要用“微软”的Internet Exploroer(探索者)或“网景”的Netscape Navigator(导航员)阅读,这两种浏览器有时会出现小小的不兼容,同一篇文章用不同的浏览器阅读会出现两种不同的视觉效果。但作为电子版图书的文件格式使用时,其主要缺点则是超文本文件的构成过于琐碎,一本电子杂志有时需要由数十个乃至数百个文件组成,任何一部分都可单独提取出来用于其他目的,因此不利于作品保护。究其原因,这种格式从开始不是为了出版图书而开发。

  不难看出,尽管目前国内很多图书光盘采用以上三种文件格式,但对于电子出版物来说,它们都算不上是最理想的载体。由此人们也可看出为什么会有PDF文件格式出现以及国外广泛将其用于光盘版图书的原因。

  
什么是PDF文件格式


  PDF格式文件目前在国外非常流行,载来越多的光盘版图书、软件说明、帮助文件、产品手册、培训和自学教程等均采用这一文件格式。但对于国人(甚至包括部分“网虫”一级的电脑发烧友)来说,PDF文件仍然十分陌生。国内对此种文件格式的应用也不多见,因此有必要对这一新的文件格式做一下基本介绍。

  PDF是“便携文件格式”(Portable DocumentFormat)的简称,同时也是该格式的扩展名,由于它是通过Adobe公司的Acrobat软件生成的,因此
也叫做Acrobat格式。PDF文件格式是一种跨平台的文件格式,即可以在各种机型和操作系统上运行。它可把文件的文本、格式、字体、颜色、分辨率、链接及图形图像、声音、动态影像等所有的信息封装在一个特殊的整合文件中。大家对Adobe公司并不陌生,因为喜欢图形的朋友,尤其封面设计者,都知道其著名软件Photoshop。经Adobe公司的极力推广和PDF格式本身所具有的优势,PDF现在已经成为了新一代电子文本的不可争议的行业标准。

  
PDF文件格式的主要特点


  PDF文件格式的最主要的特点是,拥有超强的跨平台功能,适用于各种操作系统,如MAC、Windows、UNIX、LINUX以及OS2等。它通过自带的阅读器阅读,不依赖任何系统的语言、字体和显本模式。和其他传统的文件格式相比,PDF文件的体积更小,能更方便地通过因持网进行发布。例如,我们可以在PC机上的Windows 98由创建一个PDF文件,把它传送到你朋友的“苹果”主机上,然后朋友的朋友又可以在他的UNX工作站上阅读。而最重要的是,他们看到的文件格式、内容、颜色、版式等和你最初的创作一模一样,尽管你使用的是中文系统而别人用的却是西文系统。试想,哪种文件格式能实现这种多平台操作呢?

  能够进行超文本链接也许是HTML文本格式得以广泛流行的最根本的原因之一。图像、书签、目录、索引,乃至动而和声音等功能是电子版图书必不可少的要素,但实现这些功能,就必须通过链接。和超文体文件一样,PDF完全支持这些功能。人们可以像阅读网页一样阅读PDF义本格式的图书。出版者可以通过PDF格式实现专业性和艺术性极强的排版设计,它支持各类图片的嵌入,支持电子出版物的各种要求并拥有多种浏览操作方式。除此之外,它的特性还包括:内部和外部的连接、每页标签、放大阅读、局部引用等。PDF也可和超文本文件一样构成丰富多彩的网络文件,可以通过浏览器在互联风或内联网上在线阅读,并可以打印出硬拷贝。和超文本格式相比,PDF格式只有一个文件,而HTML却分为众多的文本和图片,它们安排在一个或不同的目录下,其中的复杂关系使人望而生畏。在通信方面,由于PDF文件的体积只有同类超文本文件或DOC文件的1/5左右,因此更容易通过电子商务手段进行传输。

  作为国外目前最流行的电子出版的标准格式,PDF有着其他文本格式无法比拟的独到之处。PDF文件基于PostScript的图形特性,可以方便地在几乎所有的支持PPD的打印机(如激光打印机)上快速而精致地打印出来。它适合任何显示分辨率,允许用户将文件放大观看,即使放大到800%,文本或图像效果也不出现明显的失真。

  在创建PDF文件时,可以限定文本的读、写和修改权限。在未经许可或授权的上,阅读者无法或难于从PDF文件中拷贝出全部文本和图像资料。这一特点敢它与众不同的安全性。PDF文件的这种防复制功能在图书的版权保护和限制盗版方面能够起到一定的作用。而这个问题也正是出版者出版图书时需要考虑的问题之一。■

[时间:2002-01-28  作者:黄又林  来源:出版经济]

黄品青微站