电子稿件的处理技术

摘 要: 电子稿件是现今作者投稿的一种流行方式。文章介绍了电子稿件内容要素字符、图像 、图形的计算机表示方法,并以此为基础,阐述了电子稿件的格式、传输、开启、质量判断等方面的实用技术问题。
关键词: 电子稿件 字符 图像 图形

    随着计算机技术应用的普及,很多作者已经习惯在电脑上写作,交给出版社的稿件是电子稿件。由于编写电子稿件的应用软件很多,存在着电子文件格式不统一的问题,加之作者对计算机图文信息处理技术的熟练程度参差不齐,交来的电子稿件不可避免地存在这样或那样的问题。另外,电子稿件在显示器上观察和实际印刷出来有一定差距,在显示器上看到的很好的字符、图像、图形,可能印刷出来后质量会很差。因此对电子稿件的质量,编辑还有一个把关的问题,即要能判断字符、图像、图形的质量是否符合印刷要求。这些情况要求编辑要具有一定的计算机图文处理技术知识,能阅读、编辑、修改电子稿件和判断电子稿件的质量,这是编辑素质的新扩展。
一、电子稿件内容要素的
计算机表示方法

    不管什么题材、什么内容的稿件,从计算机处理的角度来讲,稿件内容都可以分为字符、图像、图形这三种要素。从实质上来说,印刷出来的图书也包括字符、图像、图形这三方面的要素。
    1.计算机字符表示方法
    字符指的是文字和一些规范化的符号。字符是图书中最常见的内容要素。
    计算机中处理字符的关键问题是编码和字形的表示。
    计算机是采用编码方法对字符进行处理的,每个字符都有一个编码体系。对于英文和数字来说,进行编码比较容易,因为这些信息本身是有序的,而且数量较少;对汉字信息进行编码,远比西文要难得多。在计算机应用初期,计算机是不能处理汉字的,经过我国专业工作者的努力,提出了汉字编码方案:即由汉字输入码、汉字机内码、汉字字形码和汉字国标交换码等形成汉字代码体系。其中汉字输入码是用于计算机键盘上输入汉字时使用的代码;汉字机内码是计算机内部处理汉字时使用的代码,类似于给每个汉字的一个序号;汉字字形码是汉字字形的数字化显示或打印时产生的代码;汉字国标交换码是我国制定的汉字信息交换标准中为每个汉字规定的代码。通过代码体系的转换,就可以在计算机中对汉字字符进行基本处理。
    在字符的外形表示方面,按照不同的表示方法,可以将计算机字符分为位图字体(Bitmap Font,又称点阵字)和曲线轮廓字体两大类。曲线轮廓字体则包括True Type字体和PostScript字体两类。
    位图字体是将字符方块画成网格,字符由黑色的小栅格点组成。见图1。

    点阵网格一般有16×16 、 32×32 、 48×48 、72×72 、  256×256等种类,网格数越多,字符越光滑。这种字放大后会出现阶梯状锯齿,图2中12磅的字放大为24磅和48磅,会呈明显的锯齿。

    位图字体输出是不光滑的,并且和分辨率相关:分辨率越高,字体越光滑。位图字体放大倍数越大,就越粗糙。
    曲线轮廓字体是目前最完善的计算机字体技术。它将整个字形用数学曲线来描述,即用指令描述字的轮廓。轮廓画出后,再用颜色进行填充。图3就是某字体的字母“O”的轮廓。曲线字体是用数学方法来表达的。它可以任意放大、缩小、旋转,并且所占磁盘空间大小是一样的,放大后也不会出现锯齿。True Type字体、PostScript字体都是典型的曲线轮廓字体。一般计算机系统字体文件夹里所带的字体就是True Type字体,可以用于显示和打印,其缺点是细小的文字输出后不太清楚。PostScript字体是用于印刷输出设备激光照排机和电脑直接制版机使用的字体,其输出质量最高,属于专业的输出字体。
字体一般安装在系统的字体文件夹之中。这样每个应用软件都能够使用它们,并且也能下载到打印机。

    在显示器上看到的字符并不全是计算机认识的字符,有些字符是作者扫描的,计算机并不认识它们是字符。这样的字符印刷出来会出现边缘不光滑,有锯齿的现象。例如图4中的字符就是扫描的,可以看出其边缘没有一般字符光滑。因此,作为编辑一定要清楚,扫描的文字不能够直接用于排版印刷。

    还有,有的作者在插图上标注的文字是在图像软件中输入的。这些文字在电脑屏幕上或用普通激光打印机上打印出来,质量看起来没有什么问题,但由于这些文字本质上已经是图像了,印刷出来质量会差些,没有排版软件中处理的文字清楚。这些文字在排版时编辑应该要求重新处理。
     2.计算机图像表示方法
    图像可以看作是由许许多多个点组成的,这是计算机表示图像的基本思想。即在计算机中,通过取样把图像进行分割,分成一个个的点,并给每一个点赋予一个颜色值。在图像处理中,我们把这些点称为像素。因此,数字图像是离散的。如图5所示,以T为周期,把图像沿x,y坐标轴划分为棋盘式的网格,仅取离散的各个交点位置上的颜色值,网格的交点就是图像的像素。这样,通过全部像素的颜色值表示了整个图像的信息。图像原稿信息是丰富的,但由于取样点无论如何是有限的,因此数字图像的信息比之原稿图像总是有信息损失。所以计算机图像是与取样的分辨率有关,图像取样分辨率越高,其质量越好。但图像的分辨率高,所占有的磁盘空间大,计算时计算机运行速度慢。在实际工作中,不同的使用目的所要求的图像分辨率不同,用于网页显示的只需要72DPI(Dot Per Inch,即每英寸多少个点),如果图像要印刷的话,则需要300DPI以上的分辨率。由于计算机图像与分辨率有关,因此计算机图像尺寸不能随意放大,否则图像质量会降低。图像由图像处理软件来处理,常用的图像处理软件有Photoshop等。在大多数排版软件中,图像在排版时是以低分辨率放在文章中的,图像的信息并没有全部置入到排版文件中,这时的图像主要起对位的作用,和真正的图像文件形成的是一个链接关系,在正式输出前要再去调取图像的全部信息。因此,我们在检查作者交来的稿子时,一定要注意看看是否有单独的图像文件交来,不要看到在排版文件中有图就万事大吉了,因为出版社在正式排版时还需要这些图像文件。
图5数字图像
    3.计算机图形表示方法
    计算机图形又称矢量图形,是由数学方法描述的。无论放大到多大,其输出质量都非常好。我们可对矢量图形进行位置、尺寸、形状、颜色的改变,图形仍能保持清晰、平滑,丝毫不会影响其最终的印刷质量。矢量图形放大时,只不过是在计算机中描述的参数有所改变。并且同一图形所占存储空间是一样。因此计算机的矢量图形又称为对象,在软件中对矢量图形的处理是按一个个的对象来处理的,而图像则是按像素为单位来处理的。所以,计算机图形与分辨率无关,它可以任意分辨率输出。一般,计算机图形是以输出设备的分辨率来输出的,例如某打印机的输出分辨率为600DPI,则图形就以600DPI的分辨率输出;如果输出印刷菲林的激光照排机的输出分辨率为3000DPI,则图形就以3000DPI的分辨率输出。我们看到很小的图形印刷出来也十分光洁,就是这个道理。
    图形由图形软件来绘制,常用的绘图软件有Freehand、Illustrator、CorelDraw等。在专业排版软件中,可以绘制基本的图形,较复杂的图形则是先在图形软件中绘制,转换为图像或者EPS文件,再置入到排版文件当中,和原图像或者EPS文件形成链接关系。
    有些作者可能会在一些图像软件中绘制图形,编辑对这些图形要特别注意。一要看它对应的图像文件交来没有;二要看它们的分辨率是否高,具体方法是在图像软件上打开该图像,在100%显示尺寸下,看图形是否光洁,如果有锯齿,则不合格,印出来后边缘会不光滑。
二、提交电子稿件的要求
   
    一般在提交电子稿件时最好有一份电子文件的数据载体(光盘、磁盘或硬盘)和一份打印出来的打印稿。打印稿的作用是作者自己检查后作一个稿件无错的确认,因为电子文件在传送或拷贝时可能会出现错误,因此打印稿是必须的。
    电子稿件应该和手写稿一样,字符和插图应该放在正确的位置。因此,最终的文件应该是一个排版文件,应该是在Word或PageMaker等软件中完成的,图形和图像穿插在相应的位置。但交来的文件不应该只有最终的Word或PageMaker文件,还应该包括图像文件和图形文件。因为插在文章中的图形、图像只是与文件有一个链接关系,没有包含真正的原文件。在印刷工艺中还要用到这些图形、图像文件进行排版,因此作者应该提供图形和图像的原文件。
三、电子稿件的文件格式
   
    电子稿件的文件格式与作者使用的应用软件有很大的关系。一般来说,国内作者使用Word排版的较多,其文件格式是Word文档,即.doc格式。如果使用PageMaker,则其格式为PageMaker自己的文件格式。应该注意的是,不同的排版软件都会有自己独特的文件格式,而且它们之间通常是不兼容的,只有用对应的软件才能开启,并且同一个软件只有高版本的才能开启低版本创建的文件,低版本的软件通常是不能开启高版本创建的文件的。由于对图像的表示方法都是一样的,因此图像文件的格式通用性较好,只要是图像软件都可以开启,且不管是什么版本的图像软件。常用的图像文件格式有TIFF格式和JPEG格式,TIFF格式的图像文件所占的磁盘空间大,JPEG格式是一种压缩格式,所占磁盘空间要小得多,但JPEG格式文件的图像会有一些损失,对某些图像质量会稍差些。
四、电子稿件的传输及开启
 
    电子稿件的传输方法有以下几种:存在软盘、刻成光盘邮寄;通过电子邮件发送;通过直接连线传送到编辑的电脑;通过网络直接传递到出版社的服务器。
    第一种方法较简单,但花的时间最多。其方便性只表现在出版社不用重新去录入字符,绘制图形。但由于磁盘、光盘受外界影响因素较多,在邮寄时要注意保护磁盘和光盘,不要让其受到损坏。还要注意刻光盘时的格式问题,一般应该按数据盘进行刻录。
    第二种方法是将书稿作为邮件的附件进行发送,直接传递到编辑的邮箱之中。这种方法只适宜于文件较小的字符稿。因为邮箱容量一般有一定的限制,通过邮件传送的文件大小有时也有一定的限制。这种方式的实质是把文件传递到网络服务器之中,再由收件人把文件下载下来。
    第三种方法是通过连线软件进行传递。传送时必须双方都在线进行传递和接收。这种方式可以传递较大的文件。
    第四种方法适用于有自己的网络服务器的出版社。一般通过FTP软件进行传递。其方法是通过用户名和密码登录到对方的服务器,直接把文件拷贝到对方的磁盘之中。这种方法可以传递容量大的文件,并且很安全,速度也是最快的。
    接收到作者的文件后,编辑就要想办法开启文件。排版文件一般依文件的格式,用相应的创建软件进行开启。例如收到Word文件就要用Word软件开启。图形文件也是如此,要用创建的软件开启。要注意的是软件还有一个版本问题,一般用高版本的软件可以开启低版本创建的文件,而不能用低版本的软件开启高版本创建的文件。对于图像文件,除特殊情况外,可以用任何图像软件开启,且基本与版本无关。
五、电子稿件容易出现的问题
 
    由于计算机系统及应用软件的不同和其他因素的影响,电子稿件往往容易出现问题。常见的问题有以下几点。
    1.文件打不开。原因可能是传输过程中文件有损失,遭到破坏,或者找不到合适的软件来开启文件。
    2.文件打开后排版格式变动,和打印稿件不一致。原因可能是软件的版本不一样,或者是链接图像的尺寸大小变化所引起,也有可能是电脑的字体文件夹中缺某种字体,用替代字体后引起排版格式变动。
    3.字符和打印的字符不一致。其原因是编辑电脑中缺少文中相应的字体,电脑自动用另外的字体替代了。解决的办法是作者和编辑都用电脑系统所带的字体来排版和阅读,或者在系统字体文件夹中添加相应的字体。
    4.一些符号会显示或者打印出来和作者交的打印稿不一致,甚至出现乱码。这种情况的原因和上一条的原因是一样的,即电脑中没有相应的字体。

六、电子稿件的质量判断

    这里主要从技术方面来判断作者寄来的稿件中哪些要素符合印刷要求,可以直接用于出版印刷,哪些要素不符合印刷要求要进行改进。出版社一般会将作者的稿件用专业印前软件重新排版,因此对于字符,只要没有错误,可以通过拷贝的方法予以使用。主要问题是要对一些图像文件的质量进行把关。图像和分辨率有关,图像的分辨率是首先应该注意的。一般用于印刷的图像文件的分辨率应该不小于300DPI。如果交来的图像的分辨率小于300DPI,可以在Photoshop等图像中将其分辨率插值计算机加到300DPI,此时,如果在显示器上看图像还十分清晰,则图像是可以进行印刷的。有时作者以为只要在显示器上看到图好看就认为质量很好,结果印刷出来发现图很模糊。还有图像的颜色问题也应该注意,有时图像在显示器上看起来很好看,但印刷出来后颜色却很暗淡,由于判断颜色需要较深厚的色彩经验,建议彩色图像要有专业人员进行把关。
    还要注意的是,有些作者把字符扫进来直接使用了,在电脑显示器上看这些字符可能很光滑,但它们是不可以直接用于印刷的,要重新录入这些字符,或者用识别软件把它们转化为电脑字符。
    对稿件中一些细小的黑色线条和黑色文字的颜色成分也要注意。考虑到印刷套印的问题,一般细小的黑色线条和黑色文字的颜色应该是用单色黑来表示。有的作者可能对此不了解,把它们的颜色设置成了四色(青、品红、黄、黑)表示的黑色。在电脑显示器上,两种黑色的显示是一样的,但四色黑会因套印误差而出现重影,文字很模糊。因此,编辑在检查稿子时要查看一下这些要素的颜色成分。
 
参考文献
[1]孙家广.计算机图形学.北京:清华大学出版社,1998
[2]刘武辉.数字印前技术.北京:化学工业出版社,2003
 
作者单位:武汉大学印刷与包装系

[时间:2006-03-21  作者:刘武辉]

黄品青微站