在以前的内容中,我们对印刷的大致情况做了介绍,只从原稿的角度来看,印刷复制的原稿分为两类,其中一类是文字稿,所以,在本篇中我们将主要介绍文字信息处理方面的知识。
所谓的文字信息处理指的是依照用户提供的文字稿及对印品的要求,确定合适的字体、字号、行距、字距、版式要求等,再利用文字信息处理设备对文字稿进行版面设计和排版,最后把排好的文字信息输出到纸张或胶片等载体上的技术,所以印前文字信息处理技术也就是我们日常说的文字排版技术。
印前文字信息处理从印刷的整个发展过程来看,经历了铅字排版、照相排版,直到今天的计算机排版。计算机排版技术是文字信息处理技术的飞跃发展,是计算机与印刷结合的产物,是一项新兴的电子应用技术,它取代了传统的铅字排版,使印刷行业进入了“告别铅与火,迎来光与电”的时代。
文字信息处理的基本知识
计算机排版技术是一门集印刷排版知识和电子计算机知识为一体的新兴技术,所以,要掌握好计算机的排版技术,首先必须要掌握印刷排版的基础知识。
1.文字字体、字号及字形
1)文字的字体
文字的字体是一种规范了的文字书写体式,不同的字体代表了不同的书写风格,因此,在印刷排版中,选用不同的字体对印刷的质量有重要作用。
文字的字体又分为汉字字体和外文字体两种。
图2-1
对于汉字字体来说,字体的种类有很多,可以这样说,每一个人书写的汉字就是一种字体,但是用于印刷中的基本字体有书宋体、仿宋体、楷体和黑体四种。为了美化版面,经过一段时间的发展,在印刷中开始采用许多新的艺术字体,如,隶书、综艺、行楷、美黑、魏碑等等,如图2-1所示。目前在计算机排版中大约有84种字体供您进行选择,从另外一个角度来说,字体也是区别版面中标题与正文,主要内容和一般内容的表达形式。
对于外文字体而言,在我国的书刊印刷中最为常用的字体有四种,它们是白正体、白斜体、黑正体、黑斜体,如图2-2所示。对于其他形式的印刷品(如杂志、宣传品)来说,在外文字体的选择上比较富余,也有几十种字体来供选择,如方头正、方头斜、花体等字体。
图2-2
在计算机排版系统中,对于汉字字体和外文字体需要区别对待。
2)文字的字号
文字的字号是指文字的大小。我们对文字大小采用以“号数制”为主,“点数制”为辅的原则来进行度量,因此,在国内的电子出版软件中对字体的度量基本采用这一原则的,这种度量的方法与原来的铅字排版统一起来了,符合了我国排版人员和编辑的习惯。例如,大北大方正电子出版系统中,特大号(11号)以下的字都采用号数制来称谓,如4号字、5号字,而特大号以上的字是采用点数制来称谓,如84P、72P等,如图2-3所示。
图2-3
“点”是活字专用的计量单位,“点”的英文名称是“Point”,音译为“磅”,采用“Point”的第一个定母“P”来表示。在我国,一般认为1P=0.35mm。所以在国外的电子出版软件中,字的大小大都以“点”来表示,如办公软件Word等,如图2-4所示。
3)文字的字形
图2-4
文字的字形是指文字的形状,一般有方形、长形、扁形、粗体形和细体形之分,如图2-5所示。
图2-5
4)印刷中字体号的选用原则
要掌握好计算机排版技术,那么对于字体字号的选用原则需要有一个基本的了解,现将印刷中最常用的几种字体的特点和选用的原则归纳如下:
书宋体:书宋体的特点是横平竖直,横细竖粗,粗细适中,疏密布局合理,使人看起来清晰爽目,久读不易疲劳,所以一般的书刊正文都采用书宋体作为字体。书宋体的另一个优点是印刷适性好,印刷出来的字体笔道完整清晰,所以,一般的书刊都选用5号字作为正文的字号。
楷体:笔画接近于手写体,直接由古代书法发展而来,字体端正、匀称。一般用于小学生课本和幼儿读物,选用4号楷体以便孩子们模仿。除此之外,楷体字也常用作中、小级的标题、作者的署名、报刊中篇幅短小的正文等。
仿宋:仿宋中由古代仿宋刻本发展而来的一种字体,是古代常用的一种印刷字体。其笔画粗细一致,起落锋芒突出,刚劲有力,但阅读效果不如书宋体,所以不是一般出版物常用的字体。其主要用于中、小级的标题、文件等用字,一般其字号要在小4号以上,并且字形为长形字比较好看。
黑体:字体方正饱满,笔画横粗竖也粗,主要用于各级大小不同的标题字。
2.排版中的版面
1)纸张的开本
在我国常用的纸张的规格有787mm×1092mm和850mm×1168mm(在实际中常使用889mm×1194mm规格的纸)两种全张纸,而在习惯上,我们常以“开”来称谓纸张的大小。“开”是以2的几何级数来确定的,即用对折的方法来分切全张纸,如图2-6所示。
图2-6
在书刊中,常见的开本有16开、32开和大度16开、大度32开四种。其中16开和32开采用787的纸来裁切,而大度16开和大度32开则采用850的纸来裁切。报版常用4开版和8开版两种。
2)版面与版心尺寸
版面是指在书刊和报刊的一面中,图文部分和空白部分的总称。版面是由版心、天头、地脚、切口、订口五个部分组成,如图2-7所示。
图2-7
有关版心的基本知识,是任何一个排版人员应掌握的最基本的常识,在实际的应用中,版心的尺寸往往要受到成品尺寸的制约,不同标准的开本对应各自标准的版心尺寸,但在同一开本中,由于版口空白部分的大小不同或装订方式的不一样,版心尺寸往往有一些微小的变动。表2-1给出了一般书刊的版心和成品尺寸。
表2-1
开本 | 16开 | 32开 | 大32开
|
成品尺寸(mm) | 260×185 | 185×130 | 209×140
|
版心大小(mm) | 220±5×147±5 | 153±5×96±5 | 164±5×103±5
|
行×字(5号字*2行距) | 39×40 | 27×26 | 29×28
|
天头(mm) | 22 | 18 | 22
|
地脚(mm) | 17 | 14 | 17
|
订口(mm) | 22 | 20 | 20
|
切口(mm) | 17 | 14 | 17
|
3.版面设计与排版规格
排版之前需有专门的设计人员进行版面设计,即设计出排版的形式是竖排还是横排,正文、标题、书眉、辅文的文字字体、字号、字距、位置等,并绘制出所设计的版面格式。排版工作者根据设计人员设计的版式进行排版。具体的排版要求分别归纳如下:
1)正文:正文是指图书除了前言、目录、后记、注释以外的内容,是印刷内容的主要部分。正文排版应规定出正文所用文字的字体和字号,是横排还是竖排,版心在版面所占的面积大小和位置、字距、行距、段距等。
2)标题:标题可分为一级标题、二级标题等,一般可分为五级标题,标题设计应规定出不同标题的字体、字号、位置,以及与正文之间的距离等,设计标题的字号时应注意要大于正文的字号大小。
3)书眉:书眉一般出现在篇幅较多的书籍里。书眉的文字一般用6号字,只排一行为佳,文字过长时可酌情删减,尽量避免转行。
4)页码:在页码的设计中也要注意页码的字体、字号和位置等。
5)禁排规则:文字排版中一定要注意文字排版的禁排规则,一般在文字排版中的禁排规是有以下几种:标点符号的排版禁则、字行排版禁则、转行排版禁则、标题排版禁则。
4.校对知识
校对就是对所排版的文字进行校正和核对,各种图书报刊等出版物和印刷品均须经过多次校对,检查文字是否准确无误,版式上是否正确,才能付印。
尽管对于不同的出版物,校对的过程不尽相同,但一般都需要经过毛校、一校、二校、三校、核红等过程。
在校对工作中,发现文字和版式上的错误之后,校对者需要在校样上标出应改正的文字和各种符号,作为改正的依据,这些特殊的符号称之为“校对符号”,它是编辑、校对、排版三者之间共同交流使用的标准语言。所以,要做一名优秀的排版人员,必须要理解这些符号。
二、计算机排版系统的概述
1.计算机排版系统的分类
尽管计算机排版系统已在我国的各个行业和办公室得到广泛应用,但是随着计算机技术的高速发展和电子排版的应用软件功能的不断完善,使得计算机排版系统的配置不尽相同,在档次上也各有差别。
从目前的现状来看,计算机排版系统可分为以下几个档次。
1)专业的计算机排版系统
专业的计算机排版系统也称之为精密照排系统或激光照排系统,该系统是最完善,配置最齐全,档次最高的一种计算机排版系统,主要应用于印刷厂、输出中心等单位。在这个系统中主要包括计算机、扫描仪、激光打印机、激光照排机、喷墨打印机、CTP制版机、栅格图像处理器(RIP)等设备。在软件上配置有专门的排版软件,如Adobe Pagemaker、QuarkXpress、Coreldraw、Wits、Fit等。
其处理的对象可以是所有的印刷出版物,能够完成从文字的输入、图像的扫描、图片的制作、图文的组版、校样的输出、胶片的输出等工作。输出形式主要有成品纸样、成品胶片、相纸、硫酸纸等多种形式。
2)桌面计算机排版系统
桌面计算机排版系统,也称之为桌面出版系统,是当今电子排版系统中最为常见的。它主要由计算机、激光打印机、喷墨打印机、扫描仪或数字化图形板等设备组成。在软件方面除了配置操作系统、汉字系统、文字编辑软件之外,还具有各种排版软件和图形图像处理软件,以及高质量、品种齐全的字库系统。这种系统主要应用于办公室、出版社、编辑室、小型的文印室等单位。其输出形式主要以纸张为主。
3)办公室自动化计算机排版系统
这种系统是所有的计算机排版系统中档次最低的一种,主要的工作就是对文字进行编排和文字的输出,包括的设备主要是计算机、打印机等。使用的软件也主要是一些办公化常用软件。如Word等。其输出的精度较差。
从以上的分析可以看出,三种档次的计算机排版系统的主要区别就在于处理的对象和应用的领域不同;排版软件的功能不同;输出设备的档次和输出质量上的不同;字模字体、字号的齐全程度的不同。但同时也能看出,随着计算机技术和软件技术的发展和完善,以上三种档次的系统之间的界线越来越模糊,而且桌面排版系统是主流,有向上发展的向下涵盖的趋势。
2.计算机排版系统的组成
虽然计算机排版系统在档次上可以分成以上三类,但是从整个角度来看,无论什么样档次的计算机排版系统,其基本的组成是一样的,都是由输入部分、计算机处理部分、输出部分三大块组成,其结构框图如图2-8所示。
图2-8
1)排版系统的输入部分
①在计算机文字信息处理系统的输入部分中,最重要的是如何将文字输入到计算机内部,就目前来看,主要有三种输入文字的方法。
键盘输入法:就是利用标准英文小键盘输入汉字的方法。利用小键盘进行输入主要有以下特点:一是有利于盲打;二是应用广泛;三是采用先进的汉字编码方案可以大大的提高汉字的输入速度。
汉字自动识别输入法:汉字识别输入是采用图像扫描等输入设备来模拟人的视觉,将记录在物质载体上(如纸张)的文字读入计算机,通过一些预处理,将文字进行数字量化,去除噪音,并将其尺寸大小整形规范化的形式,然后通过抽取特征,获得一组表示每个可区别文字的特征,最后通过识别系统,将这些特征与计算机存储模式进行一系列比较、判断和分析,给出识别的结果。就目前情况来看,汉字自动识输入方法主要有汉字印刷体识别和手写体识别输入方法主要有汉字印刷体识别和手写体识别两种方法。汉字印刷体识别,简称OCR,现在使用较多,技术也比较成熟,识别率也较高,一般在购买扫描仪时会随机赠送这种识别软件。但对于手写体识别来说,目前也在部分使用中,但由于手写体因人而异,因此识别较困难,在技术上还有待于进一步提高。
语音识别系统:语音输入的最终目标就是将人们的语音通过计算机接收、分辨和识别作为文字的输入方法。对于汉字来说,难点在于要求发音者发音准确、声调辨认清楚。
②汉字的编码方案
由于计算机键盘只有26个英文字母及数字和一些功能键,要想用这些有限的键录入大量汉字就要寻找一种方法,这种方法就是汉字的方法。
为了寻求能被普遍采用的汉字的编码方案,国内外许多研究人员做了大量的工作,据统计,目前汉字输入的编码方案达到上千种,但真正流行使用的只有很少的几种。编码输入的方法主要有以下几类:
整字编码:这种编码方式一般采用四位十六进制或四位十进制数编成一组代码,按汉字字频或读音顺序编成代码。如电报码、通讯密码等。
字形代码:这种编码方法是将汉字分解为一些基本的字根或偏旁笔画来进行编码输入的。如字根码、角形码、笔形码等。
字音代码:这种方法一般以汉字的汉语拼音作为编码输入的。如拼音输入、双拼输入、智能ABC输入等。
拼形代码,通过输入笔画码或字根码来完成汉字的输入方法,如五笔字形输入法等。
③汉字信息标准交换码
汉字信息标准交换码是一种用于汉字信息处理系统之间进行汉字信息交换而设计的汉字代码,为了达到系统设备之间或记录媒体之间信息交换的目的,汉字的交换码必须有统一的形式,即实现汉字代码的标准化。
在西文处理系统中,采用的信息交换码是ASC11码,其有128个字符,采用7位二进制数编码。一个ASC11字符采用一个字节来表示。
我国也于1980年颁布了第一个汉字编码国家标准GB2312-80《信息交换用汉字符集#基本集》。该标准中包括了一级汉字3755个,二级汉字3008个,各种符号682个,共计7445个。采用双7位编码方式,即用两个字节来表示一个汉字。
2)文字排版系统处理部分
文字排版系统处理部分,主要是由计算机硬件和相关的软件组成。
(1)硬件:在这里的硬件主要是指计算机有关方面的硬件,一般说来用于文字信息处理的计算机硬件要求可以很低,如使用最早的286型计算机即可进行文字处理,而在实际生产中,因为文字信息处理总是和图像信息处理相辅相成的,因此,目前使用的计算机档次都是很高的。常用的计算机主要有PC机和Mac机两种,以及由多台PC机或Mac机组成的工作站。
(2)软件:在文字信息处理系统中,与之相关的软件主要有操作系统软件、文字编辑软件、文字排版应用软件、补字软件、字库等。下期将分别介绍。
[时间:2001-04-19 作者:北京 邓普君 来源:印前技术2001-2]