<form id="zhbjj"><listing id="zhbjj"><meter id="zhbjj"></meter></listing></form>

          <address id="zhbjj"></address>

             
                您的位置:首頁 > 國圖采編 > 歷史和現狀

            國家圖書館外文圖書采編工作自動化的歷史和展望

            顧犇

                近十年來,國家圖書館的業務工作自動化取得了長足的進展。但是,外文圖書采編工作的自動化仍然是全館自動化工作中的死角,這與外文圖書出版國圖書館自動化的水平極不相稱。造成這一局面的原因是多方面的:首先,我館是中國國家圖書館,理應首先發展中文圖書采編工作的自動化;第二,處理外文圖書的軟件價格相對昂貴,我們只有具備一定的財力,才能正式引進一個有效的系統;同時,我們不可能為每一種語言引進一套自動化系統;第三,國際軟件開發的技術水平的局限,過去一直未能實現在一個平臺上處理所有文字的能力。在本文中,作者擬對我館外文圖書業務工作自動化的歷史作一個回顧,并對今后的自動化工作提出了自己的設想。

            外文圖書采編工作自動化的回顧:20世紀80年代

              在20世紀80年代,我館就利用美國國會圖書館(LC)的MARC磁帶,打印出有關中國研究和馬列主義研究等專題的圖書,進行藏書的補充工作。這可以說是最早的自動化,但它只是增加了選書的信息源而已,隨后的所有工作都是手工進行的。在這個時期,我們與國外書商的聯系都是通過書信進行的,最快也就是電傳(Telex)了。

              1987年新館開館時,國圖的計算機自動化工作大規模開始,有關部門草擬了西文、日文、俄文的軟件需求和鍵盤的定義。但是,由于沒有合適的應用軟件和開發人員,大型機幾乎沒有正式應用于外文圖書的業務流程。與此同時,個別外文采編科組利用各種文種的NEC終端,進行簡單的編目工作。例如,工作人員利用日文終端進行文字處理工作,利用俄文終端進行書目的編制工作,完成了“俄僑在華出版的圖書目錄”908種[1]。但是,由于日文和俄文的終端沒有硬盤,人們只能用360K的低密度和1.2M的高密度5英寸磁盤進行存儲,不可能處理大量的信息,也不可能建立數據庫。例如,當時俄文編目組編制的俄僑書目,由于沒有及時轉換成IBM兼容的格式,就沒有保存下來,計算機當作打字機使用了。

              1990年,西文圖書采選人員利用NEC中文終端,用dBase II建立了簡單的數據庫,進行ISBN查重。當時的外文選書組只有一臺PC 286和若干臺NEC終端,而NEC中文終端帶有硬盤,算配置比較好的。其獨特的操作系統雖然不與IBM兼容,但是卻可以接受IBM DOS 2.0格式化5英寸軟盤上存儲的文本文件。選書員操作時可以同時對已發訂的圖書和自己已經選訂的圖書進行ISBN查重,使得這一部分的工作從手工轉向自動化。從此以后,該項工作成為選書人員的常規工作,一直到今天。中國圖書進出口總公司圖書部還幫助我們擴充了該系統,使得我們可以用計算機來統計采訪的數量和財務情況。但是,幾年下來,ISBN的數據積累了數十萬條,NEC中文終端的硬盤就顯得太?。?0 MB),而且dBase運行速度太慢(FoxBase要快7倍),該系統到1999就徹底淘汰了。此后,我們通過Windows NT聯成的局域網,用PC 586和FoxBase共享數據庫,繼續原來的查重工作。ISBN查重從誕生到現在,已經使用了十多年。盡管在集成系統面前他是一個十分簡單的系統。但是,我們確實在現有的條件下盡可能地實現自動化,減少了工作量。

            外文圖書采編工作自動化的回顧:20世紀90年代

              90年代的主要特點是只讀光盤的大規模應用。在外文圖書采編工作中,最早使用的光盤是當時外文選書組訂購的《在版書目》光盤(BIP - Books in Print with Book Reviews Plus)。以前,為了查閱訂購信息,選書員不得不翻閱三大本的書本式《在版書目》、四大本的《在版書目主題指南》(Subject Guide to Books in Print)和每半年出版一次的《新書報導》(Forthcoming Books)。有了BIP以后,不僅大大地節約了空間,還提高了檢索能力(有十幾個檢索點),信息更為及時,并且還附有書評。它現在已成為選書人員的強有力的工具之一。在這個時期,傳真(Fax)逐漸普及,電子郵件也成為我們與國外書商聯系的主要方式。

              外文圖書編目工作的自動化開始于20世紀90年代初期。當時西文圖書編目組的工作人員訂購了美國TLC (The Library Corporation)公司生產的Bibliofile光盤。起初,采用的是四個外置的光盤驅動器串聯,用一臺PC 386進行檢索試驗。1995年,該組用PC 486和光盤塔建立Novell局域網,正式開始了計算機編目工作。由于網絡條件和工作人員計算機知識的局限,所下載的數據都儲存在三寸軟盤中。幾年下來,該組積累了幾十盒軟盤。而且由于物理條件和軟盤質量的原因,其中有一部分軟盤已經損壞,到近幾年數據整合的時候,發現了許多遺留的問題。此外,由于無法對軟盤中的書目數據進行檢索,數據在下載并初次修改以后就無法再次修改,也造成數據的不一致和重復。2000年,西編組和聯合國資料組將1974年以后數據回溯完成以后,該光盤系統就基本上停止了使用。

              1998年,生產Bibliofile光盤的TLC公司宣布將在若干年內停止該光盤的生產。由于其新產品ITS for Windows要收取較高的使用費,其舊版本存在2000年問題,我們就考慮改用OCLC的CatCD光盤編目。

              由于Bibliofile光盤采用最古老的格式讀取,不能采用常規的虛擬光驅的方式讀取,在OCLC和Bibliofile共存期間,我們不得不設法將每個工作站配置成DOS和Windows 98圖形界面這兩種可選的啟動方式,分別與Novell服務器和Windows NT服務器連接。

              日文編目也采用了類似的Novell網,下載日本國會館和日販的光盤MARC數據。開始,東編組還用三英寸軟盤保存下載的數據。但是由于軟盤不便長期保存,我館短期內又無法引進可以處理日文的系統,我們就放棄了用軟盤下載的做法,等到今后時機成熟以后再開展數據的回溯工作。

              國際交換組在20世紀90年代初利用dBase II(后改用FoxBase 2.0)編制了簡單的地址庫查詢和打印軟件,在一定程度上實現了自動化。

              總結過去自動化工作的特點,主要有以下方面:

            1. 自發性:以非專業人員為主,耗費了業務工作人員大量的時間。

            2. 獨立性:各個流程之間沒有聯系,數據不能有效利用。

            3. 不完全性:只有個別語種的部分采編工作實現了自動化。

            外文圖書采編工作自動化的展望:21世紀

            一、西文圖書采編工作

              1999年底,我館開始了西文圖書采編軟件的選型工作,其主要標準是軟件的先進性、多文種功能、可擴展性、集成性以及與我館業務工作的一致性。2001年9月20日,我館與以色列Ex Libris公司正式簽約,引進其阿列夫500(Aleph 500)軟件作為我館的集成系統。在下文中,作者擬論述如下一些問題:在實施該系統的過程中,我們的業務工作可能產生的變化、我們所應該考慮的問題以及今后的工作設想。

            1、改變流程,減少重復勞動

              在自動化之前,圖書館員要進行許多重復的勞動。例如,選書員如果看到報紙上的一條新書消息,想馬上訂購,他必須用打字機打印出一張草片,提供詳細的訂購信息,交采訪人員;采訪人員根據草片,按照標準的著錄格式,打印正式的訂單,然后向書商發訂;圖書到貨后,采訪人員要進行個別登記,在登錄本上打印圖書的基本信息,然后送編目科組;編目人員最后要重新制作編目卡片。由此可見,每一種圖書從訂購到加工結束,要重復四次數據的錄入工作。如果加上編制專題書目或新書通報的工序,則要重復五次打字工作(見圖1,其中虛線表示沒有直接聯系的流程)。這是20世紀80年代的工作流程,現在已經有一小部分實現了自動化。

              采用自動化工作以后,所有數據可以在全流程中共享。對同一條書目數據的錄入工作,采編人員只要進行一次或兩次操作即可(見圖2)。

              類似的情況也發生在國際交換組和外文期刊組之間的交接工作中。國際交換組收到國外寄來的刊物以后,首先要進行記到工作,然后轉交給外文期刊組;外文期刊組在交接單上簽收以后,還要再次進行記到。由于兩個科組分別屬于圖書采編部和報刊資料部,目前使用不同的軟件,無法實現網上記到和交接。我們曾經嘗試過利用丹誠軟件進行這項工作,但是由于各種原因,沒有成功。采用了新的軟件以后,可以通過權限的管理,允許兩個組在不同的字段里進行登錄,進行比較,解決的扯皮的問題。

            2、提高效率,擺脫手工操作

              在外文圖書編目工作中,最早實現自動化的是西文圖書編目工作。但是,這種自動化還不很完全,這體現在:

            a. 沒有數據庫:盡管西編組從1995年開始就正式采用有關光盤套錄USMARC數據,但是套錄的數據不能夠及時轉入數據庫,不能得到及時的維護,導致數據丟失,數據重復,數據得不到及時更新等問題。為了解決這些問題,該組于2000年采用丹誠軟件建立數據庫,作為權益之計,使得數據的維護更有條理。但是,該數據庫不能用于日常的編目工作,只能用于簡單的查詢。

            b. 數據多次轉換:盡管目前有了自己的數據庫,但是由于數據沒有在各流程中通暢地流動,各個流程的交接工作仍十分繁瑣。每月送新書時,有關人員要將新數據轉換成ISO 2709格式,再分別轉入西編組的數據庫和典閱部的數據庫,進行驗收工作。然后,還要將這些數據然后再進行轉換,進入OPAC服務系統。

            c. 僅僅是積累數據,不能實現所有工序的自動化。例如,編目人員要分配新書的索書號,必須手工在卡片目錄中進行查重。采編之間的交接工作也無法通過計算機完成(見圖3)。

              采用集成系統以后,以上許多環節都可以自動進行,減少了手工勞動(見圖4)。

              此外,由于采訪和編目是一體化的系統,我們在選書的環節就可以同時檢索采訪數據和編目數據,提高工作的效率。

            3、提高工作質量,進行規范控制

              西文圖書編目組長期以來進行著簡單的規范控制工作,亦即在著者目錄中做規范片,主要參考美國國會圖書館的規范文檔縮微平片和其它參考工具書。由于人力不足,工具書查閱不便,規范控制僅限于一些重要著者和機構的名稱。我們曾經考慮購買OCLC或LC發行的規范文檔光盤或磁帶。但是由于沒有正式的集成系統,我們無法確定工作流程,也無從決定如何進行規范控制。如果我們引進了集成系統,我們可以有如下幾種方式進行規范控制:

            OCLC規范光盤:價格相對便宜,但是沒有與書目光盤之間的接口,用戶只能通過復制的方式將規范名稱或主題粘貼到書目記錄中。

            LC規范數據:全部購買LC規范數據,然后與書目數據掛接。這是最理想的解決方案,但是成本比較高。

              不管采用何種方式,我們都還要花費一定的人力對現有的人名進行規范控制。

            二、其它各種語種的編目

              在外文圖書采編工作中,除了英語、俄語、日語等收藏圖書較多的語種以外,其它文種一般稱為小語種。嚴格地說,它們未必是真正的小語種,只是相對于中國讀者而言,使用者較少而已。小文種的編目一直是一個難點,其困難之處主要在于字符集的問題。過去,各相關語種的母語國都有可以處理該文字的軟件。但是,對于中國國家圖書館來說,每一種語言都要引進相應的軟件,其成本是很高的。而且,對于每年只入藏幾百本新書的語種,如果我館花相當大的資金引進一種軟件,則是得不償失的。

              我館集成系統選型的一個主要目標,就是要尋找一個Unicode兼容的系統。只要系統能夠處理Unicode字符集,我們原則上就可以處理所有語種的資料。

            1.其它采用拉丁字符集的語種

              除了英、法、德等語種以外,其它采用拉丁字符集的語種還包括羅馬尼亞語和匈牙利語等東歐語種、丹麥語和瑞典語等北歐語種、土耳其語和越南語等用擴展拉丁字符集的東方語種。它們的編目工作都可以借助于OCLC WorldCat數據庫得到解決。經過試驗,我們發現大約有70%的各種語言的書目數據都可以在OCLC的數據庫中檢索到。我們只要將下載的數據數據作一定的修改,或參考有關數據進行原始編目,就可以形成自己的編目數據。

              過去,我館有各主要語種的編目人員,其它小語種圖書的編目工作主要依靠熱心讀者的支持,協助進行分類工作。改革開放以后,繼續聘請此類專家存在著一定的困難,我館也無力長期聘用專職人員從事此類工作。即使聘請了有關專家進行分類,我們的編目員由于不了解相關語言的語法規則,也不可能完全正確地進行編目著錄。利用OCLC WorldCat進行聯機下載,是一個較好的解決辦法。采用集成系統以后,由于OCLC World Cat和我們所招標的系統都是Z39.50兼容的,并且支持ALA字符集,我們可以在系統內部無縫查詢有關記錄,下載成為我們的館藏記錄。當然,采用這種聯機方式下載的數據需要一定的成本。

              采用集成系統以后,OPAC系統可以正確顯示所有字符,并按我館的需要定義字符映射表,根據中國讀者的習慣正確檢索出帶變音符號的字符。

            2. 俄語

              1998年,我們曾經與有關的軟件商(例如文津和丹誠)探討解決有關俄文編目的問題。試驗結果表明,只要采用相應文種的操作系統(例如西文或俄文的Windows 98)就可以實現俄文數據的處理。但是由于各種原因,沒有付諸實現。

              我們曾經用德國紹爾(K.G. Saur)公司出版的《俄羅斯國家書目》(Russian National Bibliography)進行試驗,檢索了一些俄文數據。該光盤收入近20年來俄羅斯出版的俄文圖書,有俄文界面顯示俄文,也有英文界面顯示羅馬化的俄文數據,其輸出格式為UNIMARC格式。但是,該系統沒有MARC編輯器,不能即時修改數據,添加必要的館藏信息。用戶只能將數據輸出到文件后,再轉入自己的數據庫進行編輯。如果集成系統可以處理俄文,那么可以在一定的程度上利用該種光盤進行回溯工作。但是我們還應積極尋找更有效的辦法,或者等待國外有關成熟的 編目數據服務的問世。

            3. 日語、朝語和其它東方語種

              日文編目有兩種方式:一種是用現有的日本國會圖書館的光盤和日販的光盤下載數據,然后轉入集成系統中。另一種方式是采用Z39.50協議,直接在系統中下載日本有關編目系統(例如情報所)的數據。不管如何,引進集成系統以后,我們就可以解決目前所無法解決的原始編目的問題。

              其它東方語種基本上只能采用原始編目的方式。我們的集成系統能處理阿拉伯語。采用基里爾字符的蒙文可以與俄文圖書一樣進行編目。等到時機成熟(在Unicode中引入相應的字符集)后,印地語的編目也可以開展起來。

              由于歷史原因,越南語圖書的采編工作由東文圖書采編組負責。但是,越南語所采用的字符實際上是擴展拉丁字符集,我們完全可以將其視為西文圖書來進行編目。經過我們的試驗,OCLC WorldCat聯機檢索數據庫中,越南語圖書的檢索命中率是較高的。本人認為,今后的越南語圖書的編目工作可以由西文圖書編目組完成。

            4. 語種的重新劃分

              過去,國家圖書館業務工作中語種按東方語種、西方語種、俄語來進行劃分。根據以上的論述,我們今后應該可以嘗試根據所用的字符集來劃分語種。例如,越南語可以分入西語,蒙古國的蒙語可以分入俄語。即使業務科組不按此劃分,有關的業務規范也可以根據這個標準來制定。

            三、國際交換組工作的自動化

              盡管國際交換組已經有一個簡單的地址庫查詢軟件,但是其工作流程中的一大部分(包括通聯、外發期刊訂購管理、交換送到期刊的登記等工作)都還是用手工完成的。如果采用招標的集成系統,我們基本上不必另外要求廠商編制一個專門的國際交換模塊,而利用現有的功能就可以滿足需要。例如

            可以將交換戶作為書商處理,建立有關的檔案(包括地址、聯系人)和交換(訂購)記錄。

            利用現有的采訪格式信功能,就可以實現交換通聯所用的格式信的定義。

            利用現有的期刊模塊,就可以對交換來的期刊進行記到,但是記到字段要不同于報刊部的字段。

            交換組對國外交換戶訂購的圖書和期刊,可以用采訪模塊處理,將本館的流向定義成國外用戶

            四、圖書采選工作的新方法

              圖書編目和加工的自動化比手工勞動大大進了一步。但是,采訪工作也有待于全面的自動化:

            1. 選書信息的獲得

              過去,常規的選書信息來源于書商的印刷型新書目錄。國外的書商(例如布萊克韋爾圖書公司)可以提供電子形式的目錄,國內的中國圖書進出口總公司也正在試驗并即將提供電子形式的新書報道。我們由于沒有集成系統,所以一直沒有采用這種新的方法。今后,我們從書商獲得的電子形式的目錄可以直接上載到本地的集成系統中,經過修改后成為我們的采訪記錄。

              如果書商可以提供網上的選書系統,我們就可以直接在其系統中選書,然后通過書商與集成系統之間的接口,將書目數據和訂單數據載入我們自己的系統中。

              此外,我們還可以利用讀者利用的數據,進行有關的統計分析,更準確地進行選書工作,滿足讀者的需求。

            2. 訂單的發出

              采用集成系統以后,采訪人員基本上不用再制作訂單。如果書商支持標準的電子訂單格式(例如EDIFACT),就可以直接通過系統發出訂單。如果沒有,我們也可以按需要輸出相關的字段,通過e-mail發出訂單。這樣,訂單發送的成本降低了,速度提高了,錯誤率也降低了。

            3. 個別登錄

              個別登錄工作事實上就簡化為在原采訪記錄的基礎上添加登錄號、條碼、實際書價、登錄日期等信息即可,不必再錄入書目信息。

            4. 編目的利用

              目前,許多圖書公司免費或收費提供編目數據。例如,美國布萊克韋爾圖書公司(Blackwell’s Book Services)可以收費提供其供應英文圖書的USMARC編目記錄;美國東方了望圖書公司(East View)可以免費提供其供貨俄文圖書的MARC記錄。我們用其數據替換采訪數據,就可以成為正式的編目數據。編目人員可以省去不少工作。

            五、難點和問題

              引進集成系統以后,我們的工作效率和質量都可以得到提高,但是也有許多問題有待于我們去討論和解決。

            1.機器配置的問題

              原則上說,新系統要求各客戶機具有較高的配置?,F有機器如果都進行升級,則需要很大一筆開支。事實上,我們可以嘗試一些折中的辦法。如果所有計算機都采用Windows 2000作為操作系統,則它們都必須更新。但是,如果我們有可能采用相應文種的Windows 98作為客戶端的操作系統,就可以繼續使用現有的計算機設備,節省一筆開支。當然,這有待于實踐的論證。

            2.MARC格式的問題

              新系統可以容許多種MARC的并存,也可以同時檢索各種MARC的數據。但是,我們采用何種MARC的問題尚沒有定論。原則上說,我們傾向于采用母語國的MARC格式。但是,有些母語國(例如俄羅斯)自己也沒有統一的MARC格式。我們要自己尋找一些妥善的解決辦法,并考慮到長遠的業務發展。本人認為,采用拉丁字符集或擴展拉丁字符集的文字,無論其是西方文種還是東方文種(例如越南語),都可以用USMARC進行編目,以便最大程度地利用OCLC等數據庫的編目數據。

            3.編目數據庫和采訪數據庫之間的關系問題

              在目前手工操作的時期,采訪目錄與編目目錄基本上是沒有很大的關系。唯一的聯系在于,正式編目后的卡片目錄要排入采訪目錄中(西采組就是如此)。但是,如果采訪目錄與編目目錄的著錄方式不同,我們怎么處理?例如,書商報道按一種書的多卷報道,而我館按叢書編目;或者書商按叢書報道,我館按多卷集編目。如果將兩種數據合并,則可能丟失有關信息。目前,有些圖書館用編目數據替換采訪數據,有些圖書館將采訪數據和編目數據分開處理。

              這個問題有待于系統正式啟用以后探討。我們要看系統具備什么樣的功能,我們才能考慮如何操作?;镜脑瓌t是,我們必須保留所有采訪信息,但也要讓采訪人員能夠在檢索采訪數據的同時檢索到編目數據。

            4.規范控制的問題

              在外文圖書編目工作中,人們過去一直采用卡片方式進行簡單的人名規范控制??梢哉f,規范控制沒有真正開展起來。新引進的集成系統具有很強的規范控制功能。但是,我們還應當討論一些特殊的規范控制問題。例如,西文圖書的中文統一題名如何處理?外文編目中中文人名如何處理?我們是將各種規范連接起來,還是建立自己獨特的、包括所有文字的規范體系?這些問題都有待于我們在實踐中摸索,解決。此外,各種語言的并存還帶來一些過去所沒有考慮過的其它問題。除了統一題名的問題以外,還有不同文字的并列題名的處理等問題。

            5.財務結算

              現在,許多圖書館的采訪系統都有電子發票等電子商務的功能。在我國的圖書館界,目前尚沒有人采用這種方法,更沒有統一的標準。我們應積極與有關書商協作,在這個方面有所突破,使得業務工作的自動化達到更高的程度。

            六、結論

              總之,外文圖書采編工作的全面自動化的實現,依賴于Unicode的全面采用,依賴于Z39.50協議的采用,依賴于圖書館員素質的提高。即使我們已經引進了功能完全的集成系統,要充分發揮其作用,還優待于我們各級管理人員和專業人員的共同努力。

              集所有語言于同一個系統中,一直是圖書館員的夢想。我們堅信,經過我們的不懈努力,夢想一定會成為現實。

            --------------------------------------------------------------------------------

            [1] 風雨浮萍:俄國僑民在中國(1917-1945) / 李興耕等著. -- 北京:中版社,1997.

            --------------------------------------------------------------------------------

            原載《國家圖書館學刊》(Journal of the National Library of China),2002年第2期(4月),第19-25頁

             

             

            版權聲明  |  關于國圖  |  支持我們  |  人才招聘  |  站點地圖  |  聯系我們
            京ICP備05014420號 電話:(+86 10)88545426 88545360
            國家圖書館版權所有
            亚洲,秋霞日韩久久理论电影网,俄罗斯胖女人Av在线视频

                    <form id="zhbjj"><listing id="zhbjj"><meter id="zhbjj"></meter></listing></form>

                    <address id="zhbjj"></address>