內容摘要:概念研究是古籍數字化研究的核心問題,探討古籍數字化概念形成的歷史過程,有助于古籍數字化概念的進一步明晰。古籍數字化概念的形成經歷了早期實踐、術語混用和概念形成3個階段。
關鍵詞:古籍;數字化;概念研究
作者簡介:毛建軍,男,1971年生,南京大學中文系2005級博士研究生
概念研究是古籍數字化研究和開發的核心問題。沒有一個明晰的概念,古籍數字化研究必將陷入混亂的局面,古籍數字化的開發也必將走入歧途。“古籍數字化的理論問題比技術問題更為重要,因為一旦理論發生了偏差,技術越高明,則解決方案越是難以成功”[1]。正是因為缺乏古籍數字化理論的指導,才造成了目前古籍數字化在開發理念上的千差萬別、質量上的參差不齊和標準上的各自為政的局面。
一、古籍整理與計算機結合的早期實踐
自計算機問世以來,古籍整理就有了新的利器,這一利器就是古籍數字化。古籍數字化與計算機信息技術的發展密切相關。1971年臺灣的馬志欽教授提議利用計算機做中文資料處理研究。不久幾乎臺灣所有的大學和電子研究機構都全力投入了這項極具潛力的領域[2]。1984年臺灣中研院史語所開始實施開發“史籍自動化系統”。該計劃由毛漢光教授倡議,謝清俊、管束東主持開發[2]。在臺灣,除了單位投資建設中文信息資料庫外,部分個人也積極投入到這項極具挑戰性的工作中。1987年,臺灣師大中文系教授陳郁夫也開始嘗試開發《紅樓夢》《水滸傳》的全文檢索系統[3]。
大陸地區計算機事業起步較晚,在古籍整理與計算機結合的實踐上較晚于臺灣。1983年,全國語言學學科規劃會議上提出要加強古籍整理和計算機的合作,促進古籍整理研究手段的現代化和方法的現代化。隨后,國內開始了古籍整理與計算機結合的實踐。1983年秋,江蘇省“紅樓夢電腦處理”課題啟動,參加單位有鎮江市科委、鎮江市統計局電子計算站和江蘇省計算中心,彭昆侖擔任課題負責人[4]。1984年錢鐘書先生提出,古典文獻整理和研究應盡早與計算機結合。在錢鐘書的倡導下,中國社會科學院文學研究所欒貴明、田奕等組成了研究小組,經過艱難的探索,“全漢字系統”“諸子集成數據庫”“全唐詩檢索系統”等古典文獻數據庫相繼完成[5]。1984年9月—10月,深圳大學一批中青年學者提出讓古籍插上電腦之翼的研究計劃,開始著手開發《紅樓夢》多功能檢索數據庫[6]。1987年10月,陜西師大在編撰《十三經辭典》和《十三經詞語索引》的基礎上開始探索辭書電腦處理系統[7]。
在古籍整理與計算機結合的早期實踐中,臺灣和大陸是主體,但其他地區包括國外也有古籍整理與計算機結合的實踐,這些經驗對后期的古籍數字化工作產生了影響。如1978年美國人P.J.Ivanhoe運用計算機編制了《朱熹大學章句索引》《朱熹中庸章句索引》《王陽明大學問索引》《王陽明傳習錄索引》《戴震孟子字義疏證索引》等[8]。1995年初,美國圖書館研究學會(RLG)與北京大學圖書館合作開發聯機中文善本目錄,為我們提供了寶貴的經驗[9]。
古籍整理與計算機結合的實踐也引起了學術界的思考。1988年曹書杰在《古籍整理研究學刊》發表的“古籍整理與電子計算機應用研究的思考”一文論述了古籍整理中的古籍今譯、古籍注釋、訓詁、古籍校勘、古籍輯佚以及古籍的匯編計算機輔助等基本問題,并提出了“機整”的概念,即電子計算機參與古籍整理研究領域的工作[10]。
二、20世紀90年代——多種術語混用時期
20世紀90年代,隨著計算機用于古籍整理實踐的豐富和大量數據庫資源的開發,學術界開始出現古籍電腦化、古籍自動化、古籍電子化以及古籍數字化等術語。這些術語或在論文標題中出現,或在行文中出現,但都沒有具體內涵的界定。這種現象反映了學術界對古籍數字化概念的模糊性,因此出現了如此之多的這類術語。
1990年臺灣《國文天地》為推動古籍整理中電腦的運用,特意推出專欄“科技新貴與古籍佳人的結合——中國古籍電腦化”,盡管專欄中沒有一篇文章給出“古籍電腦化”確切的定義,卻第一次提出了“古籍電腦化”的術語。1994年田奕在“古籍整理與研究的電腦化”(《中國文化》1994年第1期)一文中也使用了“古籍電腦化”。1995年臺灣元智工學院教師羅鳳珠開發出了“唐詩多媒體網絡系統”。同時,羅鳳珠還提出了古籍自動化和文史資料自動化的術語[11]。同時,在臺灣還出現了“古籍全文數據庫”(謝清俊、林晰“中央研究院古籍全文數據庫的發展概要”《計算中心通訊》1995年第7卷)、“古籍文獻之資訊化”(黃沛榮“古籍文獻資訊化之現況與檢討”《國家圖書館館刊》1997年第6期)、“珍藏文獻數字化”(薛理桂“珍藏文獻數字化之發展現況與展望”《國立中央圖書館臺灣分館館刊》1997年第9期)等術語。
“古籍數字化”術語最早出現在大陸。1996年上海圖書館啟動重點科研項目——古籍善本全文光盤,計劃將館藏古籍善本全部數字化。上海圖書館研制的中國古籍善本查閱系統,將館藏善本古籍的全文數據以圖像形式錄入光盤,并對標引、檢索、查閱等功能進行了開發,為古籍善本的數字化作了嘗試[12]。在開發建設“古籍善本全文光盤”的過程中,上海圖書館的工作人員劉煒、陳秉仁提出了“古籍數字化”(劉煒“上海圖書館古籍數字化的初步嘗試”《圖書館雜志》1997年第4期)、“古籍善本數字化”(陳秉仁“古籍善本數字化的嘗試:中國古籍善本查閱系統述略”《現代圖書情報技術》1998年第1期)的術語。盡管劉煒、陳秉仁還沒有對“古籍數字化”的概念作界定,但他們在文中詳細介紹了上海圖書館開發建設“古籍善本全文光盤”的過程,并對“古籍影像光盤制作及檢索系統”的結構、功能、配置作了全面描述。20世紀90年代,國內各大圖書館和科研院所都積極參與古籍數字化工作。1998年底由上海世紀出版集團上海人民出版社、香港迪志文化出版有限公司推出的《文淵閣四庫全書》電子版無論從技術上還是從市場上來講,堪稱這個階段古籍數字化的杰作。
面對國內如此豐碩的數字化成果,《中國典籍與文化》組織了“數字古籍”專欄,專題討論古籍的數字化問題。其中,陳洪瀾在“中國古籍電子化發展趨勢及其問題”(《中國典籍與文化》1998年第4期)一文中使用了“古籍電子化”的術語。事實上,這個階段“古籍電子化”“古籍數字化”“古籍的數字化”是交替使用的。出現這種情況的原因是由于20世紀90年代“數字化”“電子化”混用造成的。王冠中認為:數字化是一個制作過程,電子化是一個應用過程。所以古籍數字化就是古籍文獻制作成數字成品的過程;而古籍的電子化則是古籍文獻數字化后,被使用的過程。因此,綜合而言“數字化”這個概念的表述相應要準確一些[13]。而事實證明,進入21世紀以后,學術界廣泛接受了“古籍數字化”這一術語。
三、21世紀初——古籍數字化概念的形成
明確的古籍數字化(電子化)概念的出現是在21世紀初。2000年李運富在“談古籍電子版的保真原則和整理原則”一文中首次界定了“古籍電子化”的概念。“所謂古籍電子化,是指利用現代信息技術,將歷來以抄寫本、刻鑄本、雕版、活字版、套版及鉛字印刷等方式所呈現的古代文獻,轉化為電子媒體的形式”[14]。李運富從技術轉化的角度提出了古籍數字化的概念,但明顯缺少古籍數字化目的的界定。彭江岸“論古籍的數字化”一文對此作了補充:“古籍數字化就是利用數字技術將古籍的有關信息轉換成數字信息,存貯在計算機上,從而達到使用和保護古籍的目的”[15]。然而需要指出的是,古籍數字化事實上是一項系統的工作過程,以上兩個概念缺少這方面的描述。2001年喬紅霞“關于古籍全文數據庫建設工作的思考”一文又作了進一步的歸納:“我國的古籍數據庫建設即古籍數字化工作伴隨著我國數字圖書館發展的步伐,經歷了認識、探索、研制3個階段。在這3個階段的探索中人們把古籍的數字化歸納為這樣一個概念,即利用多媒體技術、數據庫技術、數據壓縮技術、光盤存儲技術、網絡傳輸技術等手段把館藏印刷型文獻、縮微型文獻、音像型文獻等傳統介質文獻轉化為數字化、電子化的光盤或網絡信息的工作”[16]。但這個概念又略顯復雜,因此,張雪梅又做了簡化:“古籍數字化就是采用計算機技術,對古籍文獻進行加工、處理,制成古籍文獻書目數據庫和古籍全文數據庫,用以揭示古籍文獻中所蘊含的極其豐富的信息資源,從而達到使用和保護古籍的目的”[17]。
四、結語
綜上所述,我們可給古籍數字化界定如下:古籍數字化就是從利用和保護古籍的目的出發,采用計算機技術,將常見的語言文字或圖形符號轉化為能被計算機識別的數字符號,從而制成古籍文獻書目數據庫和古籍全文數據庫,用以揭示古籍文獻信息資源的一項系統工作。需要指出的是,古籍數字化還處在理論和實踐的探索之中,對古籍數字化概念存在不同的認識應是古籍數字化發展中所必須經歷的過程。基于這個概念,我們就可以將古籍數字化的基本性質定位為:古籍數字化是對古籍或古籍內容的再現和加工,屬于古籍整理的范疇,是古籍整理的一部分。古籍數字化是21世紀古籍整理的主流,代表著未來古籍整理的發展方向。古籍數字化屬于古籍整理和學術研究(或稱校讎學)的范疇。古籍數字化的最終結果是將古籍資源制成古籍文獻書目數據庫和古籍全文數據庫,從而達到利用和保護古籍的目的。
參考文獻:
[1]史睿.論中國古籍數字化與人文學術研究[J].國家圖書館學刊,1999(2):28-35.
[2]葉曉珍.電腦搖身,古籍一變——訪中研院談古籍全文檢索系統[J].國文天地,1990(9):16-19.
[3]陳郁夫.“龍泉”初淬——“嶺月”中英全文處理檢索系統開發記[J].國文天地,1990(9):22-23.
[4]彭昆侖.闖入神奇的知識王國——“電腦紅學”研究的甘苦談[J].國文天地,1990(9):34-37.
[5]田奕.古籍整理與研究的電腦化[J].中國文化,1994(1):85-89.
[6]張衛東.讓古籍插上電腦之翼高飛——從“帶領《紅樓夢》進入電腦”說起[J].國文天地,1990(9):30-33.
[7]楊允敬.用電腦說文解字——大型辭典電腦化的嘗試[J].國文天地,1990(9):28-29.
[8]陳東輝.20世紀古籍索引編制概述[J].文獻,1998(2):69-78.
[9]張琪玉.古籍索引的一個范例——介紹《古今圖書集成》電子版的索引數據庫[J].圖書館雜志,2000(5):48-49.
[10]曹書杰.古籍整理與電子計算機應用研究的思考[J].古籍整理研究學刊,1988(1):44-49.
[11]羅鳳珠.攜手同行古籍自動化的路:不廢江河萬古流——D.I.Y.唐詩多媒體網絡系統架構設計[J].國文天地,1995(6):105-111.
[12]陳秉仁.古籍善本數字化的嘗試:中國古籍善本查閱系統述略[J].現代圖書情報技術,1998(1):22-25,45.
[13]王冠中.中文古籍數字化成果與展望[D].長春:東北師范大學,2005:3-4.
[14]李運富.談古籍電子版的保真原則和整理原則[J].古籍整理研究學刊,2000(1):1-7.
[15]彭江岸.論古籍的數字化[J].河南圖書館學刊,2000(2):63-65.
[16]喬紅霞.關于古籍全文數據庫建設工作的思考[J].河南圖書館學刊,2001(4):58-60.
[17]張雪梅.古籍數字化與文獻信息資源共享[J].天津工業大學學報(社科版),2002(3):85-86.
原刊《科技情報開發與經濟》2006年第22期 |