鄭永曉
內(nèi)容提要:現(xiàn)代圖書分類法在適用古籍文獻(xiàn)時(shí)常有削足適履、生搬硬套之嫌。因此,對(duì)于大型傳統(tǒng)古籍?dāng)?shù)據(jù)庫(kù)建設(shè)而言,中國(guó)傳統(tǒng)目錄學(xué)中以經(jīng)、史、子、集四部分類為基礎(chǔ)的圖書分類法仍具有不可或缺的作用,這是由學(xué)科特點(diǎn)和數(shù)據(jù)庫(kù)建設(shè)的基本要求兩方面因素所決定的,傳統(tǒng)文獻(xiàn)學(xué)所積累的學(xué)科規(guī)范與現(xiàn)代數(shù)據(jù)技術(shù)處理的有機(jī)結(jié)合才能更好地適應(yīng)新時(shí)期數(shù)據(jù)庫(kù)建設(shè)的需要。對(duì)于文獻(xiàn)種類繁多、內(nèi)容龐雜的綜合性古籍?dāng)?shù)據(jù)庫(kù)而言,盡管計(jì)算器有強(qiáng)大無(wú)比的檢索功能,可以任意提取所需字段或數(shù)據(jù),但是,相關(guān)數(shù)據(jù)按照一定的規(guī)則進(jìn)行有序排列仍然是十分必要的。而對(duì)于古籍?dāng)?shù)據(jù)庫(kù)建設(shè)而言,按照經(jīng)、史、子、集四部分類法進(jìn)行排列仍然是迄今為止最好的解決方案。將傳統(tǒng)目錄學(xué)與古籍?dāng)?shù)據(jù)庫(kù)建設(shè)聯(lián)姻,進(jìn)行古籍分類和數(shù)據(jù)導(dǎo)入,其優(yōu)越性表現(xiàn)在:一、作為數(shù)據(jù)庫(kù)底層數(shù)據(jù)分類的依據(jù),有效避免因分類混亂產(chǎn)生的訛誤。二、可以作為確定數(shù)據(jù)屬性的依據(jù),每一條數(shù)據(jù)都屬于每個(gè)部類下的某個(gè)子類,只有首先按照目錄學(xué)知識(shí)對(duì)每條數(shù)據(jù)進(jìn)行定性,才能使整個(gè)數(shù)據(jù)庫(kù)具備符合學(xué)科要求的檢索功能。以下從四個(gè)方面對(duì)此稍加梳理,以就教于學(xué)界方家。
一、現(xiàn)代學(xué)術(shù)發(fā)展與傳統(tǒng)目錄學(xué)之關(guān)系
筆者首先做一個(gè)界定,此處所謂學(xué)術(shù)特指以中國(guó)古典文學(xué)、古代歷史、古代哲學(xué)等為研究對(duì)象的學(xué)科,這些學(xué)科雖各自有其獨(dú)立的學(xué)科范疇和學(xué)術(shù)體系,但在長(zhǎng)期的發(fā)展歷程中,也在相互汲取他方的研究成果,互為借鑒,相互促進(jìn)。更有少數(shù)學(xué)術(shù)大家,文、史、哲兼通,其學(xué)術(shù)成果橫跨各個(gè)領(lǐng)域,世所矚目。所以舊時(shí)有“文史不分家”之說(shuō)。而在人類社會(huì)步入二十一世紀(jì)的今天,學(xué)術(shù)追求、學(xué)術(shù)理念、學(xué)術(shù)方法都有重大的革新,尤其是看似與人文學(xué)科關(guān)系甚遠(yuǎn)的計(jì)算機(jī)科學(xué)與網(wǎng)絡(luò)技術(shù)竟深深地影響了這具有悠久歷史傳統(tǒng)的文、史、哲研究,令人驚嘆現(xiàn)代學(xué)術(shù)中學(xué)科交叉、融合趨勢(shì)之不可阻擋與學(xué)術(shù)發(fā)展、學(xué)術(shù)進(jìn)步之日新月異。
在這日新月異的學(xué)術(shù)發(fā)展中,我們固然需要不斷汲取現(xiàn)代科學(xué)的最新成果,吸收其他學(xué)科的成果,創(chuàng)建和扶植各種新興學(xué)科、交叉學(xué)科,從不同角度發(fā)現(xiàn)和培植學(xué)術(shù)增長(zhǎng)點(diǎn);另一方面,我們絕對(duì)不能忽視傳統(tǒng)學(xué)科本身固有的特性,應(yīng)在充分繼承學(xué)科原有特點(diǎn)和成就的基礎(chǔ)上進(jìn)行創(chuàng)新。而在傳統(tǒng)的文史研究、現(xiàn)代信息技術(shù)和數(shù)據(jù)庫(kù)建設(shè)這一學(xué)術(shù)鏈條中,筆者以為,傳統(tǒng)目錄學(xué)的重要性不容忽視。
大體而言,在中國(guó)傳統(tǒng)目錄學(xué)史上,目錄學(xué)重在“辨章學(xué)術(shù),考鏡源流”,章學(xué)誠(chéng)在評(píng)價(jià)劉向、劉歆父子目錄學(xué)之成就時(shí)指出:
校讎之義,蓋自劉向父子部次條別,將以辨章學(xué)術(shù),考鏡源流,非探明于道術(shù)精微,群言得失之故者,不足與此。[1]
作為我國(guó)最早的分類目錄學(xué)著述,劉歆《七略》所建立的分類體系以及每類之下有說(shuō)明和每書之下撰寫敘錄的體例和范式,影響深遠(yuǎn),成為我國(guó)傳統(tǒng)目錄學(xué)史上需要遵守的基本范式。作者于每類之下所作的考辨,是對(duì)于此一類書籍所產(chǎn)生之由來(lái)、遞嬗、發(fā)展等所作的揭示,對(duì)于辨析學(xué)術(shù)之流變和異同頗有裨益。而作者于每種書下所作的敘錄,更進(jìn)一步對(duì)相關(guān)文獻(xiàn)的作者、版本、真?zhèn)巍?nèi)容、價(jià)值等予以考辨,其學(xué)術(shù)價(jià)值亦毋庸贅言。其后班固《漢書·藝文志》即據(jù)劉歆《七略》增刪改纂而成,既保留了西漢一代文獻(xiàn)的概貌,其總序等又對(duì)先秦以來(lái)的學(xué)術(shù)思想源流有所辨析。唐代首創(chuàng)四部分類體系的《隋書·經(jīng)籍志》在繼承《七略》和《漢書·藝文志》的基礎(chǔ)上,對(duì)文獻(xiàn)的分類和對(duì)文獻(xiàn)流變、沿革的闡述也厥功甚偉。
宋代目錄學(xué)名著如林,在中國(guó)目錄學(xué)史上有極其重要的地位。舉其要者,如我國(guó)現(xiàn)存最古老的官修目錄學(xué)著作《崇文總目》、著名私人提要目錄《郡齋讀書志》和《直齋書錄解題》、特別注重標(biāo)明版本的目錄《遂初堂書目》等無(wú)不是中國(guó)目錄學(xué)著述之翹楚。《崇文總目》以“敘”闡述所收各類文獻(xiàn)之源流、特色、得失等,而以“釋”介紹具體各書之內(nèi)容,言簡(jiǎn)而意賅,歷來(lái)頗受好評(píng)。至如《郡齋讀書志》和《直齋書錄解題》則對(duì)各類文獻(xiàn)進(jìn)行或詳或略的提要,于作者之生平事跡、學(xué)術(shù)淵源和書籍的得失短長(zhǎng)及版本流傳等有著相當(dāng)精審的評(píng)述,嘉惠后學(xué)甚多,屬于治古代文史之學(xué)的必讀書目。南宋尤袤所著《遂初堂書目》雖于題解方面有所缺失,但于部分書籍名稱前著錄版本,且同一種書往往著錄數(shù)種版本,使得各種版本間可以相互考訂,此舉頗受后世目錄版本學(xué)家的稱贊。
雖然在中國(guó)歷史上,目錄學(xué)著作并非都這樣以“辨章學(xué)術(shù)、考鏡源流”為宗旨,但毫無(wú)疑問(wèn),“辨章學(xué)術(shù)、考鏡源流”,示人以治學(xué)門徑,是中國(guó)傳統(tǒng)目錄學(xué)的重要功能,自有其不可忽視的價(jià)值,也因此受到歷代眾多學(xué)者的高度重視,清代四庫(kù)館臣所撰《四庫(kù)全書總目》即遵循此一規(guī)范而更趨完善。
近代以來(lái),伴隨西方目錄學(xué)的引進(jìn)和中國(guó)目錄學(xué)的現(xiàn)代化,以實(shí)用性為指歸,強(qiáng)調(diào)索引便捷性的目錄學(xué)逐漸占據(jù)主導(dǎo)地位。筆者以為,隨著現(xiàn)代圖書數(shù)量的急劇增加,向普通公眾提供圖書借閱服務(wù)的圖書館轉(zhuǎn)向方便性、實(shí)用性更強(qiáng)的以書名索引為主要內(nèi)容的現(xiàn)代目錄學(xué)體系自有其合理性。但是,對(duì)于以中國(guó)傳統(tǒng)文、史、哲為研究方向的傳統(tǒng)學(xué)術(shù)而言,以“辨章學(xué)術(shù)、考鏡源流”為宗旨的傳統(tǒng)目錄學(xué)則更具參考價(jià)值。而這一點(diǎn),正是我們?cè)诮ㄔO(shè)以中國(guó)傳統(tǒng)文史資料為主要內(nèi)容的數(shù)據(jù)庫(kù)時(shí)所必須考慮的。
二、目錄學(xué)與索引及全文檢索之異同
在信息技術(shù)影響于傳統(tǒng)學(xué)科的進(jìn)程中,筆者特別重視現(xiàn)代技術(shù)與傳統(tǒng)學(xué)科特點(diǎn)的有機(jī)融合,亦即現(xiàn)代信息技術(shù)對(duì)傳統(tǒng)學(xué)科的影響,應(yīng)以更加強(qiáng)化傳統(tǒng)學(xué)科能夠保持學(xué)科特點(diǎn)并且能夠加速學(xué)科發(fā)展為前提。筆者所以認(rèn)為建設(shè)中國(guó)古代文史資料數(shù)據(jù)庫(kù)應(yīng)參照傳統(tǒng)目錄學(xué)成果和規(guī)范,是因?yàn)橐粋(gè)面向?qū)I(yè)人員,以學(xué)科基礎(chǔ)建構(gòu)為宗旨的數(shù)據(jù)庫(kù),必須具備一定的學(xué)術(shù)水準(zhǔn),符合該學(xué)科的學(xué)術(shù)規(guī)范,而借鑒傳統(tǒng)目錄學(xué)的規(guī)范和成果,正是建設(shè)高水準(zhǔn)文史數(shù)據(jù)庫(kù)的重要前提。
如上所述,中國(guó)傳統(tǒng)目錄學(xué)的優(yōu)勢(shì)之一在于能夠通過(guò)類的區(qū)分和書目的解題示學(xué)人以讀書治學(xué)之門徑,通過(guò)綱目、細(xì)目、解題等方式,提綱挈領(lǐng),綱舉目張,將某一領(lǐng)域的文獻(xiàn)屬性,包括作者情況、版本流變、內(nèi)容真?zhèn)巍⒑笕嗽u(píng)價(jià)等有條不紊地展示在讀者面前。其長(zhǎng)處在于能夠令人快速掌握相關(guān)領(lǐng)域的重要文獻(xiàn)線索,不會(huì)發(fā)生讀書治學(xué)不得其門的困境。其短處則是傳統(tǒng)目錄學(xué)在文獻(xiàn)本身內(nèi)容的介紹和檢索方面功能較弱,難以快速查詢文獻(xiàn)中的細(xì)節(jié)。
快速而準(zhǔn)確地檢索到文獻(xiàn)內(nèi)容的細(xì)微之處則是索引的長(zhǎng)處,更是當(dāng)代計(jì)算機(jī)技術(shù)在書籍文獻(xiàn)類數(shù)據(jù)庫(kù)中的長(zhǎng)項(xiàng)所在。
索引,又稱索隱、引得(Index),是在西方目錄學(xué)影響下逐步完善的文獻(xiàn)檢索方式。其編纂方式是將圖書、報(bào)刊等文獻(xiàn)中的字、詞、句、人名、地名、書名、篇名、主題詞等按照一定的規(guī)則(如筆畫、拼音)等順序排列,便于用戶快速查詢到相關(guān)信息。西方的學(xué)術(shù)傳統(tǒng)中,十分重視索引的編纂。除專門的目錄學(xué)著作外,一個(gè)比較規(guī)范的專著,其書后也附有詳細(xì)的內(nèi)容索引、引文索引等。
而編制索引正是計(jì)算機(jī)的優(yōu)勢(shì)。具備超強(qiáng)記憶和查詢功能的計(jì)算機(jī)在建立文獻(xiàn)索引方面具有遠(yuǎn)非人工所可比擬的優(yōu)勢(shì),這種優(yōu)勢(shì)在大型文獻(xiàn)數(shù)據(jù)庫(kù)進(jìn)行全文檢索時(shí)表現(xiàn)得淋漓盡致。
同樣非常明顯的是,傳統(tǒng)目錄學(xué)與近現(xiàn)代以來(lái)在西方目錄學(xué)思想影響下的索引有著很大的不同。盡管索引也可以按照主題類別進(jìn)行排序,但是索引的長(zhǎng)項(xiàng)在細(xì)致和快捷,卻難以具備傳統(tǒng)目錄學(xué)那種“辨章學(xué)術(shù)、考鏡源流”的功能,在示人以讀書治學(xué)門徑方面與我國(guó)傳統(tǒng)目錄學(xué)相比,似頗有不如。顯然,二者各有所長(zhǎng),不可偏廢。這一點(diǎn),與現(xiàn)今如何在紛繁復(fù)雜的計(jì)算機(jī)系統(tǒng)中查詢目標(biāo)文件頗有類似之處。
我們知道,微軟開(kāi)發(fā)的操作系統(tǒng)在Windows 95以前,系統(tǒng)中建立任何文件都首先需要確定路徑(directory),所有的文件都是按照一定的路徑排列的。因此在DOS命令中,顯示目錄、建立目錄、刪除目錄等操作,都離不開(kāi)directory 這個(gè)詞,這個(gè)詞在中文環(huán)境下又譯作“目錄”。DOS和早期windows中的這個(gè)“目錄”,便頗有些類似于我國(guó)傳統(tǒng)目錄學(xué)中關(guān)于圖書類別的區(qū)分。知曉某一類文件的路徑所在,便不難按圖索驥,很方便地查詢到相關(guān)文件的具體位置。隨著技術(shù)的進(jìn)步,存儲(chǔ)器容量的激增、系統(tǒng)文件和用戶文件的幾何級(jí)增長(zhǎng),原來(lái)按路徑查詢定位文件的方式便力不從心了,所以微軟開(kāi)始發(fā)展搜索技術(shù)。搜索技術(shù)的要點(diǎn)是計(jì)算機(jī)在后臺(tái)建立系統(tǒng)內(nèi)盤符與文件的索引項(xiàng),用戶只要記得文件名、建立日期等要素便可在設(shè)定的區(qū)域內(nèi)或整個(gè)計(jì)算機(jī)、局域網(wǎng)內(nèi)查詢到所需要的文件。也因?yàn)樗阉骷夹g(shù)的成熟,微軟便將DOS系統(tǒng)下習(xí)慣使用的“路徑”(directory)一詞棄而不用而更改為使用“文件夾”(folder)。
問(wèn)題在于,世間萬(wàn)物的屬性是很復(fù)雜的。搜索技術(shù)的成熟固然對(duì)海量文件中查詢單個(gè)文檔頗有助益,但是一旦忘了文件名等文件屬性,則難免令用戶感覺(jué)所謂搜索反不如過(guò)去根據(jù)若干明晰的路徑更容易找到需要的文件。因此,微軟一方面開(kāi)發(fā)包括桌面搜索在內(nèi)的各類搜索軟件,同時(shí)卻也在Vista 等操作系統(tǒng)中將用戶文檔預(yù)設(shè)各種分類,以便用戶可以更方便地管理和使用自己的文件。其目的就是試圖把搜索技術(shù)和傳統(tǒng)的路徑管理兩方面的優(yōu)勢(shì)結(jié)合起來(lái)。
目錄和索引的異同和優(yōu)劣短長(zhǎng)給我們進(jìn)行數(shù)據(jù)庫(kù)開(kāi)發(fā)以重要啟示。我們知道,以當(dāng)代計(jì)算機(jī)科學(xué)和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展而言,各種類型的數(shù)據(jù)庫(kù)多具有強(qiáng)勁的檢索和查詢功能。因此,檢索技術(shù)在當(dāng)前而言不是問(wèn)題,如何把中國(guó)傳統(tǒng)目錄學(xué)那種“考鏡源流”、引導(dǎo)初學(xué)者以讀書治學(xué)之門徑和巨細(xì)無(wú)遺的檢索功能結(jié)合起來(lái)才是需要我們認(rèn)真對(duì)待和解決的問(wèn)題。這個(gè)問(wèn)題在建設(shè)與學(xué)科發(fā)展關(guān)系密切的專題數(shù)據(jù)庫(kù)和大型古典文獻(xiàn)數(shù)據(jù)庫(kù)時(shí)尤為重要。
三、傳統(tǒng)目錄學(xué)應(yīng)用于數(shù)據(jù)庫(kù)建設(shè)之探索
通過(guò)上文的分析我們不難看出,計(jì)算機(jī)的檢索功能固然強(qiáng)大,卻并不能代替我國(guó)傳統(tǒng)目錄中那種“辨章學(xué)術(shù),考鏡源流”的功能,難以示人以治學(xué)門徑。縱觀近年來(lái)比較流行的古籍類數(shù)據(jù)庫(kù),也往往是檢索功能強(qiáng),而分類和導(dǎo)引功能較弱。
在計(jì)算機(jī)科學(xué)和數(shù)據(jù)庫(kù)技術(shù)產(chǎn)生以前,一般而言,在文史研究領(lǐng)域,學(xué)者在從事某一研究課題之前,會(huì)根據(jù)所研究對(duì)象和領(lǐng)域的不同,大多會(huì)有選擇性地首先查閱《漢書·藝文志》、《隋書·經(jīng)籍志》、《四庫(kù)全書總目》這類目錄學(xué)著作,再通過(guò)這些目錄進(jìn)行延伸閱讀,找到自己研究領(lǐng)域所需要使用的書籍。這樣一條治學(xué)路徑優(yōu)點(diǎn)是不至于遺漏本學(xué)科需要研讀的基本書籍,不會(huì)漏掉最重要的基礎(chǔ)文獻(xiàn)。而其缺點(diǎn)也很明顯,即難以快速查詢到精確的信息。我們知道,中國(guó)古籍浩如煙海,即使將范圍限制在某個(gè)較小的領(lǐng)域,所閱讀的文獻(xiàn)也可能相當(dāng)龐大,比如研究《三國(guó)演義》,既需要梳理作為文學(xué)作品的小說(shuō)的各種資料,又需要研究與三國(guó)時(shí)期那段歷史相關(guān)的各種文獻(xiàn),同時(shí)還涉及宋元以來(lái)有關(guān)“三國(guó)”的戲曲、說(shuō)唱、曲藝等藝術(shù)部類。面對(duì)龐雜的各種文獻(xiàn),即使是睿智聰慧、博聞強(qiáng)記的學(xué)者也常常望書興嘆。因此,當(dāng)計(jì)算機(jī)技術(shù)滲透進(jìn)入中文信息處理領(lǐng)域,專門為文史研究者開(kāi)發(fā)建設(shè)的電子版“國(guó)學(xué)寶典”、《四部叢刊》、《四庫(kù)全書》、“廿五史”、“中國(guó)基本古籍庫(kù)”等數(shù)據(jù)庫(kù)問(wèn)世后,眾多學(xué)者大為贊嘆。 整日在書海中遨游的學(xué)者們此前從未想到,計(jì)算機(jī)能夠在這樣短的時(shí)間內(nèi)檢索出那么多巨細(xì)無(wú)遺的資料,其記憶力和反應(yīng)速度與人腦相比,勝過(guò)后者何止千倍!
問(wèn)題在于,學(xué)術(shù)的發(fā)展涉及方方面面,既有微觀研究,也有宏觀研究;既有以探索歷史發(fā)展規(guī)律為指歸的理論研究,也有針對(duì)某個(gè)具體問(wèn)題或某個(gè)研究對(duì)象所作的專題研究。舉例來(lái)說(shuō),如果某學(xué)者準(zhǔn)備就歷史上的諸葛亮寫一篇論文,他可以在某些古籍?dāng)?shù)據(jù)庫(kù)中,以“諸葛亮”為主題詞將搜索范圍限定為史學(xué)著作進(jìn)行檢索,所得出的結(jié)果當(dāng)有助于對(duì)某些論點(diǎn)的辨證和澄清,或是提出新的見(jiàn)解。但是,如果一個(gè)剛剛試圖步入學(xué)術(shù)之門的年輕學(xué)者對(duì)小說(shuō)《三國(guó)演義》產(chǎn)生了興趣,想以此作為自己的研究方向,將“三國(guó)演義”作為主題詞在上述古籍?dāng)?shù)據(jù)庫(kù)中搜索,他可能得出上萬(wàn)條有關(guān)《三國(guó)演義》的信息。面對(duì)這許多撲面而來(lái)的數(shù)據(jù),他極有可能會(huì)無(wú)所適從。這是由于,就目前的數(shù)據(jù)庫(kù)開(kāi)發(fā)水平而言,檢索出來(lái)的這些信息一般會(huì)按照數(shù)據(jù)庫(kù)中所收古籍的時(shí)間順序遞次排列。這種排序?qū)τ谘芯空叨裕鋵?shí)與雜亂無(wú)章沒(méi)什么差別,對(duì)于如何進(jìn)入《三國(guó)演義》的研究幫助不大。之所以如此,就是因?yàn)榛谌臋z索技術(shù)而產(chǎn)生的這些查詢結(jié)果并不能按照研究者的意愿進(jìn)行真正有序的排列,它無(wú)法判斷那些書籍更重要,那些信息是垃圾。當(dāng)然,對(duì)于信息的價(jià)值判斷本身正是屬于需要學(xué)者研究的范圍。但是,對(duì)于文史研究這種歷史悠久的傳統(tǒng)學(xué)科而言,前人的研究成果已然汗牛充棟,那么在數(shù)據(jù)庫(kù)中,根據(jù)以往的學(xué)術(shù)成果對(duì)所收文獻(xiàn)進(jìn)行一個(gè)初步的學(xué)術(shù)判斷,為初學(xué)者給出一個(gè)基本的價(jià)值評(píng)估,似也不算過(guò)分要求。
誠(chéng)然,憑借技術(shù)進(jìn)步和增加人工干預(yù),可以通過(guò)事先標(biāo)記等手段對(duì)所收數(shù)據(jù)進(jìn)行預(yù)處理,比如標(biāo)記圖書類別、朝代、時(shí)間、方位、人名、地名、職官等信息,使用戶在查詢時(shí)能夠得到一個(gè)按照標(biāo)記類別排列順序的檢索結(jié)果。這當(dāng)然較之單純由計(jì)算機(jī)控制的全文檢索結(jié)果要好得多,但即便如此,卻也并不能給予用戶一個(gè)綱目清晰、全面完整、系統(tǒng)有序的有關(guān)研究對(duì)象的資料信息。這一點(diǎn),卻正是傳統(tǒng)目錄學(xué)著作所擅長(zhǎng)的功能。
因此,筆者以為,適用于學(xué)科基礎(chǔ)建構(gòu),推動(dòng)學(xué)術(shù)發(fā)展的數(shù)據(jù)庫(kù),應(yīng)該是結(jié)合傳統(tǒng)目錄學(xué)和計(jì)算機(jī)雙方長(zhǎng)處的結(jié)晶。
之所以說(shuō)傳統(tǒng)目錄學(xué)而不是現(xiàn)代目錄學(xué),是因?yàn)槿缜拔乃觯F(xiàn)代目錄學(xué)更側(cè)重于索引,而非傳統(tǒng)的目錄解題。至于索引功能,計(jì)算機(jī)較過(guò)去人工編制索引已經(jīng)遠(yuǎn)為完善,而傳統(tǒng)目錄學(xué)的分類、解題等功能便成為學(xué)術(shù)數(shù)據(jù)庫(kù)需要汲取和完善的地方。現(xiàn)有的某些數(shù)據(jù)庫(kù),在編列數(shù)據(jù)時(shí)雖然也根據(jù)朝代、文體等要素對(duì)所收錄的數(shù)據(jù)進(jìn)行排列,亦即數(shù)據(jù)庫(kù)除可以全文檢索外,也可以按類查找相關(guān)書籍進(jìn)行閱讀。但是,這些數(shù)據(jù)庫(kù)的分類經(jīng)常既未嚴(yán)格遵守傳統(tǒng)目錄學(xué)的分類標(biāo)準(zhǔn),亦難以用現(xiàn)代圖書分類法進(jìn)行規(guī)范,往往是根據(jù)朝代或文體對(duì)所收文獻(xiàn)進(jìn)行粗淺的分類。而在比較規(guī)范的傳統(tǒng)目錄學(xué)中,對(duì)每種文獻(xiàn)其實(shí)有著相當(dāng)嚴(yán)格的區(qū)分。例如經(jīng)部所收文獻(xiàn)與子部儒學(xué)類是不能相混淆的。而史部文獻(xiàn)中又可區(qū)分出正史、別史、編年、紀(jì)事本末、史鈔、史評(píng)、傳記、政書、職官、地理、雜史等類別。籠統(tǒng)地以冠以所謂歷史著作的名稱不僅僅顯得沒(méi)有學(xué)術(shù)水準(zhǔn),更重要的是對(duì)于用戶而言,也失去了引導(dǎo)學(xué)者進(jìn)入相關(guān)領(lǐng)域?qū)W術(shù)殿堂的功能。
筆者以為,在建設(shè)面向?qū)W者,為科研服務(wù)的文史類數(shù)據(jù)時(shí),應(yīng)審慎、嚴(yán)格、規(guī)范地按照傳統(tǒng)目錄學(xué)的相關(guān)知識(shí)對(duì)所收文獻(xiàn)進(jìn)行排列、設(shè)置。絕對(duì)不能憑借數(shù)據(jù)庫(kù)強(qiáng)大的檢索功能而疏于對(duì)數(shù)據(jù)按照學(xué)術(shù)屬性進(jìn)行設(shè)置和排列。亦即符合學(xué)術(shù)規(guī)范、對(duì)學(xué)科建設(shè)有更大裨益的數(shù)據(jù)庫(kù)應(yīng)是將目錄和索引兩方面的功能結(jié)合起來(lái),才能達(dá)到既能令用戶可以清晰地利用文獻(xiàn)目錄的導(dǎo)引功能,了解數(shù)據(jù)庫(kù)收錄文獻(xiàn)的范圍、名稱、作者、版本、學(xué)術(shù)價(jià)值等信息,也能夠憑借數(shù)據(jù)庫(kù)強(qiáng)大的檢索功能可以快速查詢到任何一個(gè)細(xì)微的信息單元。
基于此種考慮,中國(guó)社會(huì)科學(xué)院A類課題“元代文獻(xiàn)數(shù)據(jù)庫(kù)”在立項(xiàng)之初,便決定遵循傳統(tǒng)目錄學(xué)中關(guān)于圖書的四部分類法對(duì)所收文獻(xiàn)進(jìn)行分類,同時(shí)在技術(shù)上,則保證數(shù)據(jù)庫(kù)有強(qiáng)大的檢索功能,包括分類檢索、按作者、書名、主題詞檢索及全文檢索等。因?yàn)樵摂?shù)據(jù)庫(kù)雖然僅是元代一個(gè)朝代的斷代文獻(xiàn)數(shù)據(jù)庫(kù),但所收經(jīng)、史、子、集四部文獻(xiàn)也十分龐雜。又考慮到這樣一個(gè)數(shù)據(jù)庫(kù)的用戶必然涉及史學(xué)、文學(xué)、哲學(xué)等多個(gè)學(xué)科,所謂術(shù)業(yè)有專攻,學(xué)者的研究方向不同,研究領(lǐng)域不同,所研讀的文獻(xiàn)便自然有所區(qū)別。我們按照學(xué)科規(guī)范對(duì)這些文獻(xiàn)條分縷析,對(duì)所收文獻(xiàn)的屬性有明確的、細(xì)致的定位,并且在每種文獻(xiàn)之前,錄入《四庫(kù)全書總目》等文獻(xiàn)中有關(guān)元代文獻(xiàn)的提要和時(shí)人及后人為該文獻(xiàn)所作的序跋,這就類似于傳統(tǒng)目錄學(xué)中對(duì)文獻(xiàn)所作的解題,其目的就是令用戶在使用這些文獻(xiàn)之初,就能首先對(duì)這些文獻(xiàn)的屬性和價(jià)值有較為明晰的了解,并以此確定該數(shù)據(jù)庫(kù)中所收錄的文獻(xiàn)有哪些可以涵容在該學(xué)者的研究范圍之內(nèi)。數(shù)據(jù)庫(kù)對(duì)所收文獻(xiàn)所作的這種細(xì)致分類顯然有助于學(xué)者能夠更快地利用數(shù)據(jù)庫(kù)掌握本學(xué)科領(lǐng)域的相關(guān)文獻(xiàn)。
四、傳統(tǒng)目錄學(xué)應(yīng)用于數(shù)據(jù)庫(kù)建設(shè)之意義
在近年來(lái)的學(xué)術(shù)研究中,學(xué)者們?cè)谑褂脭?shù)據(jù)庫(kù)時(shí)已經(jīng)習(xí)慣了其強(qiáng)大的搜索功能,這在查詢某個(gè)細(xì)小的信息時(shí)尤為重要,因?yàn)檫@種檢索是人工很難辦到的。對(duì)于像文、史、哲研究這種傳統(tǒng)學(xué)科來(lái)說(shuō),學(xué)者們已經(jīng)慶幸自己擁有了前輩學(xué)者做夢(mèng)也沒(méi)有想到的便捷工具。
但是,治學(xué)嚴(yán)謹(jǐn)?shù)膶W(xué)者在使用這種功能強(qiáng)大的數(shù)據(jù)庫(kù)時(shí),卻并不會(huì)將數(shù)據(jù)庫(kù)提供的信息直接引用在自己的學(xué)術(shù)論文中。他們滿足于數(shù)據(jù)庫(kù)給自己提供了一個(gè)線索,而為了可靠與嚴(yán)謹(jǐn),他們一定會(huì)再找到原始紙質(zhì)書籍或其他精良版本,重新校對(duì),才能放心地將檢索獲得的信息作為自己學(xué)術(shù)論文的組成部分。
這樣的結(jié)果難道是數(shù)據(jù)庫(kù)開(kāi)發(fā)建設(shè)者所樂(lè)意看到的嗎?
之所以產(chǎn)生這樣的結(jié)果,原因固然有多種,其中,現(xiàn)今文史類數(shù)據(jù)庫(kù)的開(kāi)發(fā)還未能完全遵守學(xué)術(shù)規(guī)范,未能切實(shí)體察學(xué)者的實(shí)際需求則是重要原因。
所以,我們一方面應(yīng)充分肯定近年來(lái)文史類數(shù)據(jù)庫(kù)建設(shè)的成就,另一方面,則不能故步自封,滿足于目前取得的成績(jī),而應(yīng)該切實(shí)從學(xué)術(shù)發(fā)展和學(xué)科建設(shè)的角度,仔細(xì)審慎地體察學(xué)者的需求,將數(shù)據(jù)庫(kù)建設(shè)推進(jìn)到一個(gè)新的高度。
而要實(shí)現(xiàn)這樣一種愿景,筆者以為最重要之處即是汲取傳統(tǒng)目錄學(xué)的長(zhǎng)處,利用目錄學(xué)知識(shí)的引導(dǎo),在全面、專業(yè)、精良等方面下功夫,庶幾可以逐步滿足學(xué)者的需求。
所謂全面是指數(shù)據(jù)庫(kù)所收文獻(xiàn)的范圍而言,應(yīng)當(dāng)盡可能巨細(xì)無(wú)遺地網(wǎng)羅符合數(shù)據(jù)庫(kù)建設(shè)宗旨的所有文獻(xiàn)和數(shù)據(jù)。就目前的數(shù)據(jù)庫(kù)開(kāi)發(fā)情況而言,文史類數(shù)據(jù)庫(kù)大體可分為三種類型,其一為將某部或多部大型圖書進(jìn)行數(shù)字化,并建成數(shù)據(jù)庫(kù),如眾所周知的電子版《四部叢刊》、《文淵閣四庫(kù)全書》等。其二是試圖將中國(guó)有史以來(lái)的重要文獻(xiàn)盡其所能收錄于一個(gè)大型數(shù)據(jù)庫(kù)中,如“國(guó)學(xué)寶典”、“中國(guó)基本古籍庫(kù)”等。其三是根據(jù)某些分支學(xué)科建設(shè)的需要,建設(shè)為某個(gè)具體學(xué)科服務(wù)的專題數(shù)據(jù)庫(kù),如我們正在建設(shè)的“元代文獻(xiàn)數(shù)據(jù)庫(kù)”和“《紅樓夢(mèng)》研究資料數(shù)據(jù)庫(kù)”等。前者可用于對(duì)元代文、史、哲等方面的研究,后者則僅限于為《紅樓夢(mèng)》研究服務(wù)。
由于中國(guó)歷史悠久,印刷術(shù)發(fā)達(dá),因此歷代遺留下來(lái)的文獻(xiàn)數(shù)量十分龐大。這既是中華文明寶貴的精神遺產(chǎn),也是我們今天從事古籍?dāng)?shù)字化所賴以進(jìn)行的對(duì)象。而因其數(shù)量巨大,產(chǎn)生的年代不同,存放的介質(zhì)不同,或?yàn)榘婵蹋驗(yàn)槭殖渥舟E或清晰或模糊,這就使得中國(guó)古籍的數(shù)字化和數(shù)據(jù)庫(kù)建設(shè)面臨巨大的挑戰(zhàn)。
至少就目前來(lái)說(shuō),很難有哪一個(gè)數(shù)據(jù)庫(kù)能夠?qū)⑾惹匾詠?lái)的所有文獻(xiàn)都網(wǎng)羅進(jìn)一個(gè)數(shù)據(jù)庫(kù)中。即使這種超大型數(shù)據(jù)庫(kù)最終能夠完成,也會(huì)因?yàn)榇鎯?chǔ)和運(yùn)算速度的限制而造成使用效率的浪費(fèi)。
《四部叢刊》、《四庫(kù)全書》那樣級(jí)別的文獻(xiàn)畢竟不是太多。像“國(guó)學(xué)寶典”、“中國(guó)基本古籍庫(kù)”那樣的數(shù)據(jù)庫(kù)當(dāng)然也可以繼續(xù)增添新的文獻(xiàn)。然而,為了學(xué)科建設(shè)的需要和學(xué)者使用的便利,在未來(lái)的數(shù)據(jù)庫(kù)建設(shè)中,筆者以為應(yīng)該把重點(diǎn)放在那些切合學(xué)科建構(gòu)需要的專題數(shù)據(jù)庫(kù)方面。
而對(duì)于一個(gè)專題數(shù)據(jù)庫(kù)來(lái)說(shuō),首先考慮的因素就是收錄數(shù)據(jù)必須全面,亦即對(duì)于該學(xué)科或該專項(xiàng)研究而言,數(shù)據(jù)庫(kù)應(yīng)竭盡其所能將所有能夠?yàn)樵擁?xiàng)研究利用的資料悉數(shù)收錄進(jìn)來(lái)。那么如何才能確保所收數(shù)據(jù)全面而不至有所遺漏呢?當(dāng)然是向權(quán)威的目錄學(xué)著作求助。目錄學(xué)著述已經(jīng)為我們提供了歷代文獻(xiàn)的存世數(shù)量、版本、存放地點(diǎn)等信息,按書索驥,便不難將相關(guān)文獻(xiàn)資料全部網(wǎng)羅進(jìn)來(lái),不會(huì)產(chǎn)生重要文獻(xiàn)未被納入的缺憾。而一個(gè)有學(xué)養(yǎng)的數(shù)據(jù)庫(kù)用戶,他當(dāng)然能夠判斷該數(shù)據(jù)庫(kù)所收文獻(xiàn)是否足夠全面,如果收錄的文獻(xiàn)沒(méi)有缺漏,則能夠使學(xué)者在從事此一領(lǐng)域的研究時(shí)別無(wú)所求,不必再花費(fèi)心思到別處查詢資料,則此數(shù)據(jù)庫(kù)的價(jià)值也就不言而喻。
第二點(diǎn)則是專業(yè)性。庫(kù)中所收錄的文獻(xiàn)不僅要全面無(wú)缺漏,還應(yīng)該在數(shù)據(jù)分類、數(shù)據(jù)排列、屬性設(shè)置、檢索科學(xué)等方面符合文史學(xué)科本身的特性,特別需要能夠根據(jù)前人和今人的已有研究成果對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,能夠給出像傳統(tǒng)目錄學(xué)那種“解題”式的闡釋。其目的在于讓用戶在使用數(shù)據(jù)時(shí)能夠快速把握相關(guān)文獻(xiàn)的價(jià)值、真?zhèn)巍⑾嚓P(guān)研究成果等信息。這樣才能使數(shù)據(jù)庫(kù)起到引導(dǎo)用戶盡快進(jìn)入相關(guān)研究領(lǐng)域的功能,使學(xué)者在前人已有研究成果的基礎(chǔ)上更進(jìn)一步。這也正是傳統(tǒng)目錄學(xué)所具有的功能。當(dāng)然,配合數(shù)據(jù)庫(kù)本身所具備的強(qiáng)大檢索功能,數(shù)據(jù)庫(kù)的應(yīng)用應(yīng)該遠(yuǎn)比一些目錄著作和目錄中所著錄的書籍具有更大優(yōu)越性。
以精良版本的文獻(xiàn)為基礎(chǔ)開(kāi)發(fā)的數(shù)據(jù)庫(kù)才是真正對(duì)學(xué)者有用的數(shù)據(jù)庫(kù),這是建設(shè)專題數(shù)據(jù)庫(kù)所需要注意的第三個(gè)方面。在中國(guó)歷史上,越是著名的著作,其刊刻的次數(shù)就越多,而每次刊刻,如非出自同一模板,由于校對(duì)者水平不一,便難免產(chǎn)生字句不一的現(xiàn)象。有些同一種類的文獻(xiàn),書名相同,但卷數(shù)相異,所收錄的文獻(xiàn)內(nèi)容差別甚大。更有些文獻(xiàn),沒(méi)有刻本,只有鈔本,鈔本中難以辨認(rèn)字跡者為數(shù)不少。凡斯種種,都是源于不同文獻(xiàn)版本所造成的差異。版本不同,所記錄的信息便可能相差甚遠(yuǎn),有些文獻(xiàn)是宋元時(shí)的版本最好,而有些文獻(xiàn)則是清人曾經(jīng)花費(fèi)巨大精力進(jìn)行校勘,清人校本優(yōu)于宋元刻本。因此,治學(xué)嚴(yán)謹(jǐn)?shù)膶W(xué)者往往比較不同版本的差異,而以最可靠版本的記載作為自己論證的依據(jù)。這就為我們開(kāi)發(fā)文史類數(shù)據(jù)庫(kù)帶來(lái)了挑戰(zhàn)。怎樣處理才能最大程度地符合高質(zhì)量數(shù)據(jù)庫(kù)的要求呢?“中國(guó)基本古籍庫(kù)”的做法是對(duì)部分文獻(xiàn)盡可能收錄多種版本。這不失為一種很好的創(chuàng)意和實(shí)踐。美中不足的是這些版本是以圖片形式儲(chǔ)存的,不具有檢索功能。
如果某種文獻(xiàn)僅有兩三種版本,則在建設(shè)數(shù)據(jù)庫(kù)時(shí)將其全部收錄也許不失為最優(yōu)處理方式。但是如果某種文獻(xiàn)有十余種版本甚至更多,則又當(dāng)如何?所以,較好的處理方法還是選擇精良版本進(jìn)行處理,而對(duì)相對(duì)劣質(zhì)的版本則忽略不計(jì),不予處置。那么如何才能選擇精良版本呢?自然還是向目錄學(xué)求援。我國(guó)傳統(tǒng)目錄學(xué)的基本功能之一就是記錄文獻(xiàn)的版刻源流,比較不同版本間的優(yōu)劣短長(zhǎng)。而一旦根據(jù)目錄學(xué)所指引的目標(biāo)得以確立,剩下的就是按照選定的版本進(jìn)行嚴(yán)格的校勘,力求令數(shù)據(jù)庫(kù)中的文獻(xiàn)與紙質(zhì)版本完全相同。只有這樣,學(xué)者們?cè)谑褂眠@一數(shù)據(jù)庫(kù)時(shí),才不會(huì)出現(xiàn)在數(shù)據(jù)庫(kù)中查詢信息,再到紙質(zhì)版上核實(shí)的現(xiàn)象。
傳統(tǒng)目錄學(xué)對(duì)專題數(shù)據(jù)庫(kù)建設(shè)的重要性已如上述。因此,只要我們?cè)陂_(kāi)發(fā)建設(shè)數(shù)據(jù)之初,多研習(xí)相關(guān)領(lǐng)域的目錄學(xué)著述,就能基本保證該數(shù)據(jù)庫(kù)是一個(gè)收錄全面、專業(yè)性強(qiáng)、符合學(xué)科特點(diǎn)的數(shù)據(jù)庫(kù)。這些論點(diǎn)是否成立,還請(qǐng)方家不吝教正。
注釋:
[1] 章學(xué)誠(chéng):《校讎通義》自序。
發(fā)布日期:2009-08-18