淺議古籍數(shù)字化建設(shè)中的學(xué)科分類與古籍專題庫建設(shè)
【內(nèi)容摘要】本文梳理、分析了中國古籍數(shù)字化研究中涉及到的分類概念,區(qū)別了古籍文獻分類與數(shù)字化過程中學(xué)科分類的概念,闡述了二者各自的內(nèi)涵和意義,從理論探索和實踐需求的角度,提出了古籍專題庫建設(shè)的原則和要求。
【關(guān) 鍵 詞】古籍數(shù)字化;分類;專題庫建設(shè)
【作者簡介】李桂榮,女,1966年生,青海省委黨校圖書館,副研究館員。
一、分類、學(xué)科分類、文獻分類的概念及聯(lián)系
分類是以事務(wù)的本質(zhì)屬性或其它顯著特征作為依據(jù),把各種事務(wù)集合成類的過程,是人們認識事物、區(qū)分事物、組織事物的一種邏輯方法。不同目的的側(cè)重和不同對象的關(guān)注,產(chǎn)生不同的分類邏輯方法。
所謂學(xué)科,是關(guān)于客觀世界中特定事物對象的本質(zhì)特征和規(guī)律的知識體系。[1]學(xué)科是科學(xué)的個體,是科學(xué)區(qū)分不同領(lǐng)域知識系統(tǒng)的框架工具。學(xué)科分類是對對象進行學(xué)科劃分,確定其在整個科學(xué)體系中的位置以便于識別、區(qū)分的分類體系。學(xué)科分類法是按照對象的學(xué)科屬性結(jié)合對對象的使用需求(如研究需要)對對象進行分類的方法。
文獻是記錄知識的載體,文獻分類是指根據(jù)文獻內(nèi)容和形式的異向,按照一定的體系有系統(tǒng)地組織和區(qū)分文獻。如我國的“古籍”、“民國時期圖書”和“現(xiàn)代普通圖書”、“網(wǎng)絡(luò)文獻”、“國外文獻體系”等。文獻分類法側(cè)重以事物對象為中心加以編制,如我國古代的皇家藏書提要匯編《別錄》及在此基礎(chǔ)上編定的《七略》,后來的《四庫》系列、英國布朗的《主題分類法》的文獻分類等等。
由于文獻分類是以文獻主題內(nèi)容等屬性關(guān)系進行的,符合知識之間關(guān)系的系統(tǒng)性。因此文獻分類的發(fā)展與學(xué)科分類是密切相聯(lián)系的。由于學(xué)科分類體系是按照知識關(guān)系的內(nèi)在規(guī)律性進行的,所以以學(xué)科分類為基礎(chǔ),可以更好地反映知識之間的聯(lián)系,更有利于文獻的系統(tǒng)揭示和使用。正是如此,現(xiàn)代文獻分類法基本上都是依據(jù)當時的學(xué)科分類水平或體系進行,例如《杜威十進分類法》、《美國國會圖書館分類法》、《日本十進分類法》、印度S.R.阮岡納贊的《冒號分類法》、我國劉國鈞編的《中國圖書分類法》、皮高品編的《中國十進分類法及索引》等等。由于我國歷史上的使用需求和局限,在我國古代,古籍分類的目的主要是“組織藏書,體現(xiàn)分類者‘辨章學(xué)術(shù),考鏡源流’的學(xué)術(shù)水平”[2]。與學(xué)科分類不同,文獻分類關(guān)注的僅僅是國內(nèi)已經(jīng)生成和留存下來的文獻體系,沒有關(guān)心現(xiàn)存文獻以外領(lǐng)域和對象。因此沒有完全發(fā)展為科學(xué)意義上的學(xué)科分類,所以它與學(xué)科分類是兩個關(guān)注對象和內(nèi)涵都有差異的概念,在結(jié)構(gòu)上很相似,都是采用體系分類法,學(xué)科分類保持整個科學(xué)知識體系的系統(tǒng)性,我國古籍文獻分類法保持個體文獻體系(僅是我國“古代”、“現(xiàn)存文獻”這個區(qū)域、時段和對象的個體體系)的完整性。
我國古籍總類自晉代以來發(fā)展了一千八百多年,文獻分類法隨著文獻的內(nèi)容、形式的發(fā)展而發(fā)展,“四部”分類法最終占上了主流地位;而學(xué)科分類法是為識別學(xué)科在科學(xué)體系中的位置類分而存在的理論邏輯,是隨著人類整體科學(xué)的發(fā)展和學(xué)科的日益豐富而出現(xiàn)和完善的。所以說,文獻分類法是一種偏重于編目、服務(wù)于編目的語言,而學(xué)科分類法是一種事務(wù)的類分邏輯,價值更側(cè)重于于檢索區(qū)分。在學(xué)科分類已成為科學(xué)研究發(fā)展的一個重要需求的今天,學(xué)科分類法為我國古籍在計算機條件下統(tǒng)一分類編制以更好地開發(fā)利用即古籍數(shù)字化提供了條件。
二、學(xué)科分類與古籍文獻分類的區(qū)別及古籍數(shù)字化的學(xué)科分類要求
綜上所述,學(xué)科分類法側(cè)重于對學(xué)科對象的條理區(qū)分,文獻分類法側(cè)重于對文獻對象的有邏輯地組織。我國古籍文獻分類法雖然也是以學(xué)科分類為基礎(chǔ)進行的,但除了上文中提到的產(chǎn)生、發(fā)展中的特點差異,要想進一步說明它與現(xiàn)代學(xué)科分類的區(qū)別,至少還要具體考察以下兩個方面:
其一,對象不同。現(xiàn)代學(xué)科分類的對象為某一主題或一組主題領(lǐng)域,是按照不同的研究方式以及其現(xiàn)象確定的,比較單純。古籍文獻分類的對象是古籍文獻,既有其內(nèi)容方面,又有其體裁形式、版本等方面的要求,涉及的因素比較復(fù)雜,與學(xué)科分類存在著諸多差異。在內(nèi)容范圍上,古籍文獻分類需要涉及的范圍更廣、更深、更復(fù)雜。一方面,一種古籍文獻往往會同時涉及兩門或多門學(xué)科,如儒家十三經(jīng),《易》、《論語》、《孟子》、《孝經(jīng)》歸屬哲學(xué)學(xué)科,《尚書》、《左傳》、《公羊傳》、《谷梁轉(zhuǎn)》、《周禮》、《儀禮》、《禮記》歸屬歷史類,《爾雅》歸屬語言文字類,《詩》歸屬文學(xué)類。另一方面,古籍文獻中除了學(xué)科層次的內(nèi)容以外,比學(xué)科分類的對象更為多樣。如除了經(jīng)、史、子、集四部是按學(xué)科內(nèi)容設(shè)立的,還有綜合性的和專門性的叢書以及輯錄匯集資料以利尋檢、引用的工具書—類書。文獻分類具有學(xué)科內(nèi)容、著作方式和裝幀形式、生活用途等不同于學(xué)科分類要求的特點,以及以國家、地區(qū)、時代、人物等具體內(nèi)容為獨立體例的立類標準,因此比學(xué)科分類復(fù)雜和專指。
其二,功能不同。學(xué)科分類的任務(wù)是根據(jù)其研究對象,明確學(xué)科的劃分及其相互關(guān)系,確定每門學(xué)科在學(xué)科分類體系中的位置,目的是用以制定科學(xué)研究計劃,建立科學(xué)研究機構(gòu)和確定科學(xué)管理體制,正確設(shè)置專業(yè)以及進行不同門類之間的協(xié)調(diào)等服務(wù)。也可以作為各種具體應(yīng)用,如文獻分類、行業(yè)分類等的基礎(chǔ)。在數(shù)字化網(wǎng)絡(luò)環(huán)境下,學(xué)科分類還可以用于文獻資源數(shù)字化分類的指導(dǎo)思想,揭示網(wǎng)絡(luò)信息環(huán)境下文獻資源的學(xué)科關(guān)系。其形勢可以比較自由,可以采用文獻分類采用的線性的列表形式,也可以根據(jù)計算機對學(xué)科知識關(guān)系表達的需要,以其他形式表示,例如,方框圖、樹形圖等,以二維、三維的圖形形式加以表示,并可以根據(jù)計算機對學(xué)科關(guān)系的理解,自由調(diào)整,揭示學(xué)科知識元之間、學(xué)科知識單元之間及其二者之間的關(guān)系,便于數(shù)字文獻使用者對學(xué)科知識的檢索、查詢以及計算機的智能處理。而古籍文獻分類法的任務(wù)主要是組織和揭示古籍文獻,功能應(yīng)該是提供實體文獻的完整性(體例、體裁、類目、裝幀等)、真實性(善本、版本等)及其整體之間的聯(lián)系性、系統(tǒng)性、連續(xù)性。由于古籍文獻處理具有歷史累積性的特點,古籍文獻分類體系作為古籍文獻組織的工具,一般要求相對穩(wěn)定,以已經(jīng)發(fā)展成熟且具有代表性的“四庫”法為標志,合理組織古籍文獻體系,只能是將它完善、更趨于使用的便利,而不是將它廢棄、不用。
古籍數(shù)字化,是將古代典籍中以文字符號記錄的信息輸入計算機,從而實現(xiàn)了整理、存儲、傳輸、檢索等手段的計算機化。[3]是按照文獻信息所載知識的學(xué)科屬性,根據(jù)文獻信息內(nèi)容之間的相關(guān)性,組織成科學(xué)的便于計算機識別和處理的體系,由計算機對古籍文獻進行管理和再現(xiàn),滿足讀者、用戶對古籍的數(shù)字閱讀需求。因此,古籍的學(xué)科分類首先是數(shù)字閱讀時代由計算機提出的。古籍數(shù)字化過程中計算機性能和系統(tǒng)把古籍與學(xué)科分類法緊密拉在一起。
三、面向數(shù)字化學(xué)科分類需求的古籍專題庫建設(shè)
適用于學(xué)科基礎(chǔ)建構(gòu),推動學(xué)術(shù)發(fā)展的古籍數(shù)據(jù)庫,應(yīng)該是結(jié)合古籍文獻體系特點和計算機雙方長處的結(jié)晶,面對古籍體系的價值和機讀后檢索要求,一方面我們不能毀棄傳統(tǒng)目錄學(xué)中關(guān)于圖書的四部分類法對所收文獻所進行的組織分類,同時在技術(shù)上,還要保證計算機、數(shù)據(jù)庫有強大的檢索功能,知識重組功能。
首先,文獻分類不能等同于學(xué)科分類用做計算機分檢方法。從文獻本身的完整性價值來看,文獻分類的對象必須是文獻,而不是單純的學(xué)科內(nèi)容本身,所以必須以保留文獻的完整性特點加以處理,完整地提供給讀者用戶。特別是在建設(shè)面向?qū)W者,為科研服務(wù)的文史類數(shù)據(jù)時,應(yīng)審慎、嚴格、規(guī)范地按照傳統(tǒng)目錄學(xué)的相關(guān)知識對所收文獻進行排列、設(shè)置。絕對不能憑借數(shù)據(jù)庫強大的檢索功能而疏于對數(shù)據(jù)按照古籍體例特性進行考慮。
其次,文獻的計算機處理還必須使用學(xué)科分類語言,根據(jù)科學(xué)研究和管理的需要對古籍體系在保持它的相對完整性前提下加以學(xué)科分類。符合學(xué)術(shù)規(guī)范、對學(xué)科建設(shè)有更大裨益的古籍數(shù)據(jù)庫應(yīng)是將文獻分類法組織起來的古籍文獻和計算機方面的功能結(jié)合起來的讓讀者和用戶了解與研究中國傳統(tǒng)文化與學(xué)術(shù)的開放式生態(tài)系統(tǒng)。
對于計算機而言,無論是列舉式分類法還是分面組配式分類法,最終都還需要歸結(jié)為線性次序;同時,還需要以一定的標記符號對古籍文獻類目之間的關(guān)系進行表達,以便可以使其作為文獻標引和檢索的工具有效地加以使用。理想的數(shù)字化過程,是給古籍類目配上學(xué)科分類號,再把類號交給讀者,讓讀計算機使用者能夠自主、快捷地使用分類檢索途徑查檢古籍分類及其所需內(nèi)容。新的古籍分類法還應(yīng)同時附上“古籍分類法主題索引”[4],以方便分類法和分類目錄的使用者自如操作、使用。
再次,建立古籍專題數(shù)據(jù)庫要注意遵循以下原則進行選題和策劃:
1、突出專題性和保持體系性。古籍專題數(shù)據(jù)庫建設(shè)的目的根本上就是要向用戶提供一種在內(nèi)容上具有某一專題特色的資料查考或知識信息服務(wù)。為了吸引用戶,也為了避免資源建設(shè)的重復(fù)浪費,就一定要考慮有一個很好的選題。專題數(shù)據(jù)庫的選題策劃既要考慮用戶的個別需求,又要考慮古籍完整體系的價值,同時也要考慮計算機處理的可行性,進行可行性分析。專題數(shù)據(jù)庫之所以能夠脫穎而出,在許多綜合性的大型數(shù)據(jù)庫已經(jīng)建成使用的情況下有其生存的空間,正是因為其突出專題原則,可以兼顧個性化需求和達及個體文獻開發(fā)利用的深度。有利于零碎的館藏資源深加工和被利用。因為盡管一些大型數(shù)據(jù)涉及的專業(yè)、學(xué)科全面而廣泛,但就某一學(xué)科、某一專業(yè)或某一領(lǐng)域而言,它不可能像專題數(shù)據(jù)庫那樣能夠集中力量,最大限度地去窮盡相關(guān)的不同類型的數(shù)據(jù)資料。還有好多圖書館,所藏古籍資料是零散的,體系不完整的,利用專題庫方式把零散典籍及其相關(guān)研究成果組織起來,加以揭示就是可以實現(xiàn)有限資源的深加工和充分利用。
2、建設(shè)實用性和兼顧共享性。數(shù)據(jù)庫只是工具層面的東西,實用性才是目的。專題數(shù)據(jù)庫建設(shè)的目的是為了最大限度地滿足用戶的文獻信息需求,發(fā)揮圖書館的功能和體現(xiàn)圖書館存在的價值。一個專題數(shù)據(jù)庫的價值的存在的意義主要在于它是否能用,有用,實用,好用數(shù)據(jù)庫群建設(shè)的主要目標之一是在使用過程中產(chǎn)生知識增值,如在不同的檢索路徑中衍生知識地圖,給檢索中意外的知識收獲。計算機智能技術(shù)可為特定讀者量身定做所需,例如引文分析,數(shù)據(jù)評估,等。來自多處來源地的信息聚集在同一平臺為讀者進一步準確選擇,縮小范圍,提供步步逼近目標的基礎(chǔ)可檢索的結(jié)構(gòu),提供調(diào)整思考的機會,創(chuàng)建快速訪問的條件。同時,利用數(shù)據(jù)庫的基本數(shù)據(jù)模型的足夠靈活性和古籍資源體系的多維性,實現(xiàn)資源共建共享。由于各古籍收藏單位的古籍排架順序和手工目錄相對穩(wěn)定,而電子目錄編排的極端靈活,只要確定計算機系統(tǒng)與古籍資源體系的對應(yīng)關(guān)系即可達到分類統(tǒng)一的目標,可使各單位已經(jīng)長期使用的不同的古籍分類法保持不變。不僅不會改變古籍原有分類目錄和藏書布局,也方便本館讀者的習(xí)慣使用。協(xié)調(diào)組織機構(gòu)實現(xiàn)“統(tǒng)一平臺、統(tǒng)一界面、統(tǒng)一標準”,從而充分體現(xiàn)出專題數(shù)據(jù)庫的共享原則,使共享為實用性的前提和必要。
3、注意古籍文獻文本信息分類和數(shù)字化后成為網(wǎng)絡(luò)信息的學(xué)科分類區(qū)別,同時重視網(wǎng)絡(luò)用戶獲取信息的方便性和易用性,采取分類法與關(guān)鍵詞同時并用的古籍知識組織和檢索技術(shù)。由于網(wǎng)絡(luò)用戶的范圍十分廣泛,他們的知識水平、知識結(jié)構(gòu)、工作崗位、專業(yè)、上網(wǎng)目的和利用信息的種類存在明顯差異,這一切導(dǎo)致各種用戶查詢和利用古籍信息的角度不同、方法不同、類型不同、深淺程度不同。在這種情況下,對古籍搜索引擎類目的命名除了要保證其科學(xué)性、準確性、簡潔性以外,還要注意盡量采用自然語言,以增加類名的透明度,滿足廣大終端用戶的需求。古籍知識之間的聯(lián)系是多方面的,一個主題或事物,可以同時從屬于兩個或多個知識門類,也可以在從屬關(guān)系以外有其他的聯(lián)系。古籍分類搜索引擎應(yīng)該提供不同角度的檢索入口,以適應(yīng)各種類型終端用戶的需要。同時由于網(wǎng)絡(luò)信息資源的虛擬性和可多角度揭示性,可以使古籍文獻體系在網(wǎng)絡(luò)環(huán)境下擺脫文獻分類法單線性的限制,在網(wǎng)絡(luò)傳播中進行靈活的全方位揭示。超文本技術(shù)和鏈接技術(shù)能夠為構(gòu)建多維化的古籍知識體系提供技術(shù)支持。
總而言之,隨著現(xiàn)代信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,在古籍數(shù)字化建設(shè)過程中建構(gòu)完善的現(xiàn)代網(wǎng)絡(luò)信息分類法已經(jīng)成為圖書館學(xué)、情報學(xué)、計算機技術(shù)與網(wǎng)絡(luò)技術(shù)專家學(xué)者共同關(guān)注的亟待解決的一個重大課題。
注釋與參考文獻:
[1] 圖謀博客,面向?qū)W科分類的高校圖書館文獻資源建設(shè),2005年12月3日。
[2][4] 鮑國強,數(shù)字網(wǎng)絡(luò)中古籍分類的作用和趨勢,《文津流觴》第八期,2005年4.15.
[3] 劉琳,吳洪澤.古籍整理學(xué),成都:四川大學(xué)出版社,2003年版。