古籍?dāng)?shù)字化資源整合與導(dǎo)航庫(kù)建設(shè)

  【內(nèi)容摘要】古籍?dāng)?shù)字化資源存在著資源分散、建置單位多元、數(shù)據(jù)格式多樣的特點(diǎn)。古籍?dāng)?shù)字化資源整合宜采用基于導(dǎo)航系統(tǒng)的數(shù)字資源整合方式。古籍?dāng)?shù)字化資源導(dǎo)航庫(kù)的建設(shè)可從數(shù)據(jù)庫(kù)類型、建置單位和數(shù)據(jù)庫(kù)主題三種途徑進(jìn)行導(dǎo)航設(shè)計(jì)。

  【關(guān) 鍵 詞】古籍?dāng)?shù)字化;資源整合;導(dǎo)航庫(kù)

  【作者簡(jiǎn)介】毛建軍(1971-),男,河南潢川縣人。河南新鄉(xiāng)學(xué)院文學(xué)院副教授,博士。主要從事古籍電子文獻(xiàn)研究。發(fā)表學(xué)術(shù)論文50余篇,出版著作2部。

  1 引 言

  古籍?dāng)?shù)字化是隨著計(jì)算機(jī)技術(shù)的發(fā)展而應(yīng)運(yùn)而生的一種新的古籍保存和利用方式。近20年,國(guó)內(nèi)外已開(kāi)發(fā)建設(shè)了大量古籍?dāng)?shù)字化資源。由于古籍?dāng)?shù)字化資源存在資源類型豐富、開(kāi)發(fā)建置單位多元、格式多樣等特點(diǎn),近幾年來(lái)古籍?dāng)?shù)字化資源整合問(wèn)題已成為古籍電子文獻(xiàn)理論研究和實(shí)踐層面亟待解決的關(guān)鍵問(wèn)題。在2009年召開(kāi)的“古籍?dāng)?shù)字化國(guó)際學(xué)術(shù)研討會(huì)”上,與會(huì)專家強(qiáng)烈呼吁盡早成立國(guó)家級(jí)的電子古籍整理委員會(huì),從而徹底結(jié)束“群雄割據(jù)”的時(shí)代。[1]誠(chéng)然,成立電子古籍整理委員會(huì)對(duì)古籍?dāng)?shù)字化的標(biāo)準(zhǔn)制定、項(xiàng)目的規(guī)劃、審批與協(xié)調(diào)以及古籍?dāng)?shù)字化技術(shù)上和資源建設(shè)分工上的統(tǒng)一與協(xié)作將具有重要意義。但是,電子古籍整理委員會(huì)的成立畢竟需要時(shí)日,未來(lái)三、五年甚至十年是否能夠有這樣的機(jī)構(gòu)出現(xiàn),也未可知。此外,即便電子古籍整理委員會(huì)已經(jīng)成立,其主要的工作將是規(guī)劃與協(xié)調(diào)古籍?dāng)?shù)字化工作。而具體到資源的整合與利用恐怕也不是指日可待的事情。因此,筆者認(rèn)為,建立古籍?dāng)?shù)字化資源導(dǎo)航庫(kù)將不失為一條方便快捷、切實(shí)可行的資源整合與利用方式。

  2 古籍?dāng)?shù)字化資源建設(shè)的特點(diǎn)

  2.1資源類型豐富性

  已開(kāi)發(fā)的古籍?dāng)?shù)字化資源類型豐富,從數(shù)據(jù)載體上看,主要包括磁盤(pán)類文獻(xiàn)和硬盤(pán)類文獻(xiàn)。從數(shù)據(jù)庫(kù)類型上看,主要包括古籍電子索引、古籍書(shū)目數(shù)據(jù)庫(kù)和古籍全文數(shù)據(jù)庫(kù)。經(jīng)筆者統(tǒng)計(jì)[2],近20年來(lái),國(guó)內(nèi)外利用計(jì)算機(jī)技術(shù)開(kāi)發(fā)研制了近500種古籍?dāng)?shù)字化資源,其中包括81種古籍電子索引,近148種古籍書(shū)目數(shù)據(jù)庫(kù)和近270種古籍全文數(shù)據(jù)庫(kù)。這些古籍?dāng)?shù)字化資源包含內(nèi)容也十分豐富,經(jīng)、史、子、集均有涉及。

  2.2建置單位多元化

  古籍?dāng)?shù)字化資源的開(kāi)發(fā)建置單位具有參與部門(mén)多元化的特征。參與古籍?dāng)?shù)字化資源開(kāi)發(fā)建置的單位主要有古籍圖書(shū)收藏單位、科研院所以及數(shù)字化企業(yè)。公共圖書(shū)館是古籍收藏的主體,古籍資源十分豐富,其開(kāi)發(fā)的古籍?dāng)?shù)字化資源具有系統(tǒng)性、服務(wù)性的特點(diǎn)。科研院所開(kāi)發(fā)的古籍?dāng)?shù)字化資源主要服務(wù)于教學(xué)和科研,其開(kāi)發(fā)的古籍?dāng)?shù)字化資源具有智能性和探索性特色。古籍?dāng)?shù)字化企業(yè)主要有出版社和數(shù)字化公司,其中,規(guī)模較大的有書(shū)同文數(shù)字化技術(shù)有限公司、愛(ài)如生數(shù)字技術(shù)有限公司和國(guó)學(xué)時(shí)代文化傳播公司等,古籍?dāng)?shù)字化企業(yè)開(kāi)發(fā)的古籍?dāng)?shù)字化資源主要根據(jù)市場(chǎng)需求來(lái)考慮,多選擇使用面較為廣泛的大型叢書(shū)或經(jīng)典文獻(xiàn)作為選題。

  2.3數(shù)據(jù)格式多樣性

  古籍?dāng)?shù)字化資源的數(shù)據(jù)格式具有多樣性特征。古籍?dāng)?shù)據(jù)庫(kù)的存儲(chǔ)方式主要有兩種:一是圖像保存;二是文本保存。圖像保存的主要格式有:BMP格式、TIFF格式、JPEG格式、Adobe PSD格式等。文本保存的主要格式有:TXT格式、DOC格式、PDF格式、RTF格式、超文本格式以及基于unicode、倉(cāng)頡碼、Big5碼或其他字符集,以HTML、TML等為核心的全方位電子文獻(xiàn)全文檢索格式。許多數(shù)字化企業(yè)開(kāi)發(fā)的數(shù)字化古籍多數(shù)采用了自己開(kāi)發(fā)的專用格式,如北京華康信息技術(shù)有限公司的Dyna DocReader格式,北京天安億友公司開(kāi)發(fā)的EDB格式,超星公司開(kāi)發(fā)的PDG格式,國(guó)家圖書(shū)館的NLC格式等。此外,各數(shù)據(jù)庫(kù)的檢索平臺(tái)也不統(tǒng)一,從而形成數(shù)據(jù)格式差異,給數(shù)據(jù)兼容及資源整合帶來(lái)阻礙。

  3 古籍?dāng)?shù)字化資源整合模式選擇

  實(shí)現(xiàn)古籍文獻(xiàn)資源共建共享是現(xiàn)代圖書(shū)館發(fā)展的必然要求。古籍?dāng)?shù)字化資源整合的最終目標(biāo)就是為了實(shí)現(xiàn)資源共享,提高古籍文獻(xiàn)的使用效率,從而最大限度地滿足文史研究者對(duì)古籍文獻(xiàn)信息資源的需求。鑒于古籍?dāng)?shù)字化資源存在著資源分散、建置單位多元化、數(shù)據(jù)格式多樣化的特點(diǎn),古籍?dāng)?shù)字化資源整合宜采用基于導(dǎo)航系統(tǒng)的數(shù)字資源整合方式。

  3.1基于導(dǎo)航系統(tǒng)的數(shù)字資源整合

  古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)是指將多種古籍?dāng)?shù)字資源的檢索入口整合在一起,并提供獲取數(shù)字資源途徑的知識(shí)庫(kù)數(shù)據(jù)集合。古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)可以為用戶提供一個(gè)很好的查詢機(jī)制,具有建置簡(jiǎn)單、成本低廉、方便使用等特點(diǎn),是數(shù)字圖書(shū)館資源整合的有效方式。

  古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)功能主要是幫助用戶更加全面了解數(shù)字資源,并提供用戶瀏覽使用。數(shù)字資源導(dǎo)航系統(tǒng)不但從學(xué)科角度出發(fā)對(duì)數(shù)字資源進(jìn)行管理,同時(shí)還從數(shù)據(jù)庫(kù)或者文獻(xiàn)類型方面進(jìn)行分類、描述,提供鏈接和檢索等相關(guān)服務(wù)。古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)可以實(shí)現(xiàn)文獻(xiàn)分離重組、內(nèi)容主題等再次序化,從而組成多種導(dǎo)航方式。

  為了使古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)達(dá)到預(yù)期的功能,還要確定導(dǎo)航系統(tǒng)揭示的內(nèi)容。古籍?dāng)?shù)字資源內(nèi)容揭示的詳細(xì)程度決定了古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)的功能。古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)一般都有以下幾個(gè)基本功能:音序?yàn)g覽功能、分類瀏覽功能、關(guān)鍵詞檢索功能。這些功能將幫助用戶迅速找到數(shù)字資源。古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)還必須具有網(wǎng)絡(luò)超文本鏈接功能,并利用超文本鏈接提供檢索入口,對(duì)該古籍?dāng)?shù)字資源實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)。超文本鏈接可以將古籍文獻(xiàn)數(shù)字資源鏈接在一起,形成一個(gè)具有內(nèi)在聯(lián)系的有機(jī)整體。此外,古籍?dāng)?shù)字資源導(dǎo)航系統(tǒng)功能設(shè)置還應(yīng)該注意導(dǎo)航系統(tǒng)的易用性、保證鏈接的有效性、數(shù)字資源導(dǎo)航的規(guī)范性等問(wèn)題。[3]

  3.2古籍?dāng)?shù)字化資源導(dǎo)航庫(kù)的建設(shè)

  古籍?dāng)?shù)字化資源導(dǎo)航庫(kù)的建設(shè)可從以下三種途徑進(jìn)行設(shè)計(jì):

  3.2.1數(shù)據(jù)庫(kù)類型導(dǎo)航庫(kù)

  數(shù)據(jù)庫(kù)類型導(dǎo)航庫(kù)的第一層可命名為“古籍?dāng)?shù)據(jù)庫(kù)類型導(dǎo)航”。第二層包括三種數(shù)據(jù)庫(kù)類型,即古籍電子索引、古籍書(shū)目數(shù)據(jù)庫(kù)和古籍全文數(shù)據(jù)庫(kù)。第三層為具體某一個(gè)數(shù)據(jù)庫(kù)名稱,第三層的數(shù)據(jù)庫(kù)名稱可按照音序排列。第三層以下可包括資源簡(jiǎn)介和資源鏈接地址。數(shù)據(jù)庫(kù)類型導(dǎo)航庫(kù)的優(yōu)勢(shì)在于直觀地再現(xiàn)了古籍?dāng)?shù)字化資源的主要類型,便于文史研究者快速查詢到所需要的數(shù)據(jù)庫(kù)。下面是古籍?dāng)?shù)據(jù)庫(kù)類型導(dǎo)航設(shè)計(jì)示例表:

第一層 第二層 第三層 資源簡(jiǎn)介 鏈接地址
古籍?dāng)?shù)據(jù)庫(kù)類型導(dǎo)航 古籍電子索引 《全宋詩(shī)》分析系統(tǒng) 北京大學(xué)中文系李鐸博士研發(fā)。具有重出詩(shī)提取、格律詩(shī)標(biāo)注、字及字組的頻率、分布統(tǒng)計(jì)等功能。 http://chinese.pku.edu.cn/songPoem/
《全唐五代詞》索引 南京師范大學(xué)研發(fā)。作者索引、詞牌索引、首句索引、字頻表;索引按照《全唐五代詞》(中華書(shū)局版)編輯,共計(jì)2,849首。 http://222.16.80.114/viewstaticres/SysContent7
/d0/dd0/ddd138/807813085138/snap/27.6.htm
古籍題記索引 復(fù)旦大學(xué)圖書(shū)館研發(fā)。全文、篇目、書(shū)名、作者檢索等多項(xiàng)檢索功能。 http://www.library.fudan.edu.cn:8080/guji/gjtj.htm
…… …… ……
古籍書(shū)目數(shù)據(jù)庫(kù) 漢籍目錄數(shù)據(jù)庫(kù) 東京大學(xué)東洋文化研究所建置。共有書(shū)目數(shù)據(jù)112,755條。書(shū)名、責(zé)任者、主題檢索。 http://www3.ioc.u-tokyo.ac.jp/kandb.html
臺(tái)灣地區(qū)家譜聯(lián)合目錄資料庫(kù) 臺(tái)灣“國(guó)家圖書(shū)館”建置。共有書(shū)目數(shù)據(jù)14,986條;書(shū)名、編著者、收藏者、出版者、主題檢索。 http://rarebook.ncl.edu.tw/rbook.cgi/frameset5.htm
古舊文獻(xiàn)檢索 湖南圖書(shū)館建置。60余萬(wàn)古籍書(shū)目數(shù)據(jù),書(shū)名、著者、主題、索書(shū)號(hào)檢索。 http://220.168.54.219/gujiinfo_DB2.html
…… …… ……
古籍全文數(shù)據(jù)庫(kù) 珍罕古籍圖像數(shù)據(jù)庫(kù) 日本國(guó)立國(guó)會(huì)圖書(shū)館建置。至2009年已有957 種,51,000古籍圖像數(shù)據(jù)。 http://rarebook.ndl.go.jp/pre/servlet/pre_com_menu.jsp
甲骨文全文影像數(shù)據(jù)庫(kù) 臺(tái)灣成功大學(xué)圖書(shū)館建置。系統(tǒng)收錄 41,956 筆甲骨文書(shū)目及影像數(shù)據(jù),可利用分類、關(guān)鍵詞及拓片影像等進(jìn)行檢索。 http://muse.lib.ncku.edu.tw:8080/SSO/ResourceStation/pages/index.jsp
明清小說(shuō)全文庫(kù) 大連圖書(shū)館建置。共收藏明清時(shí)小說(shuō)150種,全文影像閱讀。 http://www.dl-library.net.cn/book/list.php?id=4
…… …… ……

  3.2.2建置單位導(dǎo)航庫(kù)

  建置單位導(dǎo)航庫(kù)的第一層可命名為“古籍建置單位導(dǎo)航”。第二層可按照國(guó)外地區(qū)、臺(tái)灣地區(qū)、大陸地區(qū)進(jìn)行導(dǎo)航,其中國(guó)外地區(qū)可按照日本、韓國(guó)、歐美進(jìn)行導(dǎo)航,臺(tái)灣地區(qū)可按照?qǐng)D書(shū)館、研究機(jī)構(gòu)、高等院校、數(shù)字化企業(yè)進(jìn)行導(dǎo)航,中國(guó)大陸可按照行政區(qū)域進(jìn)行導(dǎo)航。第三層為具體某一個(gè)數(shù)據(jù)庫(kù)名稱,第三層的數(shù)據(jù)庫(kù)名稱可按照音序排列。第三層以下可包括數(shù)據(jù)庫(kù)類型、資源簡(jiǎn)介和資源鏈接地址。建置單位導(dǎo)航庫(kù)的優(yōu)勢(shì)在于全面客觀地展示了各個(gè)區(qū)域的古籍?dāng)?shù)字化資源的建設(shè)成就,便于管理部門(mén)進(jìn)行古籍?dāng)?shù)據(jù)庫(kù)開(kāi)發(fā)的規(guī)劃和協(xié)調(diào),當(dāng)然也可為文史研究者提供數(shù)據(jù)檢索。下面是古籍建置單位導(dǎo)航設(shè)計(jì)示例表:

第一層 第二層 第三層 數(shù)據(jù)庫(kù)類型 資源簡(jiǎn)介 鏈接地址
古籍建置單位導(dǎo)航 國(guó)外地區(qū) 漢籍目錄數(shù)據(jù)庫(kù) 書(shū)目數(shù)據(jù)庫(kù) http://www3.ioc.u-tokyo.ac.jp/kandb.html
珍罕古籍圖像數(shù)據(jù)庫(kù) 全文數(shù)據(jù)庫(kù) http://rarebook.ndl.go.jp/pre/servlet/pre_com_menu.jsp
…… …… …… ……
臺(tái)灣地區(qū) 臺(tái)灣地區(qū)家譜聯(lián)合目錄資料庫(kù) 書(shū)目數(shù)據(jù)庫(kù) http://rarebook.ncl.edu.tw/rbook.cgi/frameset5.htm
甲骨文全文影像數(shù)據(jù)庫(kù) 全文數(shù)據(jù)庫(kù) http://muse.lib.ncku.edu.tw:8080/SSO/ResourceStation/pages/index.jsp
…… …… …… ……
大陸地區(qū) 古舊文獻(xiàn)檢索 書(shū)目數(shù)據(jù)庫(kù) http://220.168.54.219/gujiinfo_DB2.html
明清小說(shuō)全文庫(kù) 全文數(shù)據(jù)庫(kù) http://www.dl-library.net.cn/book/list.php?id=4
…… …… …… ……

  3.2.3數(shù)據(jù)庫(kù)主題導(dǎo)航庫(kù)

  主題導(dǎo)航庫(kù)是按照古籍?dāng)?shù)據(jù)庫(kù)的數(shù)據(jù)內(nèi)容進(jìn)行導(dǎo)航的。主題導(dǎo)航庫(kù)的第一層可命名為“古籍主題導(dǎo)航庫(kù)”。第二層可按照甲骨文獻(xiàn)、金石文獻(xiàn)、簡(jiǎn)帛文獻(xiàn)、敦煌文獻(xiàn)、明清檔案、科技文獻(xiàn)、綜合數(shù)據(jù)庫(kù)等進(jìn)行導(dǎo)航。第三層為具體某一個(gè)數(shù)據(jù)庫(kù)名稱,第三層的數(shù)據(jù)庫(kù)名稱可按照音序排列。第三層以下可包括數(shù)據(jù)庫(kù)類型、資源簡(jiǎn)介和資源鏈接地址。主題導(dǎo)航庫(kù)的優(yōu)勢(shì)在于分門(mén)別類地展示了各個(gè)研究領(lǐng)域的古籍?dāng)?shù)字化資源,大為便利于文史研究者進(jìn)行數(shù)據(jù)檢索。下面是古籍主題導(dǎo)航設(shè)計(jì)示例表:

第一層 第二層 第三層 數(shù)據(jù)庫(kù)類型 資源簡(jiǎn)介 鏈接地址
古籍主題導(dǎo)航 甲骨文獻(xiàn) 甲骨文拓片數(shù)據(jù)庫(kù) 全文數(shù)據(jù)庫(kù)
甲骨文全文影像數(shù)據(jù)庫(kù) 全文數(shù)據(jù)庫(kù)
…… …… …… ……
金石文獻(xiàn) 石刻拓本數(shù)據(jù)庫(kù) 全文數(shù)據(jù)庫(kù)
殷周金文數(shù)據(jù)庫(kù) 全文數(shù)據(jù)庫(kù)
…… …… …… ……
簡(jiǎn)帛文獻(xiàn) …… …… …… ……
敦煌文獻(xiàn) …… …… …… ……
明清檔案 …… …… …… ……
科技文獻(xiàn) …… …… …… ……
…… …… …… …… ……
綜合數(shù)據(jù)庫(kù) …… …… …… ……

  當(dāng)然,以上三種導(dǎo)航模式僅僅是為參考性質(zhì)。古籍?dāng)?shù)字化資源導(dǎo)航模式的選擇可以是多樣性的,各圖書(shū)館和研究機(jī)構(gòu)可根據(jù)本單位實(shí)際選擇導(dǎo)航模式。

  4 結(jié)語(yǔ)

  古籍?dāng)?shù)字化資源導(dǎo)航庫(kù)的建設(shè)是一種既切合實(shí)際又經(jīng)濟(jì)的古籍?dāng)?shù)字化資源整合方式。不過(guò),其前提是,必須對(duì)國(guó)內(nèi)外已經(jīng)開(kāi)發(fā)建設(shè)的古籍?dāng)?shù)字化資源進(jìn)行準(zhǔn)確調(diào)查。多年來(lái),國(guó)內(nèi)外學(xué)者一直呼吁有關(guān)部門(mén)整合相關(guān)人力對(duì)古籍?dāng)?shù)字化資源進(jìn)行全面調(diào)查,統(tǒng)計(jì)出一個(gè)較為完整的古籍?dāng)?shù)字化資源的數(shù)據(jù)資料,但這一理想至今也未能實(shí)現(xiàn)。筆者于2009年出版有《古籍?dāng)?shù)字化理論與實(shí)踐》一書(shū),書(shū)中的附錄部分統(tǒng)計(jì)并羅列出近500種古籍?dāng)?shù)字化資源。不過(guò)這個(gè)數(shù)字的截止統(tǒng)計(jì)時(shí)間為2007年12月。最近三年,國(guó)內(nèi)外又開(kāi)發(fā)出近300種古籍?dāng)?shù)據(jù)庫(kù)。當(dāng)然,憑一人之力所做的統(tǒng)計(jì)肯定是掛一漏萬(wàn),很多古籍?dāng)?shù)據(jù)庫(kù)由于種種原因必然為筆者所不能統(tǒng)計(jì),其中甘苦與哀嘆自是無(wú)法言表。希望這篇小文能夠起到一定的拋磚引玉功效。

參考文獻(xiàn):

[1]李桃.專家呼吁成立國(guó)家級(jí)電子古籍整理委員會(huì)[N].中國(guó)社會(huì)科學(xué)報(bào), 2009-09-10:02

[2]毛建軍.古籍?dāng)?shù)字化理論與實(shí)踐[M].北京:航空工業(yè)出版社,2009:99-149

[3]黃曉斌,夏明春.數(shù)字資源整合方式的比較與選擇[J].情報(bào)科學(xué),2005(5):690-695

Construction of Navigating Database and Resources Integration on Digitization of Ancient Books

Mao Jian-jun
(Literature institute Xinxiang University, Henan Xinxiang, 453000)

  Abstract: It is characteristics to digitization of ancient books that resources is scattered, build units is multiple, and the data format is diverse. Navigating database is better mode resources integration on digitization of ancient books. There are three mode resources integration, i.e. database type mode, build units mode and theme mode.

  Key words: digitization of ancient books; resources integration; navigating database

(作者單位:河南新鄉(xiāng)學(xué)院)

  

Comments are closed.

主站蜘蛛池模板: 伊人久久五月丁香综合中文亚洲 | 亚洲国产精品综合久久久 | 色婷婷六月亚洲综合香蕉| 亚洲国产综合自在线另类| 狠狠色狠狠色很很综合很久久| 狠狠色丁香婷婷综合久久片| 久久久久噜噜噜亚洲熟女综合| 伊人久久大香线蕉综合电影网| 97久久久精品综合88久久 | 亚洲国产免费综合| 久久综合给久久狠狠97色| 国产亚洲综合一区二区三区| 久久亚洲伊人中字综合精品| 国产亚洲精品第一综合| 色综合久久88色综合天天| 亚洲伊人色欲综合网| 国产成人亚洲综合无码| 亚洲狠狠婷婷综合久久| 久久亚洲精品成人综合| 97久久婷婷五月综合色d啪蜜芽| 六月婷婷缴清综合在线| 色婷婷综合久久久中文字幕| 狠狠色综合久色aⅴ网站| 精品综合一区二区三区| 色婷婷六月亚洲综合香蕉| 一个色综合国产色综合| 亚洲妓女综合网99| 伊人yinren6综合网色狠狠| 亚洲综合激情六月婷婷在线观看| 国产成人综合日韩精品无码不卡| 一本色道久久88综合日韩精品 | 色五月丁香五月综合五月4438| 色噜噜综合亚洲av中文无码| 一本久到久久亚洲综合| 丁香六月纪婷婷激情综合| 色综合婷婷在线观看66| 色偷偷91综合久久噜噜噜男男| 色噜噜狠狠狠色综合久| 国产精品国产色综合色| 伊人久久大香线蕉综合影| 久久精品综合电影|