關(guān)于古籍?dāng)?shù)字化的一些思考

彭國(guó)忠

  隨著電子技術(shù)的發(fā)展,古籍?dāng)?shù)字化已經(jīng)成為必然之勢(shì),在當(dāng)今時(shí)代,任何反對(duì)、阻止這種潮流的想法與做法,都是不足取的。確實(shí),古籍?dāng)?shù)字化會(huì)使古籍的久遠(yuǎn)保存和廣泛傳播以發(fā)揮其自身價(jià)值,進(jìn)一步落實(shí)、完善資源共享,使學(xué)者讀到以前不易讀到的書籍;會(huì)為研究者們提供便捷快速的檢索服務(wù),提供遠(yuǎn)比手工檢索更為全面、可靠的需要資料,使資料的轉(zhuǎn)化、引用、運(yùn)用異常迅速,甚至還會(huì)提供一些新的靈感和構(gòu)思。總之,古籍?dāng)?shù)字化帶給古代文學(xué)研究界的實(shí)實(shí)在在的好處,是誰(shuí)也抹煞不了的。

  但是,就目前的現(xiàn)狀言,古籍?dāng)?shù)字化也存在一些問(wèn)題,值得人們思考并努力解決。

一、信息的全部再現(xiàn)

  首先是信息量的全部再現(xiàn)問(wèn)題。古籍?dāng)?shù)字化,第一個(gè)要回答的問(wèn)題就是是否做到了信息量的全部再現(xiàn)。信息量的全部,不是說(shuō)現(xiàn)存全部古籍的數(shù)字化,而是就一部書所包含的全部信息而言。

  一部書的全部信息,按照從外到內(nèi)、從大到小的先后次序說(shuō),由這樣幾部分構(gòu)成:

 。1)版本信息,包括版刻(稿本、抄本的撰寫、謄錄、抄寫)時(shí)間,出版者(個(gè)人或機(jī)構(gòu)),出版地,出版類型(重刻、翻刻、補(bǔ)版、增訂等等),版次(原刻原印、重。约俺霭娴囊恍└戒涰(xiàng),如出資人、刻字者、校字者、版權(quán)聲明、廣告等。

 。2)序跋。序跋往往會(huì)交代一部書的撰寫、出版情況,書作者的生平、家庭、經(jīng)歷、思想情況,書在作者當(dāng)時(shí)或出版時(shí)的接受流傳情況,因而存儲(chǔ)了大量的有價(jià)值的信息。有的書籍有多篇序跋,一序再序,一跋再跋,這對(duì)古籍?dāng)?shù)字化的過(guò)程言,無(wú)疑增加工作量和繁難度,但對(duì)使用者、研究者而言,卻是非常難得的信息。

  (3)題辭。有的書,在成書或付印前、后,會(huì)約請(qǐng)他人題辭,這些題辭,或文或詩(shī)詞,形式不拘,而不論是直接評(píng)論作品、交代創(chuàng)作背景,還是述交情、談感受,其價(jià)值都不容忽視。有些題辭還未被題辭者作品集收錄,或題辭者根本就無(wú)作品集,可以補(bǔ)題辭者作品之遺佚。

 。4)凡例。凡例是一部書編寫、撰定的標(biāo)準(zhǔn)規(guī)定,是綱領(lǐng)是宗旨,它設(shè)定了全書編、撰的原則、體例、取舍存汰。那些文學(xué)選本的凡例,更是編、撰者思想、情趣、傾向性的濃縮,反映了他們對(duì)某一文學(xué)現(xiàn)象的總體認(rèn)識(shí)、基本評(píng)價(jià),甚至直接表述了編作者的文學(xué)觀。

  (5)目錄和目錄序論。不少古籍都有目錄,它是全書內(nèi)容的排列次序。但古籍的目錄,往往與正文不相一致,存在著種種差異,甚至有目無(wú)文、有文無(wú)目。從現(xiàn)代出版標(biāo)準(zhǔn)看,這是不規(guī)范的,應(yīng)該加以批判、杜絕的,但傳統(tǒng)的魅力恰在于此,所謂因病成妍,顰心增媚:目錄與正文的差異,可以提供有價(jià)值的異文,形成互注性的文本結(jié)構(gòu)。有的書籍,在目錄后還有目錄序論、目錄跋,其性質(zhì)與凡例、與論非常接近,有的目錄序論就是重要的理論文獻(xiàn),如清代常州詞派理論家周濟(jì)關(guān)于宋詞家法與習(xí)學(xué)路徑的觀點(diǎn),就以《宋四家目錄序論》的形態(tài)出現(xiàn)的,本來(lái)就是選本《宋四家詞選》的目錄后之序論。

 。6)正文。包括卷次、題目及題注、正文內(nèi)容及其異文。這是古籍的核心部分,也是一般數(shù)字化古籍所特別重視、關(guān)心的部分,是他們所理解、從事的古籍?dāng)?shù)字化的全部?jī)?nèi)涵。這幾項(xiàng)中,往往被人忽略的題注、正文異文,有時(shí)價(jià)值反而比題目比正文更大。中唐時(shí)期劉禹錫《和樂(lè)天春詞》之題,有兩首作品,一首有題注,一首沒(méi)有題注,沒(méi)有題注的是七言絕句,有題注的是長(zhǎng)短句,題注是:“依望江南曲拍為句!边@個(gè)簡(jiǎn)單的題注,已經(jīng)成為重要的詞學(xué)文獻(xiàn),它標(biāo)志著文人此體意識(shí)的獨(dú)立。遺憾的是,有的數(shù)字化古籍,對(duì)題注、異文關(guān)注很少,認(rèn)為它們可有可無(wú)。

  以上6個(gè)方面,構(gòu)成一部古籍的全部信息,當(dāng)然,有的書籍6項(xiàng)指標(biāo)兼具,有的書籍具備幾項(xiàng),甚至只有一項(xiàng)。但是,不管它有幾項(xiàng),在數(shù)字化的過(guò)程中,都應(yīng)該如實(shí)反映出來(lái),不能根據(jù)自己的理解,只數(shù)字化正文,將其它信息一概摒棄、屏蔽。一部書的信息,是多方面的,有多個(gè)價(jià)值指向,它會(huì)根據(jù)使用者、研究者的不同,體現(xiàn)出不同的價(jià)值。正文內(nèi)容是被普遍關(guān)注的部分,但有的人關(guān)心其中的版本信息,有的人看重序跋,有的人需要題注,有的人重視歷史事實(shí)和時(shí)間。所謂人棄我取、人輕我重,各取所需而已。如果認(rèn)為只要是正文數(shù)字化了,就是全部數(shù)字化,必然導(dǎo)致大量有益信息的流失,這樣的數(shù)字化,不如不數(shù)字化。正如清修《四庫(kù)全書》,雖自有其價(jià)值,但修書過(guò)程中造成大量古籍的消亡、被改造,實(shí)際也是書籍之巨厄。

二、信息的真實(shí)再現(xiàn)

  如果說(shuō)信息的能否全部再現(xiàn),屬于人的主觀認(rèn)識(shí)的問(wèn)題,那么,信息的真實(shí)再現(xiàn),則既有主觀因素在內(nèi),也有客觀因素在內(nèi);而相比信息的全部再現(xiàn),真實(shí)再現(xiàn)似乎更重要。

  主觀方面因素,是指人的思想認(rèn)識(shí)能力、文字認(rèn)識(shí)能力、傳統(tǒng)文化素養(yǎng)、掌握現(xiàn)代電子技術(shù)的能力等。電子技術(shù)能力毋需多說(shuō)。這里的思想認(rèn)識(shí)能力,主要是充分認(rèn)識(shí)到古籍?dāng)?shù)字化的文化意義、現(xiàn)實(shí)意義和未來(lái)意義。中國(guó)的古籍文獻(xiàn),由于時(shí)間(長(zhǎng))、物質(zhì)(紙張、油墨、溫濕度)、技術(shù)等原因,有的已經(jīng)很難再原樣保存下去,有的只能作為一種文化的載體存在而無(wú)法實(shí)現(xiàn)其供人閱讀的文化價(jià)值。古籍?dāng)?shù)字化不是簡(jiǎn)單的數(shù)字化技術(shù)問(wèn)題,而是關(guān)系到中華數(shù)千年文明典籍的轉(zhuǎn)化、再生、存續(xù),關(guān)系到民族文化記憶、思想的現(xiàn)代化表述。當(dāng)今社會(huì),大量的研究者正翹首期盼著現(xiàn)代化技術(shù)帶來(lái)的盡可能多的典籍使用的便捷化、準(zhǔn)確化、快速化。古籍?dāng)?shù)字化,應(yīng)該盡量滿足現(xiàn)代研究者的學(xué)術(shù)需要。而古籍?dāng)?shù)字化也是古籍適應(yīng)未來(lái)社會(huì)發(fā)展的必要手段。做好古籍?dāng)?shù)字化,不是一個(gè)人幾個(gè)人的事情,也不是一個(gè)小團(tuán)體的事情,它關(guān)系到整個(gè)國(guó)家,整個(gè)民族。

  文字認(rèn)識(shí)能力,是指認(rèn)識(shí)繁體、難字、異體字的能力。繁體,難字冷僻字多,異體字多,是古籍不同于現(xiàn)代書籍的重要表現(xiàn)。一般掃描儀器連簡(jiǎn)體字的報(bào)刊書籍尚不能百分之百準(zhǔn)確無(wú)誤地識(shí)別,掃描古籍差錯(cuò)率必然大。一是技術(shù)跟不上,不能保證質(zhì)量;一是古籍自身問(wèn)題,刻本的繁體、難字、異體已經(jīng)造成數(shù)字化的高難度,稿本、抄本中的異體字、行書體字、草書體字,對(duì)現(xiàn)代技術(shù)來(lái)說(shuō),更無(wú)異于“天書”,要想全部辨識(shí),難上加難。這就對(duì)從事古籍?dāng)?shù)字化的人員提出高難要求,他們必須認(rèn)識(shí)古籍中的各種字體,必須解決儀器識(shí)認(rèn)不了的字,將它們真實(shí)地再現(xiàn)出來(lái),讓閱讀的人可以閱讀。如“夘央”或“夗央”,實(shí)際是“鴛鴦”的異體書寫。一部書,數(shù)字化以后,存在這樣那樣的錯(cuò)字,或是以其它符號(hào)代替的字,或留空,或以圖像代替的字,總感覺(jué)到閱讀不順暢,或閱讀時(shí)感覺(jué)文本不真實(shí)。

  傳統(tǒng)文化素養(yǎng),指的是綜合的國(guó)學(xué)功底。古籍的閱讀和數(shù)字化,不是僅僅識(shí)字就可以了那么簡(jiǎn)單。古籍書寫,有其特殊的“格”。這些“格”,有的較簡(jiǎn)單,如直行,不分段,開(kāi)頭不空格,避諱字闕筆等等,較容易掌握;有的較復(fù)雜,不容易掌握,如為表示對(duì)朝廷、帝后,以及書寫者尊長(zhǎng)的尊敬,行文中會(huì)在相應(yīng)位置留空、轉(zhuǎn)行、偏行、頂格、小字處理等,一不留神,就會(huì)出錯(cuò)。如清代中期李星馳淑儀《澹香閣詩(shī)抄》,其夫侄序云:“澹香閣者,先叔母旌表節(jié)孝李太宜人之居也!痹瘫驹凇跋仁迥浮焙罅艨,“旌表節(jié)孝李太宜人之居也”另起行,以示寫序者對(duì)其叔母的尊敬。嘗見(jiàn)有人將其點(diǎn)斷為:“澹香閣者先叔母!弊饕恍校弧办罕砉(jié)孝李太宜人之居也!绷碜饕恍。古籍中還有一些特殊的符號(hào),不知道,不掌握,很難有效地?cái)?shù)字化。如清人對(duì)南宋曾宏父所刻《鳳墅法帖》進(jìn)行釋文時(shí),基本保留原手寫書信的一些特殊用字符號(hào),像《鳳墅殘?zhí)屛摹肪砦濉扒褰齽⑻保啻纬霈F(xiàn)“將息二二”、“至極二二”、“苦事二二”、“至喜二二”、“可惜二二”、“保重二二”等,其中“二二”顯然是重復(fù)時(shí)的省略符號(hào),“將息二二”,即“將息將息”,“至極二二”即“至極至極”,如此類推,F(xiàn)代人對(duì)手寫的一字省略符號(hào)較為熟悉,對(duì)古籍中的二字三字省略符號(hào),恐怕就不大認(rèn)識(shí)了。清代青浦詞論家王昶《西崦山人詞話》稿本卷二第一條“朱竹垞尊彝云”,在“尊”字右邊加了一個(gè)方向朝下的逗點(diǎn),“彝”字右邊加了一個(gè)方向朝上的逗點(diǎn),都很輕,不留心會(huì)忽略過(guò)去,即表示“尊彝”二字要倒為“彝尊”。這個(gè)乙字符號(hào),也與現(xiàn)代人所掌握的不同。至于斷句標(biāo)點(diǎn),也是基本功之一,是對(duì)數(shù)字化者綜合素養(yǎng)的考驗(yàn)。

  古籍信息的真實(shí)再現(xiàn),就是建立在正確理解原文基礎(chǔ)上的文字轉(zhuǎn)化。沒(méi)有“正確理解”這個(gè)前提,只需要復(fù)印、拍照即可做到真實(shí)再現(xiàn),但復(fù)印、拍照不是數(shù)字化,不能檢索、復(fù)制;數(shù)字化而沒(méi)有“正確理解”這個(gè)前提,絕對(duì)不可能達(dá)到真實(shí)再現(xiàn)這個(gè)目標(biāo)。

三、古籍?dāng)?shù)字化后的新問(wèn)題

  古籍?dāng)?shù)字化,必將為人們的閱讀、研究提供非常多的好處,但同時(shí),我們也不能不看到,古籍在數(shù)字化以后,也會(huì)滋生一些新的問(wèn)題。這突出地表現(xiàn)在以下幾個(gè)方面:

  第一,誤引誤用成為常事。數(shù)字化具備異?旖莸臋z索、統(tǒng)計(jì)功能,于是乎,字、語(yǔ)詞、意象使用頻率的統(tǒng)計(jì),典事最早或原始出處的查找,都可以在瞬間完成。不再需要一本書一本書地翻檢,不需要一個(gè)人一個(gè)人地請(qǐng)教,只需輸入關(guān)鍵字詞,輕點(diǎn)鼠標(biāo),幾秒鐘一切事情都搞定。殊不知,這樣檢索、統(tǒng)計(jì)的結(jié)果,是不可靠的,其中有許多虛假數(shù)字。電腦雖然號(hào)稱人工智能,在社會(huì)科學(xué)領(lǐng)域,畢竟不如人腦聰慧。它只能找出字或字串,不能區(qū)別同字之異義,區(qū)別相同字串的不同涵義。筆者為做《唐代試律詩(shī)研究》,曾檢索電子版《四庫(kù)全書》中的“試律”一詞,可以得到144條,但合乎考試的律體詩(shī)歌這一意思的,只有幾條;檢得“試律詩(shī)”2條,全部不合要求。只要上一字是“試”,下一字是“律”,就會(huì)被它當(dāng)作“試律”看待,其錯(cuò)誤類型五花八門,如:“凡明法,試律七條令三條”(《新唐書》卷44),“進(jìn)士諸科,始試律義十道”、“第一第二場(chǎng),試律”、“亦試律義”、“仍罷試律義”(《宋史》卷155),“試律學(xué)第一,除參軍”(《遼史拾遺》卷16)、“試律官二員”、“會(huì)試下第再舉,直赴御試。律科進(jìn)士,又稱為諸科”(《金史》卷51)、“試律賦一首,律詩(shī)一首”(《太平治跡統(tǒng)類》卷27),還有宋代王庭珪《瀘溪文集脫藁》目錄,上一行是“送劉世臣赴省試”,下一行是“律詩(shī)七言”,也被嫁接成“試律詩(shī)”。這些“試律”、“試律詩(shī)”,完全脫離上下文的語(yǔ)言環(huán)境,不問(wèn)“試”何指,“律”何義,隨意組合,牽強(qiáng)成詞。如果自己在電腦檢索的結(jié)果出來(lái)后,不細(xì)加辨析,便會(huì)得出錯(cuò)誤的結(jié)論。技術(shù)無(wú)道德,不需要負(fù)責(zé)任;但人是社會(huì)生物,需要對(duì)自己的研究負(fù)全責(zé)。

  第二,青年人整體古籍閱讀能力的下降乃至喪失。上世紀(jì)九十年代以來(lái),在商品經(jīng)濟(jì)大潮的沖擊下,在急功近利世風(fēng)的影響下,越來(lái)越多的從事古代歷史、文化史、文學(xué)史研究的人,急于成名,急于完成學(xué)業(yè),不認(rèn)真讀書,只從他人的著作、文章中輾轉(zhuǎn)稗販一些古籍段落、字句,率爾操觚,輕易成文,本身的閱讀力卻不斷下降。近年來(lái)的“國(guó)學(xué)熱”、“讀經(jīng)熱”,正是在青年人整體傳統(tǒng)文化興趣和功底都喪失殆盡形勢(shì)下的危機(jī)應(yīng)對(duì)策略,它是非常態(tài)的,不得已的。一旦古籍完成數(shù)字化,就有可能助長(zhǎng)這種不讀原典的壞風(fēng)氣。年輕一代的本科生、研究生,古代文化文學(xué)愛(ài)好者,發(fā)現(xiàn)可以非常輕易地得到師長(zhǎng)輩們費(fèi)盡九牛二虎之力才得到,或根本就得不到的研究資料,還會(huì)去孜孜矻矻地讀經(jīng)典,讀正史,讀詩(shī)詞曲賦嗎?數(shù)字化將造就一批學(xué)術(shù)懶人,這是可以預(yù)料也可以接受的;但是,以一代人甚至幾代人古籍閱讀能力、理解能力的下降乃知喪失為代價(jià),換得數(shù)字化,那么,這個(gè)代價(jià)也太大了,相信是大多數(shù)人都不愿看到不愿接受的。于今之計(jì),否定數(shù)字化,拒絕數(shù)字化,肯定是行不通的;加強(qiáng)思想道德教育,通過(guò)學(xué)校、老師(導(dǎo)師)給年輕人施加壓力,估計(jì)收效也不會(huì)大。比較理想的措施,可能需要國(guó)家教育主管部門、文化主管部門,還有人事主管部門、學(xué)校、教師、家庭,多方合作協(xié)商,從人才培養(yǎng)、任用、考評(píng)等制度方面,制定出一整套長(zhǎng)效機(jī)制,方能解決根本性的問(wèn)題。

  第三,數(shù)字化的法律秩序。首先是版權(quán)、著作權(quán)混亂。傳世古籍,除了今人的影印、點(diǎn)校、注釋、翻譯之外,是沒(méi)有著作權(quán)的,不涉及版權(quán)問(wèn)題。但數(shù)字化以后,這個(gè)問(wèn)題就變得復(fù)雜了。數(shù)字化算不算古籍整理?有沒(méi)有產(chǎn)生新的著作人、版權(quán)人?這個(gè)版權(quán)如何維護(hù)?人們?cè)谑褂脭?shù)字化古籍成果時(shí),要不要加署資料出處?而新的著作人、版權(quán)人,又是否能夠保證使用者所引用資料的正確無(wú)誤?具體而言,圖像版的古籍(數(shù)碼拍照)有無(wú)版權(quán)?如果有,版權(quán)是歸藏書單位,還是歸圖像制作者?數(shù)字化的古籍,有無(wú)版權(quán)?版權(quán)歸誰(shuí)?這些問(wèn)題,就目前的數(shù)字化古籍市場(chǎng)看,顯得十分混亂。國(guó)家尚未出臺(tái)一部針對(duì)數(shù)字化古籍的法律法規(guī),因而市場(chǎng)無(wú)準(zhǔn)繩可依。其次,數(shù)字化進(jìn)程混亂。現(xiàn)在是諸侯割據(jù),各占一方。只要投入資金,都可以進(jìn)行古籍?dāng)?shù)字化。而缺少統(tǒng)一部署,統(tǒng)一調(diào)度,有限的人力資源、資金資源,得不到有效的整合、協(xié)作,從而使古籍的數(shù)字化出現(xiàn)較為嚴(yán)重的重復(fù)施工、整體布局失衡的現(xiàn)象。一些較為熱門的古籍,不斷被人數(shù)字化,冷僻一點(diǎn)的,則無(wú)人問(wèn)津。除了《四庫(kù)全書》、《四部叢刊》等少數(shù)幾部外,大量的大型叢書(當(dāng)然,不少叢書的細(xì)目,存在交叉重合,數(shù)字化時(shí),也需要協(xié)調(diào),免得重復(fù)投入),成了被電子技術(shù)遺忘的角落,成了電光、激光普照不到的陰暗地方。為此,我們呼喚相關(guān)法律法規(guī)的出臺(tái),盼望數(shù)字化市場(chǎng)早日法律秩序化。

作者單位】華東師范大學(xué)中文系

 
主站蜘蛛池模板: 精品无码综合一区二区三区 | 天天影视色香欲性综合网网站| 国产成人综合野草| 五月婷婷久久综合| 狠狠色婷婷七月色综合| 国产91色综合久久免费| 国产成人综合亚洲一区| 久久久久国产综合AV天堂| 色综合视频一区二区三区44| 狠狠色狠狠色综合网| 天天综合色天天综合| 国产综合色在线精品| 亚洲综合在线一区二区三区| 综合三区后入内射国产馆| 国产精品综合AV一区二区国产馆| 久久久久亚洲AV综合波多野结衣| 色综合久久中文综合网| 东京热TOKYO综合久久精品| 狠狠色丁香婷婷久久综合| 国产香蕉尹人综合在线| 国产色婷婷精品综合在线| 国产色产综合色产在线观看视频 | 久久久久久久尹人综合网亚洲| 国产精品亚洲综合久久| 91精品国产综合久久香蕉 | 天天做天天爱天天综合网| 狠狠亚洲婷婷综合色香五月排名| 国产综合久久久久久| 狠狠色丁香九九婷婷综合五月| 国产精品无码久久综合网| 99v久久综合狠狠综合久久| 亚洲av综合日韩| 国产亚洲Av综合人人澡精品| 亚洲丁香婷婷综合久久| 国产精品综合一区二区| 丁香亚洲综合五月天婷婷| 一本大道久久a久久综合| 伊人久久综合成人网| 久久综合九色综合97伊人麻豆| 狠狠色狠狠色综合日日五| 成人综合国产乱在线|