人文研究數字化:一場方興未艾的變革
清華大學人文學院院長萬俊人30多年前在北京大學讀書時,曾問過北大歷史系教授田余慶一個問題:“田先生,‘二十四史’您看了幾遍?”
“傻小子,沒有一個史學家能夠讀完‘二十四史’的!碧镉鄳c的回答,給萬俊人留下了深刻印象。
如今,有了古籍數據庫,輸入關鍵詞,瞬間,“二十四史”中的相關內容就涌現在眼前了,檢索和閱讀的便捷性有了極大提升。讀完“二十四史”雖然仍然需要下苦功夫,但利用“二十四史”已經越來越方便。
從紙本閱讀到檢索系統(tǒng),從檢索系統(tǒng)到分析系統(tǒng),人文學術的研究工具正在向“數字化”的方向轉變,和萬俊人一樣,很多人文學者的研究中越來越離不開“數字”了。
“不數字無人文的時代”到來
在信息的汪洋里,既要放寬眼界,又要盯準目標,不被淹沒,是學者們共同的需求和愿望。
“現在我們處在海量的信息中,這信息量不是宏觀,而是巨觀的。”臺灣大學資訊工程系教授、數位人文中心主任項潔如是說。
從微觀到中觀,從中觀到宏觀,再到巨觀,信息視域越來越廣闊無邊。人文學者如何駕馭浩如煙海的文獻材料?數字技術能幫他們做什么?
“對于人文學者來講,從來不是看幾篇文章就可以開始寫作,而是要看大量的文獻才敢下筆!表棟嵎治龅,“因為作者檢索到的文獻是一個系統(tǒng),要找出這些文獻之間的脈絡關系,是至關重要的事情!
“如果一位學者僅僅具備本學科的學術訓練,而不具備數字思維,欠缺運用數字技術進行研究的能力,即使他的學術功底再扎實,今后也寸步難行!鄙虅沼^執(zhí)行董事顧青說,“目前,我們利用數字技術進行人文學術研究的人群還不夠多。我堅信,在不遠的將來,我們不必再用‘數字人文’這樣的名號來宣示我們區(qū)別于傳統(tǒng)研究的立場。因為,‘不數字無人文的時代’已經到來,數字人文將深刻地改變學者,尤其是人文社科學者們的知識結構和研究路徑!
事實上,在一些學者看來,人文與數字,從來就沒有分過家。
萬俊人從古埃及、古希臘的建筑和哲學中,指出數字人文的神妙:“埃及金字塔,至今還是一個謎。它之所以能夠歷經4700多年的風雨,不只有古埃及人的信仰、圖騰和崇拜因素,還有數字的因素。在一片茫茫大漠的頂端,鑄造了繁多規(guī)整和雄偉的建筑,而且是用巨大的石頭壘起來,沒有精確的數字計算,是不能夠做到這一點的!
萬俊人認為,人文學術的源頭就與數字有關。他說:“古希臘哲學家畢達哥拉斯,他的哲學源自數字。從他開始,希臘哲學開始產生了數學的傳統(tǒng)。中國古代哲學也是如此,例如《易經》。所以,人文和數字從一開始就是孿生兄妹,只不過在后來的歲月里,兩者走得比較遠了些,看似它們已經告別了,其實它們一直在同一條路上,與人類文明和文化同行。”
用數字方法,解決人文研究難題
數字人文的發(fā)展動力,在于采用新的方法,解決過去難以解決的問題。
多年來,項潔研究團隊一直致力于滿足人文學者對內容數字化的需求,建立一個屬于他們自己的資料庫,來處理、標注和分析資料,使內容和工具能夠互動起來。
顧青回憶起30多年前,他在北京大學讀書的時候,上過一門“工具書使用”的課程,講的都是怎么使用紙質工具書。今天,這門課程涉及的很多工具書已經可以被數字化工具所取代,其中的一些工具書已進入古籍收藏家的視野,實用價值遠不如從前。
清華大學人文學院副教授李飛躍和中國社會科學院文學研究所助理研究員趙薇介紹,幾十年來中國人文學科的定量分析成果紛紛涌現,用數字手段檢驗和打破了一些人們習焉不察的定見:
20世紀80年代,陳炳藻、李賢平、施健軍和陳大康等海內外中國學者分別采用文體測量學的辦法,利用人工統(tǒng)計或計算機輔助手段,對《石頭記》前八十回、后四十回作者統(tǒng)一性問題作出判定;2005年,哈佛大學包弼德與北京大學等合建“中國歷代人物傳記資料庫”(CBDB);2001年,復旦大學和哈佛大學共建“中國歷史地理信息系統(tǒng)”(CHGIS)等,這些人文學者是數字人文的先行者。
“長安城圖的精準化和數位化應用”,這是臺灣中山大學中文系教授簡錦松利用數字化技術進行的一項研究。據他介紹,過去學界對唐代長安城的了解,都是從留存下來的紙質圖上看到的,F在可以對原始的古圖做數字化處理,然后放進電子地圖里,就能看到精準的長安古城面貌了。
這項研究既有學術價值,也很有趣。比如,有了這張數字化圖,就可以知道白居易的家住在哪里,上朝要走多久;也可以知道韓愈從家里出來拜訪張繼,要經過什么路徑;李商隱為悼念亡妻寫下了著名的《西亭》:“此夜西亭月正圓,疏簾相伴宿風煙。梧桐莫更翻清露,孤鶴從來不得眠。”從李商隱家到他妻子娘家的居所西亭,路程并不遙遠,只有1.7公里。
借助中南民族大學文學與新聞傳播學院王兆鵬教授構建的“唐宋文學編年地圖平臺”和“漢魏六朝文學編年地圖平臺”數據庫,也可以了解唐宋時期和漢魏六朝時期作家的活動情況。
“數字人文,能夠在相當程度上幫助傳統(tǒng)的研究工作,讓學者們有更多時間去做計算機目前還不能做的研究!鼻迦A大學人文學院教授、《數字人文》期刊主編劉石說。比如,古籍標點、字句?、索引編纂、資料匯編,過去的學者在這些方面花費了大量心血,如今都可以借助計算機去完成。
建立起知識的關聯,是數字人文的本事
數字人文興起的前提,是人文資料和文獻檔案的電子化與數據化。
劉石認為,當今社會,數字化的浪潮無所不在,也深刻地影響著包括人文和社會科學在內的一切領域。數字人文,推動了當代文獻學的發(fā)展,使之形成數據驅動、實證為先的新特征。“前幾年,人文學界有一種輕文獻考辨、重義理闡發(fā)的現象,導致學風空疏的傾向。現在有了數字人文,你想空疏都空疏不了。因為,數字人文中的大數據,不就是拿數據說話的實證研究嗎?所以,從這個角度講,文獻學、古籍整理,或者考據學,今后不見得會消亡,反而會隨著數字人文的發(fā)展獲得新的活力。”
眾所周知,錢鐘書先生博聞強記,而他的記憶力與他的學術成就息息相關。有人提出疑問:進入數字人文時代,學者的記憶能力還重要嗎?清華大學計算機科學與技術系主任、《數字人文》期刊主編孫茂松教授認為:“實際上,電腦時代并不意味著什么都能搜索到。數字人文要做的,不是把死的知識存在那里,而是要建立起不同知識間的關聯,有豐富的知識聯想,讓知識活起來,進行深入的學術融合。”
“我們現在遇到的一個最大的問題,就是有了大量的電子文本之后,怎樣利用這些數據庫進行研究?”美國巴克內爾大學東亞研究系教授陳松說。
因為,人工智能必須由人去做,才會智能,才有可能做出有價值的研究。
李飛躍從教學角度來分析數字人文:“過去我們說,知識就是力量。工業(yè)化時代標準化的教育,更重視知識技能的傳授教育。如今,信息時代的教育有一個非常重要的特點,就是更重視建立知識之間的關聯,這才是力量!
正如項潔所說的那樣,這些細微而生動的數字化,“從巨觀上,穿越了不同知識和學科之間的隔斷,才能從微觀上直達知識的細節(jié)”。
“從科學革命開始,學界有一個很大的分流,就是理工以發(fā)現為主,人文則以解釋為主。如今,有了數字人文這座新的橋梁,把以發(fā)現為主的理工學術帶到人文學界,人文學術將會有新的發(fā)展!毕愀劭萍即髮W人文與社會科學學院教授李中清說。
“數字人文是人文社科學術研究的未來,希望在信息科技領域中,有最懂傳統(tǒng)文化的人;在人文學術界中,有最懂數字技術的人!边@是顧青的期待,也是學者們共同的期盼。
(本報記者 計亞男 杜羽)