網(wǎng)站首頁 | 網(wǎng)站地圖

人民論壇網(wǎng)·國家治理網(wǎng)> 人民智庫> 正文

數(shù)字技術(shù)讓古籍“觸手可及”

輸入網(wǎng)址、輕點鼠標,儒家經(jīng)典《論語》可逐頁在線閱覽,飄逸俊秀的漢隸代表作《曹全碑》書法躍然眼前,古籍還能實現(xiàn)繁體字和簡體字轉(zhuǎn)換等功能,讓讀者能查詢、會閱讀。專家認為,中華古籍浩如煙海,對珍貴古籍進行保護、修復(fù)和活用,關(guān)乎中華文脈的延續(xù)和傳承。隨著數(shù)字技術(shù)不斷成熟,古籍正走出“深閨高閣”,資源會得到更有效利用。

 

從圖書館“搬”到網(wǎng)絡(luò)平臺

點擊瀏覽器,進入一個名為“識典古籍”的網(wǎng)站,記者看到《周易》《左傳》《禮記》等典籍陳列在首頁上。隨機點開一本,左側(cè)為章節(jié)目錄,右側(cè)為正文,排版形式既符合現(xiàn)代人的閱讀習(xí)慣,又還原了古籍紙張的閱讀美感。

這是北京大學(xué)數(shù)字人文研究中心與字節(jié)跳動合作研發(fā)的一個數(shù)字古籍平臺,自去年10月發(fā)布以來,已上線古籍1200余部,免費供公眾瀏覽。

與一些數(shù)字化平臺僅提供古籍影像不同,點擊該平臺的功能按鈕,還能實現(xiàn)簡繁體轉(zhuǎn)換、圖文對照、全文檢索、支持移動端等服務(wù)。北京大學(xué)人工智能研究院副研究員楊浩介紹,該平臺應(yīng)用了文字識別、自動標點等技術(shù),不僅將影印本上的文字提取整理,還可以標記文本中的人名、地名等信息。“我們利用人工智能技術(shù),將古籍由以前的圖像加工成可檢索的文本與數(shù)據(jù),方便研究者、用戶直接閱讀。”

隨著數(shù)字技術(shù)不斷成熟,科技賦能古籍工作取得可喜進展。國家圖書館公布的數(shù)據(jù)顯示,全國已累計在線發(fā)布古籍數(shù)字資源13萬部(件)。打開《永樂大典》高清影像數(shù)據(jù)庫(第一輯),讀者能瀏覽到國家圖書館館藏的《永樂大典》40冊、75卷的高清圖像及相關(guān)知識;浙江大學(xué)打造的“智慧古籍平臺”可在線查閱數(shù)萬篇古籍,還有著者小傳、人物行跡及社會網(wǎng)絡(luò)關(guān)系圖等延伸信息。

這些古籍是怎樣從圖書館庫房“搬”到網(wǎng)絡(luò)平臺的?楊浩介紹,古籍數(shù)字化過程分為兩步。首先將古籍進行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機,盡量不按壓古籍頁面進行拍照;采用的光源是防紫外線的LED燈冷光源,減少對古籍的損害。其次是對圖像做數(shù)據(jù)化處理,利用人工智能技術(shù)對文字進行識別,對標點、實體等進行標引,方便讀者閱讀與檢索。

減少人工智能識別錯誤率也很重要。字節(jié)跳動公益古籍項目相關(guān)負責人說,具有中文、歷史等專業(yè)知識并對古籍感興趣的員工,自發(fā)成立2600人的志愿者團隊,參與古籍校對工作。

方便讀者獲取資源

“作為再生性保護的重要手段,古籍數(shù)字化及其平臺建設(shè)意義重大。”北京大學(xué)數(shù)字人文中心主任王軍認為,古籍數(shù)字化可以很好地解決古籍保護與利用之間的矛盾。傳統(tǒng)上,人們要利用古籍,必須直接接觸書籍,這可能導(dǎo)致書籍受到進一步磨損,且只能在特定的圖書館或機構(gòu)中閱讀。通過數(shù)字化,不僅能減少對古籍的物理損害,還方便讀者隨時隨地獲取這些資源。

近年來,古籍數(shù)字化和平臺建設(shè)進展很快。國家圖書館搭建的“中華古籍資源庫”已成為全國古籍資源類型和品種最多、體量最大的綜合性資源共享發(fā)布平臺。中華書局的“中華經(jīng)典古籍庫”已發(fā)布6000多種、15億字的點校本古籍。一些地方還打造了整理少數(shù)民族古籍的數(shù)字平臺,如“廣西古籍文庫”目前共收錄100多部古壯族文字古籍底本和近千份民族地區(qū)文書等資源。

不過,古籍數(shù)字化工作依然任重道遠。業(yè)內(nèi)人士指出,中國現(xiàn)存古籍中,只有少部分被拍攝成圖像資料,而大部分未實現(xiàn)文本數(shù)字化。此外,大量古籍分散收藏在各個圖書館或收錄于不同的數(shù)據(jù)庫,難以進行高效檢索、關(guān)聯(lián)閱讀和深度挖掘與利用。

如何將這些散落的古籍整合起來?6月初,一個旨在對2.5萬種古籍進行數(shù)字化整理的古籍智慧圖書館項目啟動。該項目到2025年底,將實現(xiàn)國家圖書館等館藏古籍數(shù)字化,并為人們提供公益性閱讀服務(wù)。

短視頻再現(xiàn)古籍里的美食

“沒想到古籍這么‘香’。”在看完系列短視頻《食光機·隨園私房菜》后,有網(wǎng)友留言說。該短視頻由南京圖書館歷史文獻研究館研究員史星宇和韓超制作,他們按照清代文學(xué)家袁枚寫的《隨園食單》,再現(xiàn)古籍里的美食,吸引不少人觀看。

“為了更好地呈現(xiàn)《隨園食單》中的菜品,我們結(jié)合歷史和古代文學(xué)等相關(guān)學(xué)科背景,對原文文本一起推敲斟酌,在烹飪上反復(fù)試驗,同時盡量還原書中的烹飪手法,保證菜品的原汁原味。”韓超說。

如何讓數(shù)字化的古籍和人們更親近呢?這考驗著文保機構(gòu)、科研院校與互聯(lián)網(wǎng)公司等相關(guān)從業(yè)者的創(chuàng)新能力。如紀錄片《古籍尋游記》運用交互技術(shù)、掃描技術(shù)等,讓用戶以更沉浸的方式體驗甲骨文刻字、建造敦煌莫高窟的過程。

王軍認為,在古籍數(shù)字化、活化過程中,人文社科學(xué)者要積極介入,并加強與技術(shù)人員合作;高校古典文獻學(xué)等相關(guān)專業(yè)應(yīng)培養(yǎng)兼具技術(shù)與學(xué)術(shù)能力的復(fù)合型人才,部分古籍內(nèi)容應(yīng)向著“數(shù)字文創(chuàng)”轉(zhuǎn)化,讓古籍更好地走進千家萬戶。

原標題:

全國累計在線發(fā)布古籍數(shù)字資源13萬部

數(shù)字技術(shù)讓古籍“觸手可及”(網(wǎng)上中國)

責任編輯:張宏莉
標簽: 數(shù)字技術(shù)