網(wǎng)站首頁 | 網(wǎng)站地圖

大國新村
首頁 > 原創(chuàng)精品 > 學(xué)界熱點 > 正文

從陸谷孫翻譯智慧看人工智能的“正道”

作者:復(fù)旦大學(xué)哲學(xué)學(xué)院教授 徐英瑾

復(fù)旦大學(xué)外文學(xué)院教授陸谷孫先生,最近不幸因病醫(yī)治無效而辭世。我不是學(xué)習(xí)英語專業(yè)的,但因為關(guān)心與機器翻譯相關(guān)的人工智能哲學(xué)問題,故而平素也較為留意陸先生發(fā)表的一些真知灼見。

陸先生于2015年發(fā)表過一篇討論翻譯技巧的短文。文中指出,翻譯要講求做到“飛躍”與“抵達”,即飛躍源語言與目標(biāo)語言之間的文化隔閡,準(zhǔn)確抵達目標(biāo)語言中相應(yīng)文化氣場中的那個“著陸點”。因為不同的待譯文本具有各自的文化氣場,所以譯者就需要根據(jù)語境的變化機敏地選擇最恰當(dāng)?shù)?ldquo;飛躍路線”,在譯文生成過程的終端實現(xiàn)最順當(dāng)?shù)?ldquo;文化軟著陸”。

陸先生舉過一個案例,來說明這種“飛躍”與“抵達”。某出版社曾咨詢陸先生,如何為一篇題目為《租界》的中文小說,安上一個妥貼的英文標(biāo)題。直譯當(dāng)然是“The Concession”,但陸先生讀完小說發(fā)現(xiàn),作者說的是發(fā)生在舊上海法租界的故事,所以就譯為了“In the French Concession”,并用“in”強調(diào)了租界本身只是故事發(fā)生的場所,而非小說的真正描述對象。爾后,出版社又改了主意,覺得題目應(yīng)當(dāng)換成小說主人公的名字,即“中國排骨”。這又怎么譯成英文呢?陸先生覺得,若直接譯為“Chinese ribs”,洋人肯定會誤認(rèn)為這是菜譜,而“排骨”在漢語語境中所具有的“纖弱秀氣”意思就全丟凈了?;蛟S其意思更接近于“Bony Green Knight”吧,但此詞帶有中世紀(jì)色彩,放置到小資味濃郁的上海租界語境中,有點關(guān)公戰(zhàn)秦瓊的違和感了;翻譯為“Bony She-Man”則脂粉氣過濃。根據(jù)陸先生的描述,他就像直升機一樣在作為對象語言的英語領(lǐng)地上空盤旋,為尋找一處最佳的著陸點而費心煩神。

可見,面對此類高度復(fù)雜的翻譯任務(wù),譯者需要付出極大的心智努力才有可能呈現(xiàn)信、達、雅的譯作。其間的腦力付出,有時甚會至遠遠超出用母語進行思想原創(chuàng)。面對如此艱巨的腦力任務(wù),做人工智能研究的工程師或許會“想入非非”:倘若能夠根據(jù)陸先生的翻譯精神編制一種程序,讓機器自動進行文本翻譯,該有多好啊?

凡事都是“說易行難”。現(xiàn)有機器翻譯的主流思路,分為“符號進路”與“統(tǒng)計進路”兩種。很可惜,這兩種進路都無法忠實地落實關(guān)于“飛躍與抵達”的翻譯經(jīng)驗談。

先來看“符號進路”。按此進路,在機器翻譯中可以先做一個巨型雙語語料庫,并憑借現(xiàn)有的雙語翻譯詞典,搭架起一座橋梁。更精細的建模工作,甚至還要求對個別詞匯進行語義框架構(gòu)建。譬如,“排骨”這詞的框架,就自帶有與諸如“豬皮”“高湯”“蹄髈”之類詞匯相關(guān)的推理關(guān)系表征。這樣,系統(tǒng)一旦觸發(fā)一個特定詞匯,就會形成與之相關(guān)的語義框架,并由此使得一些簡單的語義推理成為可能。

然而,對于“符號進路”的機器翻譯路徑而言,需要編程員預(yù)先對大量雙語語料對應(yīng)關(guān)系及各個詞匯自身的語義框架進行建模。工作的繁瑣度就不提了,其不靈活性更是一個致命傷。具體而言,信息再完備的此類系統(tǒng),也很難對前面提到的“中國排骨”這樣古怪的詞語進行準(zhǔn)確的信息解碼。通常狀態(tài)下,若不對整部小說有一定了解,恐怕就只能被譯為“Chinese ribs”這樣的菜名了。但是,對于現(xiàn)有的翻譯系統(tǒng)來說,對整部待譯小說進行“宏觀把握”,卻是一個幾乎不可能完成的任務(wù)。

再來看統(tǒng)計學(xué)機器翻譯路徑。它是由所謂“深度學(xué)習(xí)”系統(tǒng)來實現(xiàn)的。概而言之,“深度學(xué)習(xí)”是一個升級版的人工神經(jīng)元網(wǎng)絡(luò)系統(tǒng)。其基本工作原理是,在亞符號層面上將語義對象解析為一個復(fù)雜的特征簇,然后通過神經(jīng)元網(wǎng)絡(luò)的多層次加工,從中逐層將高階語義重新構(gòu)造出來。照此進路,一個諸如“排骨”這樣的詞匯,其原始形態(tài)只有數(shù)學(xué)特征、沒有語義特征。由于允許系統(tǒng)對語義相似關(guān)系作出模糊處理,因而其靈活性顯然超過“符號進路”系統(tǒng)。

不過,與陸先生的翻譯智慧相比,“深度學(xué)習(xí)”網(wǎng)絡(luò)的火候還差得遠。且不提此類系統(tǒng)的運行所需要消耗的大量計算資源,光在一個問題上就完敗了:它必須有大量的訓(xùn)練樣本,以幫助其在一類源語言詞匯與另一類目標(biāo)語言詞匯之間預(yù)先搭建起大致的相關(guān)性關(guān)系簇;然后,它才能夠依循成例,摸索出與之比較接近的“跨越方式”。但是,像陸先生那樣進行創(chuàng)造性“跨越”的大本領(lǐng),此類系統(tǒng)還是學(xué)不來的。

這是不是意味著陸先生的翻譯智慧,任何機器都無法模仿呢?我當(dāng)然也不這么悲觀。現(xiàn)有的機器翻譯進路之所以有問題,與其說是因為超級人工智能不靠譜,還不如說是業(yè)內(nèi)人士太滿足于玩弄工程學(xué)層面上的“奇技淫巧”了,不愛琢磨學(xué)理層面上的抽象問題。

考慮到這一點,機器翻譯就不宜作為一個單獨的研究項目“孤軍深入”,而應(yīng)當(dāng)成為人工感知、類比推理機制等相關(guān)領(lǐng)域內(nèi)的研究成果的衍生產(chǎn)品。這一條新進路,在國際上一般被稱為“通用人工智能”?;蛘哒f得更通俗一點,按此新進路,人工智能專家與其模仿陸先生的資深翻譯能力,還不如先去模仿陸先生咿呀學(xué)語時的“通用智力”,然后再求日益精進。此路看似曲折,實際上才是人工智能研究之“正道”。

[責(zé)任編輯:孫易恒]