網(wǎng)站首頁 | 網(wǎng)站地圖

大國新村
首頁 > 原創(chuàng)精品 > 學(xué)界熱點(diǎn) > 正文

從陸谷孫翻譯智慧看人工智能的“正道”

作者:復(fù)旦大學(xué)哲學(xué)學(xué)院教授 徐英瑾

復(fù)旦大學(xué)外文學(xué)院教授陸谷孫先生,最近不幸因病醫(yī)治無效而辭世。我不是學(xué)習(xí)英語專業(yè)的,但因?yàn)殛P(guān)心與機(jī)器翻譯相關(guān)的人工智能哲學(xué)問題,故而平素也較為留意陸先生發(fā)表的一些真知灼見。

陸先生于2015年發(fā)表過一篇討論翻譯技巧的短文。文中指出,翻譯要講求做到“飛躍”與“抵達(dá)”,即飛躍源語言與目標(biāo)語言之間的文化隔閡,準(zhǔn)確抵達(dá)目標(biāo)語言中相應(yīng)文化氣場(chǎng)中的那個(gè)“著陸點(diǎn)”。因?yàn)椴煌拇g文本具有各自的文化氣場(chǎng),所以譯者就需要根據(jù)語境的變化機(jī)敏地選擇最恰當(dāng)?shù)?ldquo;飛躍路線”,在譯文生成過程的終端實(shí)現(xiàn)最順當(dāng)?shù)?ldquo;文化軟著陸”。

陸先生舉過一個(gè)案例,來說明這種“飛躍”與“抵達(dá)”。某出版社曾咨詢陸先生,如何為一篇題目為《租界》的中文小說,安上一個(gè)妥貼的英文標(biāo)題。直譯當(dāng)然是“The Concession”,但陸先生讀完小說發(fā)現(xiàn),作者說的是發(fā)生在舊上海法租界的故事,所以就譯為了“In the French Concession”,并用“in”強(qiáng)調(diào)了租界本身只是故事發(fā)生的場(chǎng)所,而非小說的真正描述對(duì)象。爾后,出版社又改了主意,覺得題目應(yīng)當(dāng)換成小說主人公的名字,即“中國排骨”。這又怎么譯成英文呢?陸先生覺得,若直接譯為“Chinese ribs”,洋人肯定會(huì)誤認(rèn)為這是菜譜,而“排骨”在漢語語境中所具有的“纖弱秀氣”意思就全丟凈了?;蛟S其意思更接近于“Bony Green Knight”吧,但此詞帶有中世紀(jì)色彩,放置到小資味濃郁的上海租界語境中,有點(diǎn)關(guān)公戰(zhàn)秦瓊的違和感了;翻譯為“Bony She-Man”則脂粉氣過濃。根據(jù)陸先生的描述,他就像直升機(jī)一樣在作為對(duì)象語言的英語領(lǐng)地上空盤旋,為尋找一處最佳的著陸點(diǎn)而費(fèi)心煩神。

可見,面對(duì)此類高度復(fù)雜的翻譯任務(wù),譯者需要付出極大的心智努力才有可能呈現(xiàn)信、達(dá)、雅的譯作。其間的腦力付出,有時(shí)甚會(huì)至遠(yuǎn)遠(yuǎn)超出用母語進(jìn)行思想原創(chuàng)。面對(duì)如此艱巨的腦力任務(wù),做人工智能研究的工程師或許會(huì)“想入非非”:倘若能夠根據(jù)陸先生的翻譯精神編制一種程序,讓機(jī)器自動(dòng)進(jìn)行文本翻譯,該有多好???

凡事都是“說易行難”。現(xiàn)有機(jī)器翻譯的主流思路,分為“符號(hào)進(jìn)路”與“統(tǒng)計(jì)進(jìn)路”兩種。很可惜,這兩種進(jìn)路都無法忠實(shí)地落實(shí)關(guān)于“飛躍與抵達(dá)”的翻譯經(jīng)驗(yàn)談。

先來看“符號(hào)進(jìn)路”。按此進(jìn)路,在機(jī)器翻譯中可以先做一個(gè)巨型雙語語料庫,并憑借現(xiàn)有的雙語翻譯詞典,搭架起一座橋梁。更精細(xì)的建模工作,甚至還要求對(duì)個(gè)別詞匯進(jìn)行語義框架構(gòu)建。譬如,“排骨”這詞的框架,就自帶有與諸如“豬皮”“高湯”“蹄髈”之類詞匯相關(guān)的推理關(guān)系表征。這樣,系統(tǒng)一旦觸發(fā)一個(gè)特定詞匯,就會(huì)形成與之相關(guān)的語義框架,并由此使得一些簡(jiǎn)單的語義推理成為可能。

然而,對(duì)于“符號(hào)進(jìn)路”的機(jī)器翻譯路徑而言,需要編程員預(yù)先對(duì)大量雙語語料對(duì)應(yīng)關(guān)系及各個(gè)詞匯自身的語義框架進(jìn)行建模。工作的繁瑣度就不提了,其不靈活性更是一個(gè)致命傷。具體而言,信息再完備的此類系統(tǒng),也很難對(duì)前面提到的“中國排骨”這樣古怪的詞語進(jìn)行準(zhǔn)確的信息解碼。通常狀態(tài)下,若不對(duì)整部小說有一定了解,恐怕就只能被譯為“Chinese ribs”這樣的菜名了。但是,對(duì)于現(xiàn)有的翻譯系統(tǒng)來說,對(duì)整部待譯小說進(jìn)行“宏觀把握”,卻是一個(gè)幾乎不可能完成的任務(wù)。

再來看統(tǒng)計(jì)學(xué)機(jī)器翻譯路徑。它是由所謂“深度學(xué)習(xí)”系統(tǒng)來實(shí)現(xiàn)的。概而言之,“深度學(xué)習(xí)”是一個(gè)升級(jí)版的人工神經(jīng)元網(wǎng)絡(luò)系統(tǒng)。其基本工作原理是,在亞符號(hào)層面上將語義對(duì)象解析為一個(gè)復(fù)雜的特征簇,然后通過神經(jīng)元網(wǎng)絡(luò)的多層次加工,從中逐層將高階語義重新構(gòu)造出來。照此進(jìn)路,一個(gè)諸如“排骨”這樣的詞匯,其原始形態(tài)只有數(shù)學(xué)特征、沒有語義特征。由于允許系統(tǒng)對(duì)語義相似關(guān)系作出模糊處理,因而其靈活性顯然超過“符號(hào)進(jìn)路”系統(tǒng)。

不過,與陸先生的翻譯智慧相比,“深度學(xué)習(xí)”網(wǎng)絡(luò)的火候還差得遠(yuǎn)。且不提此類系統(tǒng)的運(yùn)行所需要消耗的大量計(jì)算資源,光在一個(gè)問題上就完敗了:它必須有大量的訓(xùn)練樣本,以幫助其在一類源語言詞匯與另一類目標(biāo)語言詞匯之間預(yù)先搭建起大致的相關(guān)性關(guān)系簇;然后,它才能夠依循成例,摸索出與之比較接近的“跨越方式”。但是,像陸先生那樣進(jìn)行創(chuàng)造性“跨越”的大本領(lǐng),此類系統(tǒng)還是學(xué)不來的。

這是不是意味著陸先生的翻譯智慧,任何機(jī)器都無法模仿呢?我當(dāng)然也不這么悲觀?,F(xiàn)有的機(jī)器翻譯進(jìn)路之所以有問題,與其說是因?yàn)槌?jí)人工智能不靠譜,還不如說是業(yè)內(nèi)人士太滿足于玩弄工程學(xué)層面上的“奇技淫巧”了,不愛琢磨學(xué)理層面上的抽象問題。

考慮到這一點(diǎn),機(jī)器翻譯就不宜作為一個(gè)單獨(dú)的研究項(xiàng)目“孤軍深入”,而應(yīng)當(dāng)成為人工感知、類比推理機(jī)制等相關(guān)領(lǐng)域內(nèi)的研究成果的衍生產(chǎn)品。這一條新進(jìn)路,在國際上一般被稱為“通用人工智能”。或者說得更通俗一點(diǎn),按此新進(jìn)路,人工智能專家與其模仿陸先生的資深翻譯能力,還不如先去模仿陸先生咿呀學(xué)語時(shí)的“通用智力”,然后再求日益精進(jìn)。此路看似曲折,實(shí)際上才是人工智能研究之“正道”。

[責(zé)任編輯:孫易恒]