第452頁
2023-09-24 13:40:21 作者: 小雨清晨
「一個連鐵器都不存在的文明,肯定不會有彈簧的概念——自然也就不需要相應的詞。同樣,在一個性道德還沒有出現的社會裡,性暗示這種高級幽默也不可能有存在的基礎。」
這個叫喬伊的人說話,就跟他抽菸一樣,完全就是一口氣說下來,中間幾乎不存在多少停頓。雖然他的中文不算正宗,中間說著說著還會夾帶出幾個單詞,但大概的意思是明確的。看得出來他的心情有些激動——不知道是熬了一個通宵之後的慣性,還是被話題本身所激發出來的熱情。
這段話的信息量很大,但對陳舍來說其實並不難接受。
因為項目對語言學的關注很早就開始了,其中的一些觀點,做功課的時候,陳舍已經有所涉獵。雖然沒有去做專門的深入了解,但是聽懂這些話本身確實問題不大。喬伊說的這些,只是在前面的基礎上更加深入——倒不是說他們公司在學術上搞出了什麼更深的成果,只是在應用上,用到了更為專業的語言學知識而已。
「更高複雜程度的語言通常也體現在文學上,從某種程度上來說,文學家對語言的開創性應用本身,就是賦予了同一個詞彙更多的含義,或者在詞彙之間產生更多的映射,甚至根據自己的表達需要,創造出全新的詞彙。」
「比如說超人的英文superman吧,這個概念最早是哲學家尼采提出來的,在德語中是指代未來的某種理想型卓越人士。在由蕭伯納翻譯成英文之後,創造出了一個新單詞superman。」
「superman一個簡單的詞,就可以用來指代尼采原著中,那種複雜的描述,這種創造性本身,可以看做是對信息的提煉和加工。在漢語中,這樣的現象更加多見,漢語中的成語,可以說是創造性詞彙中,最有代表的一個系列,簡單的四個字,往往代表著很複雜的一大段概念的集合。
「但是機器語言……不,我應該換一種說法,程序語言。如果我用這種對語言的複雜度標準,應用在大多數程序語言上的話,那這些程序語言的得分,將會是一個無限接近於0的值。」
「之前我已經說過了,程序是一種最精確的語言——你可以想像一個,一個俄羅斯方塊的遊戲語言,整個程序就好像是一個單詞,這個單詞肯定是有意義的,假如我們把組合成這段程序的01展示給外星人看,把程序附帶的運行環境也給他們看,如果程序能被運行——那外星人肯定就能看到一個確切的含義。」
「在這個具體的含義中,是一個不斷出現不同形狀的幾何圖形出現,又消滅的意向——但組合成這個程序的那些單獨程序語句本身是沒有意義的,因為就像我們在討論刻舟求劍時,不會去討論船的速度,劍的重量這些因素一樣……」
老實說,聽到這兒,陳舍已經有點理解困難了,喬伊也看出了這一點,他適當放慢了語速,但陳舍似乎依然難以跟上他的進度。
於是喬伊只能簡單化的給出結論:「以前,地球上是不存在符合語言學定義上的複雜語言的。但是現在……雖然不知道它是如何出現的,但我們認為,我們找到了……你知道這意味著什麼嗎?」
陳舍搖頭。
「意味著也許就在這顆星球上,某個大公司的機房裡,就存在著一些文明的構造——我說的未必是AI,但它們肯定是掌握語言規則的某種程序,或者某種……東西。」
「它們的語言之複雜……我學漢語的時候,知道漢語裡最難以被理解的,就是四個字四個字的成語,每一個成語都可以牽扯十幾個附帶詞彙的意向。」
「比如刻舟求劍,船,劍,船上的人,這是基本的,然後還有衍生的概念,水的遮蔽特性,相對於劍的密度特性,相對於人的危險特性……想像一下一個外星人要理解刻舟求劍這個詞,他需要理解多少衍生的附帶概念。最後,在完全理解了這些概念之後,他才有可能理解到成語本身特定指代的某種意向——是用來諷刺主觀意志因為忽略客觀條件的變化而導致的愚蠢行為。
「在英語裡,其實也有類似成語的短句,我就不細說了……」
「這種我們剛剛發現的機器語言,你知道,在它的語言庫里,我們找到最複雜的『成語』,有多少意向指代嗎?」
陳舍看著喬伊,他豎起兩個手指頭:「兩千多個……嚴格來說,它已經不能算是成語了,你知道,兩千多個意向,通常來說,也就是兩千多個詞彙。要表達這些詞彙,考慮到語句上必要的通順和前後的邏輯,用中文大概寫出來的話,就這一個詞,就可以展開寫一篇上萬字的小說了。」
「其實成語就可以看做是被高度壓縮的小說故事——但機器語言中,故事的複雜程度更高。想像一下這樣一個場景,一個外星人,在電腦上跟你聊天。他說了一句話,裡面包含兩個這樣的關鍵詞——這些詞用01全部表示出來,也就是一兩排而已。但翻譯出來,卻可以是長達幾萬字的內容。你可能需要認真的看20分鐘,再思考20分鐘,才會明白這兩個詞的含義——然後大喊一聲,太TM絕了!」
「所以,你們的任務……」陳舍嘗試著猜測:「是翻譯這種文字?」
「翻譯?」喬伊搖了搖頭,「這個說法太狂妄了。」
「狂妄?」