在歷史的長河中,漢字的命運(yùn)跌宕起伏,曾面臨諸多質(zhì)疑與挑戰(zhàn),卻在人工智能時(shí)代成功逆襲,這背后藏著怎樣的故事呢?
回溯到1936年,魯迅先生在離世前不久,曾發(fā)出“漢字不滅,中國必亡”的感慨。
與此同時(shí),章太炎也認(rèn)為“中文之不死,中國必亡”,陳獨(dú)秀覺得中國文字難以傳播新思想,還腐蝕人們的思維,瞿秋白更是將漢字形容為“世界上最齷齪最惡劣最混蛋的中世紀(jì)的茅坑” 。
蔡元培、胡適等一眾知識分子,也紛紛加入抨擊漢字的行列。
當(dāng)時(shí),中國內(nèi)有軍閥混戰(zhàn),外有列強(qiáng)侵略,國家危在旦夕。在這種艱難的處境下,漢字成為了知識分子們關(guān)注的焦點(diǎn)。
那時(shí),中國文盲率高達(dá)百分之九十幾,文化傳承岌岌可危,他們“愛之深責(zé)之切”,期望通過批判來尋求變革之路。
同一時(shí)期,文化界掀起了一股否定中國傳統(tǒng)文化的浪潮,有人質(zhì)疑商朝的存在,認(rèn)為大禹只是一條蟲,中醫(yī)也被當(dāng)作封建余孽遭到否定,而難寫難記難懂的漢字,自然也未能幸免。
不過,也有一些文化人挺身而出,堅(jiān)決捍衛(wèi)漢字。趙元任創(chuàng)作的《施氏食獅史》,用96個(gè)“shi”的音,生動(dòng)地展現(xiàn)了漢字獨(dú)特的魅力,警示人們?nèi)绻麑h字拉丁化,中國文化將會(huì)遭受巨大的沖擊。
瞿秋白在蘇聯(lián)學(xué)習(xí)后,受列寧思想啟發(fā),發(fā)起了漢字拉丁化運(yùn)動(dòng),部分知識分子甚至在延安進(jìn)行了相關(guān)嘗試。
就連蔣介石也曾在日記中提及,漢字艱深,需借助注音符號來幫助兒童學(xué)習(xí)。
但隨著1937年抗日戰(zhàn)爭全面爆發(fā),全國上下投身抗戰(zhàn),文字改革的事情被暫時(shí)擱置。
新中國成立后,面臨著讓百分之九十幾的國民全面脫盲的艱巨任務(wù),漢字拉丁化再次被列為文字改革委員會(huì)的重要選項(xiàng)之一。這一選項(xiàng)被呈送到中南海懷仁堂,請毛主席定奪。毛主席風(fēng)趣地表示,在延安搞中文拉丁化時(shí),寫出的文字彎彎曲曲像雞腸子,一旦漢字拉丁化,就會(huì)失去自身的文化基因。
于是,主席代表中央做出決定,漢字的改革方向是簡化,而非拉丁化,這一決策為文化界關(guān)于漢字改革的爭論暫時(shí)畫上了句號。
在主席的鼓勵(lì)下,全國掃盲運(yùn)動(dòng)取得了顯著成效。中國重新加入聯(lián)合國時(shí),人們驚喜地發(fā)現(xiàn),在聯(lián)合國的所有書籍中,漢字是使用紙張最少的文字。
然而,新的挑戰(zhàn)接踵而至。現(xiàn)代計(jì)算機(jī)誕生后,文字輸入成為難題。1979年,錢偉長訪問美國時(shí),IBM的工程師宣稱英文是計(jì)算機(jī)的“天選之詞”,認(rèn)為中國人若不放棄中文,就無法邁入計(jì)算機(jī)時(shí)代。
美國人還曾用漫畫嘲諷中文打字機(jī),認(rèn)為其會(huì)是世界上最大的打字機(jī),因?yàn)闈h字輸入計(jì)算機(jī)困難重重。
但其實(shí),早在20世紀(jì)30年代,林語堂就花費(fèi)三十年開發(fā)出中文打字機(jī)的雛形。進(jìn)入計(jì)算機(jī)時(shí)代,王永民發(fā)明了五筆輸入法,雖然后來被更便捷的拼音輸入法替代,但在當(dāng)時(shí),它被聯(lián)合國官員贊譽(yù)為“二十世紀(jì)最偉大的東方魔術(shù)”。
王選提出開發(fā)中文激光照排技術(shù)時(shí),日本學(xué)者斷言掌握這項(xiàng)技術(shù)比登月還難,可中國人還是突破了重重封鎖。
到了21世紀(jì),在數(shù)碼時(shí)代,英文在底層邏輯上占據(jù)主導(dǎo),很多人渴望能用漢字輸入代碼。
就在大家認(rèn)為美國在人工智能時(shí)代遙遙領(lǐng)先,中國與之差距較大時(shí),中國創(chuàng)造的人工智能算法卻突然站在了世界前沿。
在智能時(shí)代,漢字展現(xiàn)出了無與倫比的優(yōu)勢。首先,漢字信息量大,檢索信息時(shí),中文花費(fèi)的時(shí)間僅為英文的百分之三十。
比如,ChatGPT用26個(gè)字母解釋“量子糾纏”,而中文僅用“量子糾纏”四個(gè)字就能表達(dá)清楚。漢字超強(qiáng)的信息壓縮能力,讓中文大模型的訓(xùn)練速度比英文提高了百分之四十七。
其次,中文閱讀者大腦激活區(qū)域比英文閱讀者多百分之十五,信息處理速度卻提升了百分之二十二,這得益于漢字的象思維特征與神經(jīng)網(wǎng)絡(luò)分布天然契合。
再者,在處理意向性指令時(shí),中文的準(zhǔn)確率高達(dá)百分之九十一,遠(yuǎn)高于英文和其他文字的百分之四十幾。
中國古詩詞中的意境,用英文很難精準(zhǔn)表達(dá),像“雞鳴茅店月,人跡板橋霜”,翻譯成英文后韻味全無。
此外,麻省理工學(xué)院發(fā)現(xiàn),漢字包含的拓?fù)湫畔⑹怯⑽牡?28倍,同樣文字的信息熵,中文也是其他文字的兩倍以上。
漢字的這些特性,使其仿佛天生就是為智能時(shí)代準(zhǔn)備的。例如,“大衣、毛衣、內(nèi)衣、睡衣”,只要認(rèn)識“衣”字,哪怕是幼兒園小朋友都能理解它們與衣服有關(guān),而英文中這四個(gè)詞卻毫無關(guān)聯(lián)。
而且,中國豐富的歷史典故、成語詩詞,進(jìn)一步豐富了漢字背后的內(nèi)涵。中文大模型在處理“危機(jī)”一詞時(shí),能同時(shí)觸發(fā)“危險(xiǎn)”“機(jī)遇”以及“化危為機(jī)”“轉(zhuǎn)危為安”等一系列相關(guān)的成語和典故。
當(dāng)中國的大模型如DeepSeek開源時(shí),有人擔(dān)心中國的算法成果被他人獲取。
實(shí)際上,中國開放的是應(yīng)用方法,底層邏輯仍牢牢掌握在自己手中。其他國家若想在人工智能賽道上取得更好成績,就必須采用中文進(jìn)行訓(xùn)練,這意味著他們要接受中華文明的熏陶。
中華文明借助漢字,在新時(shí)代潛移默化地影響著世界。從過去一百年間漢字在生死邊緣的掙扎,到如今從安陽甲骨到杭州服務(wù)器,漢字完成了一場跨越時(shí)空的文明傳承,它不再是古老文明的絕唱,而是人類智能時(shí)代的嘹亮晨鐘。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.