怪不得中國(guó)Deepseek要免費(fèi)給外國(guó)人用,現(xiàn)在西方的主流AI,居然用中文推理!這樣發(fā)展下去,中文的優(yōu)勢(shì)將大大提升啊!
1月8號(hào),一位外國(guó)網(wǎng)友提問(wèn),為什么他的人工智能軟件中會(huì)出現(xiàn)——“提議新創(chuàng)意”,這幾個(gè)中文字對(duì)他來(lái)說(shuō)十分陌生,他根本看不懂。
這些人使用的明明是美國(guó)的GPT不知道為什么系統(tǒng)里會(huì)出現(xiàn)中文字。更奇怪的是,當(dāng)他們讓人工智能解決數(shù)學(xué)問(wèn)題的時(shí)候,算著算著,中國(guó)字就出來(lái)了。
人工智能在推理和計(jì)算問(wèn)題的時(shí)候,不是直接給出答案,而是展示出計(jì)算和推理的全過(guò)程。gpt在計(jì)算的時(shí)候,算到后面一半,竟然變成了中文。
這位美國(guó)網(wǎng)友在論壇上發(fā)帖,人工智能突然把我當(dāng)成中國(guó)人了!美國(guó)眾多網(wǎng)友紛紛響應(yīng),都說(shuō)自己也遇見(jiàn)這種情況。
大家紛紛好奇起來(lái),為什么美國(guó)的人工智能會(huì)自己轉(zhuǎn)換成中文。美國(guó)網(wǎng)友進(jìn)行了一番猜測(cè),他們提出了三種看法。
使用了中國(guó)的開(kāi)源模型
第一種觀點(diǎn)認(rèn)為,美國(guó)公司使用了太多中國(guó)的數(shù)據(jù)和模型,比如深度探索,和阿里巴巴的通義千問(wèn)。
這兩個(gè)人工智能開(kāi)源之后,微軟等西方公司火速接入了中國(guó)的數(shù)據(jù)模型。所以底層模型里有太多中國(guó)的數(shù)據(jù),遇到難題和復(fù)雜計(jì)算的時(shí)候,為了加速運(yùn)算,就會(huì)使用中文。
正是因?yàn)槿绱耍斯ぶ悄芗夹g(shù)越領(lǐng)先,開(kāi)源模型被使用越多的國(guó)家,在未來(lái)的人工智能時(shí)代中,就能掌握極大的優(yōu)勢(shì)和話(huà)語(yǔ)權(quán)。
但是也有研究員認(rèn)為這并不是全部的原因,谷歌的人工智能偶爾會(huì)出現(xiàn)印度文字,這世界上可沒(méi)人使用印度模型。
所以第二種觀點(diǎn)認(rèn)為,中文出現(xiàn)是因?yàn)橛?xùn)練人工智能的中國(guó)工人太多了。
中國(guó)工人太多了
每一個(gè)人工智能的培養(yǎng)都需要大量的素材和訓(xùn)練,這些底層工作是枯燥重復(fù),又需要人類(lèi)自己去親自完成的。
在歐美國(guó)家,人工最貴,所以這些工作理所當(dāng)然的被承包給了中國(guó),印度,還有更多第三世界國(guó)家的數(shù)據(jù)工人,以節(jié)省成本。
而負(fù)責(zé)數(shù)學(xué),編程,推理的內(nèi)容一般都是外包給中國(guó)的公司來(lái)做。谷歌研究員認(rèn)為,因?yàn)樘嘀袊?guó)程序員參與了標(biāo)注,所以使用過(guò)程中才會(huì)出現(xiàn)中文。
在他們眼里這并不是一件好事,因?yàn)闃?biāo)注員應(yīng)該盡可能的保持客觀,減少自身的想法,以免對(duì)人工智能模型造成影響。
但是只要是人類(lèi)所做的工作,就不可能達(dá)到絕對(duì)的客觀。比如中文和印度語(yǔ)的混入,因?yàn)閬喼奕瞬皇煜ず谌擞⒄Z(yǔ),所以黑人英語(yǔ)被標(biāo)注成了臟話(huà)。
因此gpt不僅會(huì)出現(xiàn)漢語(yǔ),也會(huì)出現(xiàn)印地語(yǔ),泰語(yǔ),時(shí)不時(shí)就會(huì)抽風(fēng)。但是這種說(shuō)法遭到了阿爾伯塔大學(xué)的助理教授馬修的反駁。
漢語(yǔ)最為簡(jiǎn)單快捷
他認(rèn)為這種假設(shè)夸大了標(biāo)準(zhǔn)對(duì)人工智能的影響力,現(xiàn)在的AI也并沒(méi)有那么復(fù)雜的想法,它只是一個(gè)數(shù)學(xué)模型。
而這個(gè)數(shù)學(xué)模型只是在遵循人類(lèi)給他的代碼,完成人類(lèi)給出的計(jì)算任務(wù)。所以數(shù)學(xué)模型為了完成更快的更高效的目標(biāo),會(huì)自動(dòng)抓取不同語(yǔ)言的素材。
對(duì)于程序來(lái)說(shuō),他們不會(huì)去區(qū)分語(yǔ)言之間的區(qū)別,對(duì)于人工智能來(lái)說(shuō),所有語(yǔ)言都是可用的,都是能讀懂的。
所以為了盡可能加快計(jì)算的速度,模型會(huì)在底層計(jì)算中混用不同的語(yǔ)言。因?yàn)橛⑽牡臄?shù)學(xué)單詞比較長(zhǎng),字母多所以用起來(lái)非常麻煩。
而中文的加減乘除,都非常的短促,使用起來(lái)效率更高。所以有很多人認(rèn)為,中文更簡(jiǎn)潔,在人工智能的培養(yǎng)中更具有優(yōu)勢(shì)。
只需要3500個(gè)中文字符,就可以組成大部分日常用語(yǔ),所有新鮮事物,都可以用已經(jīng)存在的中文字符表達(dá)。
比如AI就叫做人工智能,對(duì)于中文來(lái)說(shuō),很少遇到需要造一個(gè)新文字的情況。而英文世界則經(jīng)常需要造詞,這就導(dǎo)致使用英文效率很低。
隨著中國(guó)人工智能的不斷領(lǐng)先,中文有可能成為世界科技界的主流,就像是我們的天宮空間站一樣。
自從中國(guó)有了自己的宇宙空間站,很多國(guó)家都申請(qǐng)進(jìn)入。這個(gè)時(shí)候我們就提出了一個(gè)要求,這些外國(guó)宇航員必須要學(xué)中文。
因?yàn)橹袊?guó)空間站上所有按鈕,通知,說(shuō)明都是中文,如果不學(xué)習(xí)中文,根本沒(méi)辦法在中國(guó)的空間站里工作。
中國(guó)的機(jī)器人和機(jī)器狗在外國(guó)熱賣(mài),這些外國(guó)用戶(hù)為了指揮機(jī)器狗,也會(huì)跟著說(shuō)明書(shū)學(xué)習(xí)中國(guó)指令。
這就是科技實(shí)力帶來(lái)的影響,越來(lái)越多人的在學(xué)習(xí)中文。
抄襲DeepSeek?OpenAi o3-mini被曝使用中文進(jìn)行推理
金融界2025-02-04
OpenAI的o1模型推理時(shí)蹦出中文 專(zhuān)家猜:AI可能只想用最高效的語(yǔ)言來(lái)思考
華爾街見(jiàn)聞
2025-01-15
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.