聰明如你,請做題:
一個盲人有5雙白襪子和5雙黑襪子,除了顏色差異,其它一模一樣,弄混了,請問如何分開?
這是一個簡單而有啟示的智力題。
答案很簡單:拿到太陽下去曬。????
在陽光下,黑襪子吸熱更快,所以通過觸摸,盲人可以感知到襪子的溫度差異,從而將白襪子和黑襪子分開。
最初,盲人只能通過觸摸襪子的材質(zhì),但無法區(qū)分顏色。因此,我們可以引入“溫度”這個維度,通過陽光加熱,創(chuàng)造了一個新的識別維度(溫度差)。
這就類似于在復(fù)雜問題中引入額外的信息維度,以便更好地理解問題。
我曾經(jīng)寫過“灰度認(rèn)知,黑白決策”,本文像是下聯(lián)。
順著這一點(diǎn),我想談及信息的“維度”。
最有名的“升維思考”,也許是愛因斯坦的相對論。???
在牛頓物理學(xué)中,我們處理的通常是三維空間中的物體運(yùn)動,時間是一個獨(dú)立的量。
但愛因斯坦在狹義相對論中提出了一個全新的框架,稱為四維時空,將時間和空間視為相互關(guān)聯(lián)的統(tǒng)一結(jié)構(gòu)。
在廣義相對論中,物質(zhì)和能量會彎曲時空,而物體在彎曲時空中的運(yùn)動實際上是沿著時空曲線運(yùn)動。
由此,人類對物理世界有了更加精確的解釋。
就你我而言,我們究竟是如何理解這個世界的?我們?nèi)绾闻袛嘁粋€未知的事物?我們?nèi)绾卧谛畔⒉怀浞值那闆r下做出決策?????????
也許每個人都是如盲人摸像一般,通過不同角度的特征做出推斷。????
了不起的高手,往往比普通人有更高的認(rèn)知維度,例如圍棋天才獨(dú)具的“感覺”,楊振寧推崇的“Taste”。??????????
AI通過降維簡化問題,通過升維來揭示更多的隱藏信息,這一點(diǎn)在深度學(xué)習(xí)的領(lǐng)域產(chǎn)生了神奇的效果,以至于機(jī)器可以獲得8年前人類還自以為獨(dú)具的“感覺”。??
在大模型時代,AI借助于算法、算力和數(shù)據(jù),獲得了在某些方面超越人類的“高維思考”能力。
而此時,人類的聯(lián)想和提問能力,就像是構(gòu)建一個維度,或是在大模型的向量空間里,勾出一段彩虹。
就像扔出一個骰子,對于未來的可能性,我們要升維思考,考慮6個面的概率,可結(jié)果只有一面。???????????
這大概是“升維思考、降維行動”的一個簡單隱喻。
《人工智能:現(xiàn)代方法》說:
?人工智能(artificial intelligence,AI)領(lǐng)域不僅涉及理解,還涉及構(gòu)建智能實體。這些智能實體機(jī)器需要在各種各樣新奇的情況下,計算如何有效和安全地行動。
我們需要理性思考,也需要理性行為,尤其要在“存在不確定性時取得最佳期望結(jié)果而采取行動。”
升維思考與灰度認(rèn)知,都和概率論有關(guān),再加上基于時間的與外部環(huán)境的互動,貝葉斯定律常常現(xiàn)身其中。?????????
更現(xiàn)實一點(diǎn)的場景是:對于一個投資者,需要升維思考。例如芒格的多元思維模型。但是他的模型是通過多個維度的證偽,來切割出鉆石的。--本文提及的樸素貝葉斯分類,底層的原理(可感知的那部分)是想通的。????
而行動本身,往往是降維的。
從數(shù)學(xué)的角度看,我們需要一個(相對)最優(yōu)概率;???
從物理的角度看,系統(tǒng)需要(相對)最低勢能狀態(tài);?????
從決策的角度看,人類必須采取行動并接受一個黑白分明的結(jié)果。
多面骰子在空中飛舞,最終只能選擇一面朝上。
投資者最終需要做出“買或不買、賣或不買”的決策,而且行動越少越簡單越好。
降維行動的例子:京東說要“多快好省”,拼多多只要一個“省”。????
那些大事不糊涂的人,那些過得不錯并且還能輕松的人,大多是在維度上取得了勝利。
現(xiàn)在做事不容易,許多行業(yè)和公司都在談“轉(zhuǎn)型”。但是,如果沒有維度上的突破,可能只是在原路上瞎撲騰。
活在二維世界里的生物的死局,往往要靠超越維度來破解。?
“井底之蛙”看似是關(guān)于視野的隱喻,其實是關(guān)于維度的類比。
本文從一個我喜歡的智力題開始,將毒酒問題的二進(jìn)制解法,類比為更高維度的勝利。??????
類比可能是鮮活的,但絕不嚴(yán)謹(jǐn)。甚至于在文章的推進(jìn)過程中,升維和降維都會出現(xiàn)一些概念的交錯。
類比和隱喻都是思考的腳手架,請你能用且用,用完后記得拆除。
更廣闊的意義上,每個人都是全體人類的一個維度。
所以,請活出你自己。
一
讓我們從一道有趣的題開始:
國王有一百桶酒,比自己的生命還重要。結(jié)果有一天其中一桶被投了慢性毒藥,喝了以后半個小時就會死掉。國王大怒,命令玩忽職守的侍衛(wèi)去試毒。酒不能被混合,一個侍衛(wèi)可以喝多桶酒,一桶酒也可以由多個侍衛(wèi)喝。
請問:怎么樣才能用最少的侍衛(wèi)、在半小時內(nèi)知道哪桶是毒酒?
解法1:一維法
最簡單的方案,是讓每個人試一桶酒,用時30分鐘,就可以判斷出哪一桶酒有毒。
這個是“一維”的直線思維,在現(xiàn)實生活中也未嘗不可,好過什么都不干。
這樣的解法,答案是:99個人。
解法2:二維法
從二維層面去思考,引入笛卡爾的坐標(biāo)。
把100桶酒擺成10??10的矩陣,如下:
接下來:
讓阿拉伯?dāng)?shù)字編號的1號侍衛(wèi)(如上圖,黃色),把第1行酒每桶喝一口,一直到10號喝第10行;
讓漢字編號的一號侍衛(wèi),把第一列酒每桶喝一口,一直到十號喝第十列;
由于坐標(biāo)的定位功能,假如毒酒在圖中綠色的位置,那么3號侍衛(wèi)和二號侍衛(wèi)都會死,自然可以鎖定毒酒的位置。
但是因為第10行和第十列可以不用安排人,也能獲取信息,所以可以減少兩個人。?????
這樣的解法,答案是:18個人。
解法3:三維法
能否再延伸至三維層面去思考呢?
我們很容易想到,搭建一個5??5??4的三維模型,正好有100個位置放酒,如下:
接下來(和二維解法差不多):
讓阿拉伯?dāng)?shù)字編號的1號侍衛(wèi)(如上圖,黃色),把黃色箭頭這一面墻的酒每桶喝一口,一直到5號喝第5面墻;
讓漢字編號的一號侍衛(wèi)(如上圖,橙色),把橙色箭頭這一面墻的酒每桶喝一口,一直到五號喝第五面墻;
讓字母編號的a號侍衛(wèi)(如上圖,藍(lán)色),把藍(lán)色箭頭這一層的酒每桶喝一口,一直到d號喝第四層;
同理,通過三個維度,也可以鎖定毒酒的位置;
以及,每個維度都可以少一個人。??
這樣的解法,答案是:11個人。
最笨的方法1,會死一個侍衛(wèi);方法2會死兩個(或1個,或零個),方法3會死三個(或兩個,或一個,或零個),總之一個維度需要獲取一個信息,可能會死一個,或者提供零的信息。
所以題目中有含糊的地方,到底是用最少的侍衛(wèi),還是死最少的侍衛(wèi)?考慮到國王的殘酷,我們姑且認(rèn)為是前者。
然而,即使聰明如你想明白了上面三個維度的解法,還是沒有找到最優(yōu)答案。
解法4:二進(jìn)制
如果用計算機(jī)的思維來分析這個問題,那么首先考慮如何存儲這100桶酒。100桶酒可以用二進(jìn)制7個比特來表示(2的7次方>100)。
上面的解法1到解法3,都是用100個位置存儲100桶酒,只是描述位置的坐標(biāo),從一維到三維,效率越來越高,所以用的侍衛(wèi)越來越少。
如果用二進(jìn)制呢?
二進(jìn)制,是逢二進(jìn)一的計數(shù)編碼方法,只有0和1兩個數(shù)碼。那到了2怎么辦?只有往前進(jìn)一位,變成10。
所以,十進(jìn)制的2、3、4、5,二進(jìn)制分別表示為10、11、100、101。二進(jìn)制廣泛應(yīng)用于電子計算機(jī)的數(shù)據(jù)處理。
回到我們的題目,計算如下:
第一步:對于每一桶酒的二進(jìn)制表示,編碼后,最長的數(shù)字是7位數(shù),不足七位前面用0表示;
1號桶是0000001,
2號桶是0000010,
3號桶是0000011,
4號桶是0000100,
100號桶是1100100;
第二步:可以找七個侍衛(wèi),從左到右,編號“一”至“七”,每人對應(yīng)一個位數(shù),從第一位到第七位。
第三步:負(fù)責(zé)第一位數(shù)的侍衛(wèi)“一”,只要這100桶酒中,二進(jìn)制編碼的該位數(shù)對應(yīng)的數(shù)字是1,則喝掉此桶酒。
如此類推,每個侍衛(wèi)喝掉他所負(fù)責(zé)的位數(shù)上數(shù)字是1的酒。
第四步:30分鐘后,侍衛(wèi)按照“一”至“七”,死掉的置為1,活著的置為0。
例如,假如第七桶酒為毒酒,其二進(jìn)制編碼是0000111。那么按照上面的喝酒規(guī)則,其五、六、七位都是“1”,所以編號五、六、七的侍衛(wèi)都會死。
前四個侍衛(wèi),遇到這瓶毒酒,因為對應(yīng)的數(shù)字是0,所以都會活。
二進(jìn)制的0和1,正好對應(yīng)了活和死。
根據(jù)7個侍衛(wèi)喝酒后半小時的生死狀態(tài),能夠得出毒酒的二進(jìn)制編碼。
這樣的解法,答案是:7個人。
以下,請允許我從一個非專業(yè)人士的“感知”的角度,來說說這道題的啟示:
1、第一種方法,是簡單的線性搜索;
2、第二、第三兩種方法,是增加了維度的線性搜索,可以理解為交叉搜索,等價于坐標(biāo)系;
3、前三種解法,維度越高,效率也就越高;
4、因為有“半小時”的時間約定,所以不能用簡單的二分法來解答。所以,第四種解法用二進(jìn)制為100瓶酒編碼,進(jìn)而用0和1對應(yīng)不喝與喝(也對應(yīng)了撞見毒酒后的生和死)。
5、那么第四種用二進(jìn)制的解法,是否可以理解為“7維”的解法?
第一種解法有1個維度,該維度上有100種可能。這其中的99種,每種可能都需要1個侍衛(wèi)去通過喝酒“消除不確定性”;
第二種解法有2個維度,每個維度上有10種可能,每種可能都需要1個侍衛(wèi)去通過喝酒“消除不確定性”,然后這兩個維度的交叉點(diǎn),就是毒酒的位置;
第四種解法有7個維度,每個維度上有兩種可能,每兩種可能,只需要1個侍衛(wèi)去通過喝酒,就可以“消除不確定性”。于是,這七個維度的交叉點(diǎn)(表述為一串二進(jìn)制數(shù)字),就是毒酒的位置。
在這道題目中,使用二進(jìn)制編碼的策略是核心。通過將100桶酒編碼為7位二進(jìn)制數(shù),我們能夠用最少的侍衛(wèi)(7個)來解決問題。
這種方法背后的原因是二進(jìn)制的指數(shù)效應(yīng):每增加一位二進(jìn)制位,就可以表示更多的狀態(tài),極大地減少了解決問題所需的資源(在這個例子中是侍衛(wèi)的數(shù)量)。
相比于簡單的線性搜索,二進(jìn)制讓我們進(jìn)入了一個更高效的“維度”空間。
在這個空間里,每個侍衛(wèi)只需要判斷一個“0”或“1”的狀態(tài),就能為100桶酒中的每一桶賦予唯一的二進(jìn)制編碼。
這種策略不僅有效地消除了不確定性,還展示了通過增加維度解決問題的力量。
這一過程展現(xiàn)了升維和降維的相互配合:
升維思考:通過引入多個侍衛(wèi),每個侍衛(wèi)相當(dāng)于引入了一個新的維度,讓我們能夠從更多角度捕捉信息。
降維行動:通過侍衛(wèi)生死的二值化狀態(tài),我們將所有復(fù)雜性壓縮為一串二進(jìn)制信息,這一信息指向毒酒的唯一桶號。
二
在上面遞進(jìn)的解體過程中,將二進(jìn)制的方法,類比為7維,是一個有趣的想法。???
進(jìn)而,我們可以用一種更直觀的方式,來闡述“升維思考、降維行動”。??
我喜歡用可感知的思考來理解一些概念,而不是單靠文字本身的解釋。?
讓我們再來看一道有趣的題目,以感知“維度”。
有三盞白熾燈泡和三個開關(guān),每個開關(guān)控制一盞燈泡,但你不知道哪個開關(guān)對應(yīng)哪個燈泡。
你可以進(jìn)入一個房間控制開關(guān),但燈泡在另一個房間,你只能進(jìn)入燈泡房間一次來檢查結(jié)果。
如何在最短時間內(nèi)確定每個開關(guān)對應(yīng)的燈泡?
聰明如你,即使知道答案,也不妨從維度的角度重新思考一遍。?
難題在于,開和關(guān)只有兩個維度,要想界定出三個燈泡,必須創(chuàng)造出一個新的維度。
白熾燈的另外一個屬性是發(fā)熱,所以可以引入“冷熱的維度”。
解決方法:
打開第一個開關(guān),保持它打開。
打開第二個開關(guān)一段時間后關(guān)閉它。
保持第三個開關(guān)關(guān)閉。
然后進(jìn)入燈泡房間檢查燈泡:
點(diǎn)亮的燈泡對應(yīng)第一個開關(guān)。
熱的但不亮的燈泡對應(yīng)第二個開關(guān)。
冷的并且不亮的燈泡對應(yīng)第三個開關(guān)。
這三種狀態(tài)相當(dāng)于在這個系統(tǒng)中添加了不同的維度:
亮/不亮的維度:開關(guān)是否正在控制燈泡。
熱/不熱的維度:燈泡是否曾被打開過但關(guān)閉。
冷/熱的維度:燈泡的物理狀態(tài)(熱與冷)提供了額外的信息。
上面的冷和熱,也是與時間的維度關(guān)聯(lián)的。
事實上,精確而言,如上方法應(yīng)該能夠識別出四個燈泡。你覺得呢?
三
用類比和隱喻的方式,來表達(dá)一些主題,有“生動性”的優(yōu)點(diǎn),也有不精確的缺點(diǎn)。
再次聲明,請你務(wù)必僅僅將其視為理解和感知的腳手架。???????
讓我們回到數(shù)學(xué)和物理。
1854年,黎曼在哥廷根大學(xué)發(fā)表的演講改變了數(shù)學(xué)和物理學(xué)的進(jìn)程。他引入了一個革命性的概念:高維幾何學(xué),推翻了歐幾里得幾何的傳統(tǒng)觀念。
(圖片來自網(wǎng)絡(luò))
在歐幾里得幾何中,空間是平坦的,二維或三維的,而黎曼發(fā)現(xiàn)了空間的彎曲性質(zhì),提出可以通過引入更高維度來解釋自然界的現(xiàn)象。
黎曼的幾何學(xué)不僅改變了數(shù)學(xué)的基礎(chǔ),也為物理學(xué)提供了新的工具。
尤其是在1915年,愛因斯坦借助黎曼的幾何學(xué),提出了廣義相對論,用四維時空的彎曲來解釋引力。黎曼的思想啟發(fā)了后來的科學(xué)家,使他們進(jìn)一步探索更高維的宇宙。
歐幾里得幾何學(xué)認(rèn)為兩點(diǎn)之間的最短距離是直線,而黎曼指出,這個定律只適用于平坦空間。
在彎曲空間中,比如球面上,兩點(diǎn)之間的最短路徑是曲線。黎曼通過引入“度規(guī)張量”這一工具,能夠精確描述空間在每一點(diǎn)的彎曲程度。
這一創(chuàng)新讓科學(xué)家可以用數(shù)學(xué)來描述任何維度的空間,無論是平坦的還是彎曲的。
更令人驚嘆的是,黎曼的理論揭示了“力”可能只是空間幾何變形的結(jié)果。
比如,當(dāng)我們在三維空間中感受到引力時,實際上是因為空間在我們感知不到的第四維中發(fā)生了褶皺。這一概念為將來用高維幾何學(xué)統(tǒng)一所有物理定律鋪平了道路。
高斯較早前已經(jīng)提出了平面“書蟲”的思想實驗,黎曼進(jìn)一步將其擴(kuò)充:
如果一張紙上生活著二維生物,把它們生活的紙褶皺之后,它們依然會覺得世界是平的,但當(dāng)它們在褶皺的紙上運(yùn)動時,它們就會感到一股看不見的“力”阻止它們沿直線運(yùn)動。
黎曼幾何不僅讓愛因斯坦能夠理解引力的本質(zhì),還讓他開始思考,其他的自然力是否也是時空在更高維度中的褶皺結(jié)果。
這種思維方式為后來物理學(xué)家嘗試統(tǒng)一電磁力、弱力和強(qiáng)力奠定了理論基礎(chǔ),并成為現(xiàn)代超弦理論的先聲。
黎曼還提出了“黎曼切口”的假設(shè),在這一模型中,兩張紙代表兩個不同的二維曲面,切口則是這兩個曲面之間的通道。
(圖片來自《超空間》)
二維的“書蟲”在自己的世界里是無法察覺到這個切口的存在的,但如果它無意中進(jìn)入切口,就會突然出現(xiàn)在另一個曲面上。
這個切口是它們在二維世界中無法理解的,而在更高維度的觀察者眼中,這個過程卻是可以輕松解釋的。
黎曼切口可以看作是后來物理學(xué)家提出的“蟲洞”概念的早期雛形。蟲洞是一種理論上連接不同空間或時空的橋梁,可以讓物體穿過極端彎曲的時空區(qū)域,在看似瞬間移動到另一個位置,甚至是另一個時空。
在愛因斯坦的廣義相對論框架下,黎曼切口的思路進(jìn)一步發(fā)展,成為探索時空結(jié)構(gòu)和多連通空間的一種方式。
物理學(xué)家馬里特10歲的時候,33歲的父親就去世了。他一直渴望建造一臺時光機(jī)器。從物理學(xué)的角度看,“蟲洞”是實現(xiàn)時光旅行的一種方法。
神秘的時間之箭。
你還記得上面那兩個智力題嗎?靠溫度差別來區(qū)分的燈泡和襪子,依然要靠時間來實現(xiàn)。?????
溫度,熱力學(xué),時間,我們似乎隱隱約約能看到玻爾茲曼的身影。
四
在電影《星際穿越》中,導(dǎo)演克里斯托弗·諾蘭通過五維空間的設(shè)計來表現(xiàn)時間、空間和平行宇宙的概念,尤其在影片結(jié)尾,主人公庫珀進(jìn)入的“Tesseract”(超立方體)成為了關(guān)鍵場景之一。
四維的時空,建立在愛因斯坦的理論之上,過去、現(xiàn)在和未來是“平鋪”著的。時間是四維生物能夠感知到的某種“實體”,就像我們對二維世界生物的某種優(yōu)勢。
電影里的小布蘭德博士對此這樣解釋:“過去是可以穿行的峽谷,未來是可以攀爬的山峰”。
諾蘭加入的第五個維度,是平行宇宙的概念。
五維空間不僅包含了四維時空,還包括了不同可能性的存在,反映了量子力學(xué)中關(guān)于平行宇宙的理論。
這意味著,在五維空間中,可以同時訪問不同時間節(jié)點(diǎn)和不同的空間狀態(tài)。
(圖片來自網(wǎng)絡(luò))
在我們?nèi)粘5母兄校澜缢坪跏蔷€性的:我們生活在一個三維的空間中,并經(jīng)歷時間的流逝。
然而,物理學(xué)中存在一種更為復(fù)雜的理論——如果有第五維度存在,并且這個維度代表的是平行宇宙,那么我們的宇宙可能只是這些平行宇宙中的一個“投影”。
想象一下,所有的量子事件、選擇和行為就像擲骰子。
每次擲骰子,骰子會展示一個面,這是我們所感知到的“現(xiàn)實”。但在更高維度的五維空間中,骰子的其他面仍然存在,意味著還有無數(shù)可能的結(jié)果。
平行宇宙理論認(rèn)為,每一種可能的量子狀態(tài)都對應(yīng)著一個新的宇宙,因此我們當(dāng)前的宇宙只不過是五維空間中無數(shù)可能性之一的“坍縮”結(jié)果。
這種理論被稱為多世界詮釋,它告訴我們,每一次選擇和量子事件都可能創(chuàng)造一個平行宇宙。
我們的四維現(xiàn)實——即三維空間加一維時間——是這無數(shù)可能性的其中之一。
就像骰子在擲出后展示的某一面一樣,我們的宇宙是基于概率選擇的,其他可能性雖然存在,但我們無法直接觀察到它們。
這為我們提供了一個深刻的視角:我們所體驗到的世界,或許只是無數(shù)可能世界中的一個,而真正的“全貌”還隱藏在更高維度的神秘之中。
五
人類到底是如何理解這個世界的?
什么叫“看到”?
又有什么可以稱為“知道”?
而在休謨看來,“人類心靈中的一切素材,不管是簡單的還是復(fù)雜的,不管是具體的還是抽象的,都無一例外地來自人的感覺經(jīng)驗。”
他有一段杠精似的驚人陳述:??
實體(substance)觀念是從感覺印象得來的呢,還是從反省印象得來的呢?如果實體觀念是從我們的感官傳給我們的,請問是從哪一個感官傳來的,并以什么方式傳來的?
如果它是被眼睛所知覺的,那么這個觀念必然是一種顏色;如果是被耳朵所知覺,那么它必然是一種聲音;如果是被味覺所知覺,那么它必然是一種滋味;其他感官也是如此。
但是我相信,沒有人會說:實體是一種顏色,或是一個聲音,或是一種滋味。因此實體觀念如果確實存在,它必然是從反省印象得來的。但是反省印象歸結(jié)為情感和情緒,兩者之中沒有一個能夠表象實體。
因此,我們的實體觀念,只是一些特殊性質(zhì)的集合體的觀念,而當(dāng)我們談?wù)搶嶓w或關(guān)于實體進(jìn)行推理時,我們也沒有其他的意義。
在“看到”一物時,我們不僅僅是接收光線,還通過經(jīng)驗和知識賦予這個物體意義。
看到一棵樹,我們不僅識別出形狀和顏色,還通過記憶理解這是一棵樹,它可能有著生長、開花、落葉等屬性。
“知道”是一種更復(fù)雜的認(rèn)知過程。我們不僅依靠感官“看到”事物,還要通過思維、推理、記憶和反思來理解事物。
知識的獲取過程常常基于經(jīng)驗:我們通過觀察、思考、學(xué)習(xí)、互動等方式形成對世界的理解。
然而,這種知識是否真實或完整?
《科學(xué)之死》一書對此解讀道:
蘋果很常見,很多人都愛吃,但蘋果是什么東西呢?首先,從感官經(jīng)驗的角度,我們可以說蘋果是紅的、圓的、甜的、脆的、硬的、能解渴的、能充饑的等等;
其次,除此之外,人們一般還會認(rèn)為,有一個實體性的東西承載著所有感官告訴我們的這些性質(zhì),而這個實體性的東西才是真正的“蘋果”。
休謨的意思是,事實上人們對蘋果的認(rèn)識只能限于上述的第一個階段,至于說是不是有一個實體性的“蘋果”存在,人們是一無所知的,因為這個實體沒有在人的感官當(dāng)中引起任何印象。
經(jīng)驗主義的另一位代表人物洛克提出,知識的來源有兩種:
外部感官經(jīng)驗(通過五感獲取的信息)和內(nèi)在反思經(jīng)驗(對心靈自身活動的反思)。
感官經(jīng)驗幫助我們接觸外部世界的事物;
反思經(jīng)驗則是通過觀察我們自己的思維過程來理解抽象概念。
為了解釋我們?nèi)绾瓮ㄟ^感知理解物質(zhì),洛克提出了物質(zhì)的第一性質(zhì)和第二性質(zhì)的區(qū)分。
第一性質(zhì):這些是物體固有的屬性,它們獨(dú)立于觀察者的感知存在。無論有沒有人感知,這些性質(zhì)都客觀存在,如物體的形狀、大小、堅硬度、重量、密度等。
洛克認(rèn)為,這些性質(zhì)是物體本身構(gòu)成的一部分,任何物質(zhì)都具有這些性質(zhì)。
第二性質(zhì):這些性質(zhì)是物體在與感知者互動時產(chǎn)生的,它們依賴于觀察者的感官才能存在,如顏色、味道、氣味和聲音等。
洛克認(rèn)為,第二性質(zhì)并不直接存在于物體中,而是通過第一性質(zhì)的作用在感官中產(chǎn)生的感覺。例如,顏色并不是物體本身的固有屬性,而是光線與物體表面的相互作用在我們眼中產(chǎn)生的結(jié)果。
人類如何識別一個蘋果?
按照洛克的理論,當(dāng)我們面對一個蘋果時,我們的感官通過接觸蘋果的不同性質(zhì)來認(rèn)識它。
第一性質(zhì):形狀,重量,硬度等等;
第二性質(zhì):味道,口感,氣味,甚至顏色,等等。
(圖片來自網(wǎng)絡(luò))
以我們“早熟”的哲學(xué)習(xí)慣,看到洛克和休謨的觀點(diǎn),會感覺非常幼稚,極其啰嗦,這有啥用???????
的確有用。
接下來,我們看一下,AI如何識別出一個水果。
六
延續(xù)洛克樸素而直白的思想,我們識別一個蘋果,是根據(jù)其性質(zhì),將其與別的物體、別的水果區(qū)別開來,這是一個分類的過程。?
洛克和休謨杠精似的哲學(xué)背后,是對因果論的懷疑,是“人類知道自己不知道”的關(guān)鍵一步。?????
盡管被休謨們斬斷了因果的“必然”幻覺,但世界的推理并沒有因此而終止。捍衛(wèi)上帝這一最大“因”的虔誠教士貝葉斯,用自己的數(shù)學(xué)天賦造出了一架懸梯。???
現(xiàn)在,假設(shè)我們造出了一個初級的機(jī)器人,我們?nèi)绾谓虝R別水果??
這個機(jī)器人沒有任何人類的常識和經(jīng)驗,也因此沒有任何“我以為我知道的幻覺”。
它只能像洛克所說的那樣,如同一張白紙,一點(diǎn)點(diǎn)學(xué)習(xí)。?
現(xiàn)在,我們把一個未知水果放在它面前,已知它只能知道三個基本特征:
顏色是黃的,味道是甜的,形狀是長的。??
這個問題對人類來說很簡單。可是對于機(jī)器智能,或者是對于一個初生的孩子,都是個難題。不要嘲笑,在那些我們并不熟知的領(lǐng)域,我們還不如這個初級的機(jī)器人。???????
黃色的可能是任何一種水果;
甜味兒是個很主觀的概念,有些人覺得酸甜就不是甜;
長是一個相對概念,還是絕對概念??
總之,一切都很模糊,條件十分不充分,但我們必須做出判斷。--這和我們的現(xiàn)實世界非常像。?????
洛克和休謨對人類的提醒是,別認(rèn)為那些顯而易見的東西就是真相,別以為那些理所當(dāng)然的東西就是因果分明。???
所以,本質(zhì)而言,機(jī)器人的任務(wù),是在信息模糊的情況下,去猜測該水果最有可能是哪一種?
所謂可能,就是概率。
首先,我們要有最基本的信息,對人類而言是對“第一性質(zhì)”和“第二性質(zhì)”等客觀和主觀特征的觀察與統(tǒng)計,對機(jī)器人而言則是獲取數(shù)據(jù)和訓(xùn)練數(shù)據(jù)。?
(以下案例由網(wǎng)絡(luò)上未署名文章改寫)
假設(shè)我們收集了1000個水果的數(shù)據(jù),這些水果包括蘋果、香蕉和梨子。
每個水果都有三個特征:形狀(是否長)、味道(是否甜)、顏色(是否黃)。
現(xiàn)在,我們要用貝葉斯分類器來判斷一個新水果,它的特征是“長、甜、黃”。
(圖片來自網(wǎng)絡(luò))
從數(shù)據(jù)中,我們知道:
50%的水果是香蕉,30%是蘋果,20%是梨子。
80%的香蕉是長的,70%是甜的,90%是黃的。
蘋果中沒有長的,50%是甜的,100%是黃的。
50%的梨子是長的,75%是甜的,25%是黃的。
現(xiàn)在我們使用貝葉斯公式來計算這個新水果的可能性。
香蕉的概率:我們計算“長、甜、黃”的條件下,水果是香蕉的概率。
P(長甜黃|香蕉) = 0.8 * 0.7 * 0.9 = 0.504
P(香蕉|長甜黃) = 0.504 * 0.5 = 0.252蘋果的概率:蘋果沒有長的,所以概率為0。
P(長甜黃|蘋果) = 0 * 0.5 * 1 = 0
P(蘋果|長甜黃) = 0梨子的概率:
P(長甜黃|梨子) = 0.5 * 0.75 * 0.25 = 0.09375
P(梨子|長甜黃) = 0.09375 * 0.2 = 0.01875
接著,計算分母P(長甜黃):
P(長甜黃) = 0.252 + 0 + 0.01875 = 0.27075
最后計算后驗概率:
P(香蕉|長甜黃) = 0.252 / 0.27075 ≈ 93%
P(梨子|長甜黃) = 0.01875 / 0.27075 ≈ 7%
P(蘋果|長甜黃) = 0
因此,這個水果有93%的可能性是香蕉,7%的可能性是梨子,而不可能是蘋果。
在這個過程中,每一個特征(如顏色、形狀、味道)都可以看作是一個維度,而貝葉斯分類器通過將這些維度結(jié)合起來,從不同的角度對水果進(jìn)行推斷和分類。
這種方法本質(zhì)上是對多維信息的整合,通過各個維度上的信息貢獻(xiàn)來計算某種結(jié)論出現(xiàn)的概率。
機(jī)器人費(fèi)了很大力氣,才計算出一個概率,而人類也許不需要一秒鐘就能夠識別。???????
然而,就像一個孩子學(xué)下棋之處顯得很傻,但是可能只需要三個月就能夠戰(zhàn)勝下了三十年臭棋的成年人。
洛克是對的。但是,他的懷疑,并不影響人類基于不完全信息來推斷未來。
機(jī)器通過算法,例如貝葉斯推理,模擬了人類的推理過程,經(jīng)驗主義的理念在今天的數(shù)字化時代展現(xiàn)出強(qiáng)大的生命力和影響力。
洛克和休謨的深刻思考,盡管在當(dāng)時或許被視為繁瑣的哲學(xué)辯論,卻為現(xiàn)代人工智能的核心邏輯奠定了基礎(chǔ)。
經(jīng)驗主義并沒有止步于哲學(xué)課堂,而是通過現(xiàn)代技術(shù)的實現(xiàn),重新在硅谷和全球科技前沿?zé)òl(fā)出新的火焰。
七
一切皆可計算
有時信仰束縛人的思想,有時信仰令思考者更加狂放。?
對上帝的堅信,令牛頓在“解釋宇宙”的時候,不會因為因果鏈條的某些缺失而停頓。??
既然有“上帝”設(shè)計一切,他只管去探尋設(shè)計的規(guī)則就好了。引力到底是如何產(chǎn)生的?與距離的平方成反比到底是個什么東東?牛頓絕不糾結(jié)于探索路途中的“無知”,亦不因此陷入虛無主義。?????
愛因斯坦是未知論者,所以他要借助于斯賓諾莎的“萬物之神”的力量。
而辛頓則有賴于“差異化的信仰”,用一生去賭相當(dāng)長時間內(nèi)毫無希望的神經(jīng)網(wǎng)絡(luò)。
萊布尼茲更復(fù)雜一些。他相信這個世界是所有可能世界中最好的一個,但什么是“所有可能的世界”?難道上帝在扔骰子嗎?難道已知的宇宙還有另外的選項嗎?
一方面相信“神的目的”,另外一方面,萊布尼茲則相信機(jī)械論的宇宙,并且這個宇宙是由不可再分的“單子”組成的。而令所有這些彼此不受影響的單子,經(jīng)由上帝的算法,如鐘表般穩(wěn)妥地運(yùn)行著。
理性主義的萊布尼茲作為十七世紀(jì)的全才,他發(fā)明了微積分,提出了二進(jìn)制,制造出世界上第一臺能做加減乘除的計算機(jī)器。
萊布尼茲堅信,能夠建立起一種普遍的方法,“把一切正確的推理歸結(jié)為一種計算”,這一思想成為現(xiàn)代計算機(jī)科學(xué)和人工智能的遠(yuǎn)祖,預(yù)示了“一切皆可計算”的未來。
離散與組合?
如同原子論或者微積分的思想,計算機(jī)科學(xué)和人工智能通過將復(fù)雜問題拆解為簡單的、低維的元素(0和1),然后再通過組合形成多維空間來解決更復(fù)雜的問題。
計算機(jī)通過將一切信息,無論是文本、圖像、聲音還是視頻,都拆解為0和1的序列。
每一個0或1代表一個比特位,計算機(jī)通過這些比特位的組合,可以表示任何復(fù)雜的數(shù)據(jù)或結(jié)構(gòu)。
這種拆解和組合的能力,是計算機(jī)處理復(fù)雜問題的核心。
就像在數(shù)學(xué)的微積分中,連續(xù)的函數(shù)被分解成無數(shù)個小的微小變化(微分),從而能夠精確地理解和計算變化的累積效果,計算機(jī)科學(xué)的核心也是通過二進(jìn)制(0和1)來表示離散信息,并進(jìn)行高效的處理。
以圖像數(shù)據(jù)為例,計算機(jī)將圖像的每一個像素拆解為數(shù)值表示,其中每個像素的顏色信息通常以RGB通道表示。
對于一張224x224的彩色圖像,它的表示形式為一個三維張量:224 x 224 x 3,其中:
224x224是圖像的高度和寬度,表示每個像素的空間位置。
**3個通道(RGB)**代表每個像素的顏色強(qiáng)度(紅、綠、藍(lán))。
每個像素的顏色值本質(zhì)上也是由0和1組成的二進(jìn)制數(shù)字,這些數(shù)字通過不同的強(qiáng)度值(通常是0到255的范圍)來編碼顏色。
如上,這是將一維的比特組合成更高維的空間,從而能精確表示顏色、位置等信息。
這種構(gòu)建方式類似于通過多維度理解現(xiàn)實問題,AI也能夠通過維度的擴(kuò)展與降維操作,更深入地解析復(fù)雜的現(xiàn)實世界。維度是處理復(fù)雜問題的關(guān)鍵工具。
分層處理機(jī)制???????
人工智能的起源可以追溯到公元前400年,哲學(xué)家如柏拉圖和亞里士多德提出,大腦在某種程度上類似于一臺機(jī)器,利用內(nèi)部語言編碼知識,通過邏輯推理選擇行動,這為人工智能的可行性奠定了思想基礎(chǔ)。
此后,數(shù)學(xué)家們引入了運(yùn)算邏輯和概率推理的工具,進(jìn)一步推動了對計算和算法的理解。
20世紀(jì)中期,AI開始從理論走向?qū)嵺`,隨著技術(shù)進(jìn)步,AI從最初的基于布爾邏輯的推理,逐漸轉(zhuǎn)向概率推理和數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)。
這一轉(zhuǎn)變顯著提升了AI的復(fù)雜問題處理能力,推動了實際系統(tǒng)的功能改進(jìn),并與其他學(xué)科深度融合,使人工智能逐漸成熟為一個多學(xué)科交匯的領(lǐng)域。
(以上概述參考了斯圖爾特.羅素的總結(jié)。)
在此過程中,深度學(xué)習(xí)之父辛頓扮演了重要角色。?????
辛頓此生對“神經(jīng)網(wǎng)絡(luò)”有一種偏執(zhí)狂般的投入。這個過程漫長而跌宕。????????
20世紀(jì)中期,神經(jīng)生物學(xué)家大衛(wèi)·休伯爾和托斯坦·威澤爾通過實驗揭示了大腦視覺系統(tǒng)的分層處理機(jī)制:
人類認(rèn)知過程被視為一種分層迭代、逐步抽象的過程。
辛頓受到的啟發(fā)是:大腦通過分層處理逐步提取信息,人工神經(jīng)網(wǎng)絡(luò)也可以模仿這一過程。
他意識到,神經(jīng)網(wǎng)絡(luò)可以像大腦那樣,使用多層結(jié)構(gòu)從低級特征(如像素或邊緣)到高級特征(如對象或面部識別)逐層抽象。
辛頓在1986年提出的誤差反向傳播算法,使多層網(wǎng)絡(luò)的訓(xùn)練成為可能,但其真正突破是在2006年,他通過“逐層預(yù)訓(xùn)練”有效地克服了深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練的困難。
深度學(xué)習(xí)的核心優(yōu)勢之一,是自動化的分層特征提取。
繼續(xù)我們自由的類比,深度學(xué)習(xí)可以自己發(fā)現(xiàn)維度,自己定義維度,甚至不用對人解釋--有些也解釋不了。????
傳統(tǒng)的機(jī)器學(xué)習(xí)依賴人工定義和選擇特征,而深度學(xué)習(xí)通過多層神經(jīng)網(wǎng)絡(luò)逐層自動學(xué)習(xí),提取數(shù)據(jù)中的高層次特征。
這一過程不需要人為介入,可以從低級信息(如像素、聲音波形)中逐步提取出更抽象的特征(如物體、語義)。這種自動化極大減少了特征工程的復(fù)雜性。
這像是一個逐步升維、從局部到全局的理解過程。
每一層的神經(jīng)網(wǎng)絡(luò)通過對低維度信息的處理和組合,提取出更高維的特征,最終形成對數(shù)據(jù)的全面認(rèn)知。
正如爬山、解謎、搭建樂高或繪畫的過程一樣,深度學(xué)習(xí)通過分層抽象,讓計算機(jī)能夠自動從簡單到復(fù)雜、從具體到抽象地理解世界。
高維向量??
在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)中,維度通常指的是特征空間的大小。
我們輸入的每一個數(shù)據(jù)點(diǎn)(無論是圖像、文本還是其他形式的輸入)都在一個高維空間中表示。
類似于毒酒問題中將100桶酒用7個二進(jìn)制位表示,在神經(jīng)網(wǎng)絡(luò)中,模型將復(fù)雜的輸入數(shù)據(jù)映射到一個更緊湊的表示空間中,確保通過最低的維度表示出最多的信息。
我們來通過一個實際的簡單例子,描述大模型和Transformer的工作原理。
假設(shè)我們要用一個Transformer模型來完成一個常見任務(wù):翻譯一句簡單的英文句子到中文。句子是:“I love cats.”
1. 輸入的準(zhǔn)備:將句子轉(zhuǎn)化為向量
Transformer模型不能直接處理文字,它需要將輸入的句子“I love cats.”轉(zhuǎn)化為向量(數(shù)字形式)。這一過程稱為詞嵌入(Word Embedding)。
詞嵌入的過程:每個詞都會被轉(zhuǎn)換成一個高維向量。例如,假設(shè)模型使用768維的向量,那么每個詞都會用一個768維的向量來表示。這些向量不僅僅是隨機(jī)數(shù)字,它們包含了詞的語義信息。例如,“l(fā)ove”和“l(fā)ike”在語義上相近,它們的向量可能相似。
因此,句子“I love cats.”被轉(zhuǎn)換為以下向量序列:
I → [0.5, 0.2, ... , 0.8](768維向量)
love → [0.3, 0.9, ... , 0.1](768維向量)
cats → [0.7, 0.4, ... , 0.2](768維向量)
通過將每個詞轉(zhuǎn)換成高維向量,模型可以更好地表示每個詞的復(fù)雜含義和它與其他詞之間的關(guān)系。
這就是升維思考的第一步:將簡單的文字映射到更高維度的空間,從而捕捉它們的復(fù)雜語義和語境信息。
2. Transformer的自注意力機(jī)制
接下來,Transformer模型 使用其核心機(jī)制——多頭自注意力機(jī)制 來處理這個向量序列。
自注意力機(jī)制幫助模型理解每個詞與句子中其他詞的關(guān)系,并為每個詞在句子中的重要性分配不同的權(quán)重。
自注意力機(jī)制會為每個詞計算它與句子中其他詞的關(guān)系。例如:
通過這種關(guān)系的計算,模型可以更好地理解整個句子的結(jié)構(gòu)和含義。
“I”和“l(fā)ove”有關(guān)系(主語和謂語)。
“l(fā)ove”和“cats”有關(guān)系(動詞和賓語)。
多頭自注意力機(jī)制:每個注意力頭關(guān)注句子中的不同關(guān)系。例如:
一個注意力頭可能專注于“l(fā)ove”和“cats”之間的關(guān)系。
另一個注意力頭可能專注于句子的整體結(jié)構(gòu),比如“主語—動詞—賓語”的模式。
這些注意力頭會從不同角度理解句子的每個詞,使模型能夠生成一個更全面的表示。
類比一下:我們可以將注意力機(jī)制類比為毒酒問題中的侍衛(wèi),每個侍衛(wèi)負(fù)責(zé)檢查一個特定的桶。
每個注意力頭就像一個侍衛(wèi),負(fù)責(zé)檢查輸入中的特定模式。最終,模型通過多個“頭”捕捉到句子中的豐富信息,類似于侍衛(wèi)通過喝酒推斷哪個是毒酒。
3. 基于概率的輸出生成
輸出生成是基于概率分布的。在每一步翻譯過程中,模型并不是直接生成一個確定的翻譯,而是計算每個可能翻譯的概率分布,并選擇概率最高的詞作為輸出。
例如,當(dāng)模型要翻譯“l(fā)ove”時,它會計算多個可能的翻譯,并生成以下概率分布:
模型會選擇概率最高的詞“愛”作為翻譯。
“愛” → 85%的概率
“喜歡” → 10%的概率
其他翻譯 → 5%的概率
最后,模型會輸出句子“我愛貓”。
概括而言,大模型之所以能夠在多個任務(wù)上表現(xiàn)出色,主要是因為它們通過大量數(shù)據(jù)學(xué)習(xí)到了豐富的高維表示。
這些表示能夠很好地捕捉輸入數(shù)據(jù)中的模式和復(fù)雜關(guān)系。
相比于傳統(tǒng)模型,大模型的高維表示具有更好的泛化能力,能夠在不同任務(wù)之間遷移學(xué)習(xí)。
為什么大語言模型像最聰明的人那些,能夠?qū)W習(xí)不同領(lǐng)域的知識,并且可以自由遷移????????
辛頓的解釋非常有趣:
這些大語言模型所做的是尋找共同的結(jié)構(gòu),通過發(fā)現(xiàn)共同結(jié)構(gòu),它們可以用更有效的方式對事物進(jìn)行編碼。
讓我給你一個例子,如果你問GPT-4"為什么堆肥堆和原子彈類似",大多數(shù)人都無法回答,他們認(rèn)為堆肥堆和原子彈是完全不同的事物。
但GPT-4會告訴你,雖然能量和時間尺度不同,但它們都涉及鏈?zhǔn)椒磻?yīng),當(dāng)堆肥堆越熱就會發(fā)熱越快,當(dāng)原子彈產(chǎn)生的中子越多,產(chǎn)生的中子就越快,所以它們其實都是鏈?zhǔn)椒磻?yīng)的形式。
許多人覺得大模型不過是在拼湊人類已有的知識,辛頓認(rèn)為這是錯誤的。對此我深感認(rèn)同。我最喜歡向ChatGPT問的問題,經(jīng)常與打比方有關(guān)。?????????????????
現(xiàn)實世界中,許多人假裝自己是聰明人,但是有兩點(diǎn)最難偽裝:打比方的能力,和幽默感。
辛頓認(rèn)為大模型能夠理解知識的本質(zhì)(至少是從人類角度定義的“本質(zhì)”),并且把“這種理解壓縮到了它的權(quán)重參數(shù)中”。
多模態(tài)
盡管語言模型已經(jīng)表現(xiàn)出相當(dāng)?shù)目臻g推理能力,但引入多模態(tài)處理將使這些模型獲得更深層次的理解和推理能力。
多模態(tài)模型整合了來自不同感官的信息源——如圖像、視頻、聲音、甚至機(jī)器人操作——這使得模型能夠不僅僅依賴語言來學(xué)習(xí)世界。
多模態(tài)模型使得機(jī)器可以像人類一樣,在更復(fù)雜的“維度”中進(jìn)行操作。?
例如,當(dāng)模型能夠通過視覺看到一個物體,并通過模擬或物理操作與該物體進(jìn)行交互,它就會更直觀地理解物體之間的空間關(guān)系和物理規(guī)律。
這種轉(zhuǎn)變相當(dāng)于將AI從一個符號處理的世界提升到了一個接觸現(xiàn)實的高維世界,從而讓AI更好地理解物理世界中那些難以用語言描述的復(fù)雜概念。
計算既是工具,也是理解世界的視角。
隨著AI技術(shù)的不斷發(fā)展,我們不僅在追求更強(qiáng)大的計算能力,更是在探索“何為智能”的本質(zhì)問題。
從萊布尼茲的普遍計算設(shè)想,到當(dāng)下的大模型和多模態(tài),世界似乎正在逼近一個神秘的邊界——那就是對世界的全面認(rèn)知,這認(rèn)知可能不僅僅來自算法,更或許是人類與機(jī)器在復(fù)雜維度中的共同演化與創(chuàng)造。
那么,人類正在逼近“上帝的算法”嗎?
八
以上“五、六、七”三節(jié),我們探討了人類如何理解世界以及何謂“看到”和“知道”。
休謨通過懷疑因果關(guān)系和實體的觀念,提出了經(jīng)驗主義的核心觀點(diǎn):
我們所有的知識都來自于感官經(jīng)驗。
人類在理解世界時,實際上是通過感官所獲取的印象,將這些印象進(jìn)行組合、記憶和反思,從而形成對事物的認(rèn)知。
而洛克則進(jìn)一步區(qū)分了第一性質(zhì)(物體的固有屬性)和第二性質(zhì)(通過感官與物體交互產(chǎn)生的屬性),為我們提供了一個系統(tǒng)的框架,解釋了人類如何通過經(jīng)驗識別和分類物體。
這種基于經(jīng)驗和感知的認(rèn)知方式,似乎為現(xiàn)代人工智能提供了某種隱喻——機(jī)器通過算法,尤其是大模型和神經(jīng)網(wǎng)絡(luò),也在執(zhí)行類似的感知任務(wù)。
機(jī)器學(xué)習(xí)模型不具備人類經(jīng)驗的復(fù)雜性,但它們通過多維特征的整合和分類,能夠在模糊信息中找到概率上的最佳解。
這種“經(jīng)驗”不再依賴于人類的主觀感受,而是通過龐大的數(shù)據(jù)和概率統(tǒng)計進(jìn)行決策。
隨著大模型的出現(xiàn),人工智能通過比特世界中的多維計算,在某種程度上復(fù)制了人類從經(jīng)驗中學(xué)習(xí)的過程。
就像我們在面對一個蘋果時,通過顏色、形狀、味道等特征將其歸類為一種特定的水果,機(jī)器也通過將復(fù)雜信息降維為高維向量來完成分類和推理。
貝葉斯推理等技術(shù)幫助機(jī)器在不確定性中進(jìn)行推斷,模擬了人類在因果關(guān)系模糊時依賴概率推理的方式。
然而,大模型帶來的不僅僅是經(jīng)驗的復(fù)制,它通過升維思考進(jìn)入了更高層次的智能探索。
大模型能夠通過多層神經(jīng)網(wǎng)絡(luò)提取出超越人類感知的特征,不僅是在我們所理解的空間內(nèi)“看到”世界,還能在我們無法直接感知的高維空間中進(jìn)行推理和決策。
正如我們前面所討論的,AI通過“高維空間”在信息上實現(xiàn)了穿墻破壁,仿佛成為了能夠超越感官局限的存在。
似乎只有“神”才可以如此。
從最初的人類經(jīng)驗主義出發(fā),我們通過大模型進(jìn)入了一個新的認(rèn)知維度,也標(biāo)志著人類對理解世界的新方式:
我們不僅依賴感官經(jīng)驗,通過數(shù)學(xué)和定律,經(jīng)由推理和實驗,還借助AI來拓展我們的認(rèn)知邊界,進(jìn)入那些我們無法直觀感知的高維領(lǐng)域。
AI能夠構(gòu)建出“上帝的算法”嗎?
或許,并非如此簡單。
盡管大模型能夠通過高維向量解析復(fù)雜的現(xiàn)實,捕捉無數(shù)的特征和模式,甚至超越人類的感知范圍,但它仍然受限于我們所提供的數(shù)據(jù)和算法規(guī)則。
我們所逼近的,并非上帝的視角,而是人類所能構(gòu)建的最復(fù)雜、最精確的理解工具。
在不斷的升維過程中,我們確實擁有了窺見更多維度的能力,但真正的“上帝算法”或許仍然超越我們所能觸及的范圍。
我們依然處于對宇宙深層次奧秘的探索階段。通過AI和大模型,我們能夠在多維空間中捕捉到更多的細(xì)節(jié),重點(diǎn)也許不是找到終極答案,而是維度的突破。
我個人的好奇之處是:
大模型以及之后的AI,是幫助人類完成愛因斯坦的一樣的宇宙認(rèn)知革命,還是說我們不再需要人類的知識結(jié)構(gòu)和因果推理?
畢竟,愛因斯坦是一位堅定的因果信徒。并非是他不接受概率化的方法,而是不相信上帝只是在扔骰子。即使是扔骰子,那是一顆什么樣的骰子?
即使是今天,大部分也無法理解愛因斯坦的相對論。
在相對論的框架中,愛因斯坦提出物質(zhì)不僅能影響空間,還能重塑四維時空。
《歡樂數(shù)學(xué)之瘋狂微積分》里有一個形象的比喻:
太陽并不像盒子里的保齡球那樣靜止不動,而是像床墊上的保齡球,壓在織物上,扭曲了周圍的時空區(qū)域。因此,當(dāng)一顆行星繞太陽運(yùn)行,或一個蘋果朝地球的方向墜落時,它們并不會陷入某種牛頓引力無法解釋的痛苦之中,只是在沿著阻力最小的路徑穿過一個彎曲的四維空間而已。
對此,物理學(xué)家約翰·惠勒總結(jié)道:
“物質(zhì)告訴時空該如何彎曲,而彎曲的空間則告訴物質(zhì)該如何運(yùn)動。”
也許,我們會用一種混合了碳基生物和硅基生物智慧優(yōu)勢的模式,繼續(xù)擴(kuò)展地球文明智慧的邊界。????????
一個簡單而生動的證據(jù)是:
理論上,一百萬只猴子胡亂敲打鍵盤,一定有一只能夠創(chuàng)作出莎士比亞的劇作。但是,這個時間卻要比宇宙的生命還要長。??????????
那么,為什么地球上會出現(xiàn)一個叫莎士比亞的人,創(chuàng)作出那么多劇作?
我的這個思想實驗,一定會有概率上的先后設(shè)定問題。即使如此,下面的答案依然是有利于人類的:?
因為莎士比亞并不是一個在鍵盤前隨機(jī)敲打的猴子,他是基于全體人類的一個知識模型來創(chuàng)作的,包括語言,符號,傳說......甚至可能還夾雜有尼安德特人在篝火旁的故事。所有的在地球上存活的人,都從概率的角度,幫助了一個叫莎士比亞的人消除了雜亂,100%地創(chuàng)作出偉大的作品。???????
也許人類的故事才剛剛開始。
在這一進(jìn)程中,許多時候,維度的突破可能會是關(guān)鍵。
從維度的角度,我們更容易理解愛因斯坦的那句名言:
我們不能用制造問題時同一水平的思維來解決問題。
(The significant problems we face cannot be solved at the same level of thinking we were at when we created them.)?
而所謂更高的水平,往往是基于維度的。
九
關(guān)于思維或者認(rèn)知的維度,我不打算做一些老生常談的陳述。??
我想談及三個關(guān)鍵詞:
厚薄、Taste、隨機(jī)。
厚薄
圍棋是最復(fù)雜的游戲之一,規(guī)則卻很簡單,在一個19??19的二維格子上,演繹出比宇宙間所有原子數(shù)量還要多的變化。???
一個圍棋高手最厲害的地方是什么?
他能夠從更高維度去理解一個局面。
20世紀(jì)最偉大的兩個棋手之一吳清源,在晚年提出了“六合”圍棋。????????
所謂“六合”,指的是四方(東南西北)和天地(上下)。
吳清源認(rèn)為:棋的一子一子必須和所有的方面相和諧,追求的是恰到好處地處于當(dāng)時的位置。
不止是重視中腹,六合之棋的“天地”之維度,超出了棋盤平面的二維世界。
在一個僅有二維的棋盤上,哪有什么天地呢????
他解釋說:子是有厚度和重量的。
所謂棋的厚與薄,外勢與實力,實質(zhì)上與時間有關(guān)。
圍棋很有趣--由于棋子并不具備可移動性(除非被吃),圍棋的過去和現(xiàn)在是被壓縮在一個坐標(biāo)化的棋盤上的。
我在人生算法里,說人生像是很多個切片串起來的。
圍棋則像是將這些切片層層疊放在一起。
這就是“厚”和“薄”。
理解并區(qū)隔圍棋的厚勢與實利,與許多重要的智慧“同源”。???
20世紀(jì)最偉大的兩個棋手之二李昌鎬,有一個被廣泛誤讀的名言:?????
我的每手棋只追求51%的效率。?????
也許這個話題值得另外寫一篇。對此我的一個簡單解構(gòu)是:???????
假如綠皮火車和高鐵一樣價格,你選哪一個?
除非你要體驗一下新奇或者懷舊,當(dāng)然是高鐵。????????????????
那么,假如有一手棋的效率是51%,另一手棋的效率是81%,如果代價是一樣的,為什么要選擇51%的,而不是81%的??????????????????
對于一個職業(yè)棋手而言,每一盤棋的目標(biāo)是非常明確的:
令“比對手至少領(lǐng)先半目”的結(jié)果概率最大化。???
李昌鎬也不例外。???
他所說的51%,其實是關(guān)于局部最優(yōu)和全劇最優(yōu)的取舍:
某一手棋A,就局部效率而言,是51%,全局效率是81%;??????????
另一手棋A,就局部效率而言,是81%,全局效率是71%。?
那么,當(dāng)然是選擇51%的A。???????????????????
李昌鎬尤其擅長在領(lǐng)先的局面下,迅速縮短戰(zhàn)線,把棋盤“變小”。他會主動走一些看起來不是最優(yōu)的招法,但是卻能消除掉那些不確定性因素,從而把優(yōu)勢變成了勝勢。????
吳清源和李昌鎬的秘密,都與愛因斯坦的四維時空宇宙觀有相通之處--????????
在圍棋這樣一個基于二圍棋盤的游戲中,他們比對手有著維度之上的碾壓優(yōu)勢。???????
這也是天才棋手和厲害棋手之間的最大區(qū)別所在。???
Taste??
楊振寧曾在紐約州立大學(xué)石溪分校遇到一個15歲的學(xué)生,這個孩子非常聰明,輕松地回答了他提出的幾個量子力學(xué)問題。
楊振寧接著問他:這些量子力學(xué)的問題,哪一個你覺得是妙的?
然而,他卻講不出來。“對他講起來,整個量子力學(xué)就像是茫茫一片。”
楊振寧對他的看法是:盡管他吸收了很多東西,可是他沒有發(fā)展成一個Taste。
什么是Taste?似乎模糊。
還是讓楊振寧來解釋吧:
“......學(xué)一個東西不只是要學(xué)到一些知識,學(xué)到一些技術(shù)上面的特別的方法,而是更要對他的意義有一些了解,有一些欣賞。
假如一個人在學(xué)了量子力學(xué)以后,他不覺得其中有的東西是重要的,有的東西是美妙的,有的東西是值得跟別人辯論得面紅耳赤而不放手的,那我覺得他對這個東西并沒有學(xué)進(jìn)去。“
楊振寧說在西南聯(lián)大七年,對他一生最重要的影響,是對整個物理學(xué)的判斷,已有自己的Taste。
接下來這些內(nèi)容稍顯多余,但是對于教育的啟示太大了:
楊振寧自幼喜愛觀察自然,表現(xiàn)出強(qiáng)烈的愛美之心與好奇心。
父親是數(shù)學(xué)家,楊振寧從小接觸數(shù)學(xué)書籍,打下了扎實基礎(chǔ)。
在西南聯(lián)大期間,受到名師教授數(shù)學(xué)、物理及中文閱讀與寫作。
楊振寧的學(xué)術(shù)啟蒙得益于吳大猷和王竹溪兩位導(dǎo)師,分別引導(dǎo)他進(jìn)入對稱原理與統(tǒng)計力學(xué)領(lǐng)域。
所以,Taste像是一個人認(rèn)知世界的多元思維中的高維鳥瞰,未知世界里隱秘的關(guān)聯(lián)--哪怕只是關(guān)聯(lián)的投影。?????????
我們可以說,喬布斯是個很有Taste的人,這不是指藝術(shù)上的Taste,或是品味上的Taste,而是他能夠橫跨科技、藝術(shù)、商業(yè),來做出一個超越時間的判斷。???????????????????
前面說的吳清源的對圍棋的天才感覺,也是一種Taste。????
也許每個人在獲取知識和發(fā)展認(rèn)知的過程中,都是在構(gòu)建和訓(xùn)練一個自己的大模型。???
所謂的Taste,就是在”茫茫一片“的神經(jīng)網(wǎng)絡(luò)之中,形成的某些石破天驚的重要連接。??
這和Transformer倒也有可以類比之處。?
Transformer通過自注意力機(jī)制,允許模型在不同維度上“看到”數(shù)據(jù)之間的相關(guān)性,提取出最關(guān)鍵的連接。
同樣地,Taste也是通過對信息的深刻理解,能夠超越表面,找到那些石破天驚的關(guān)鍵連接。
因此,Taste不僅是一種對知識的理解,更是一種超越時間和空間、對事物本質(zhì)的高維度判斷。
人們說,大模型時代,一個人重要的能力是提問。
然而,如果沒有Taste,不可能問出了不起的問題。?
最近一段時間,有些人鼓吹硬科技,重理輕文。可如楊振寧所說,如果沒有Taste,而總是追求有用,可能很難走得遠(yuǎn)。????????
愛因斯坦也有類似的觀點(diǎn):
“在一定程度上而言,科學(xué)家對自然深層次美的領(lǐng)悟和熱愛,以及所具備的形而上的審美判斷力決定了其研究所能企及的高度。”
這一段落所說的Taste,和上一段落說的厚薄,都像是某種“直覺”。用愛因斯坦的話來說:
“真正有價值的是直覺。在探索的道路之上,智力作用不大。”
這種直覺,也是他眼中“由哲學(xué)的洞察力所創(chuàng)造的獨(dú)立性”,能夠幫助科學(xué)家避免陷入“見樹不見林”,愛因斯坦認(rèn)為這“正是一個工匠或?qū)<遥c一個真正的真理追尋者之間,最大的區(qū)別。”
隨機(jī)
看起來,不管是厚薄,還是Taste,都是某種只可意會不能言傳的東西。???
那么,機(jī)器智能是如何感知圍棋的“厚薄”的?早在2016年,阿爾法狗已經(jīng)碾壓了人類自以為無法被超越的“靈性”。???
AI可以擁有楊振寧所說的那種Taste嗎?
起初,計算機(jī)像是一種純粹的基于邏輯推理的機(jī)器,直至不確定性和隨機(jī)性被引入。??????
辛頓的玻爾茲曼機(jī)代表了人工智能發(fā)展中的一次關(guān)鍵突破。
最早的神經(jīng)網(wǎng)絡(luò),如霍普菲爾德網(wǎng)絡(luò),更多是基于確定性原理來處理信息,擅長記憶和補(bǔ)全任務(wù)。
它通過逐步最小化能量進(jìn)入“能量井”,達(dá)到記憶模式的重現(xiàn)。
然而,這類網(wǎng)絡(luò)的局限在于,它們只能處理已經(jīng)學(xué)習(xí)過的模式,而無法創(chuàng)造新的模式,也無法理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。
辛頓的貢獻(xiàn)在于引入了不確定性和隨機(jī)性。
他提出的玻爾茲曼機(jī)通過模擬物理系統(tǒng)中粒子的隨機(jī)運(yùn)動,捕捉數(shù)據(jù)的概率分布,從而生成新的數(shù)據(jù)。
這個系統(tǒng)不再總是選擇最低能量狀態(tài),而是根據(jù)波爾茲曼分布,概率性地做出決定。
這一創(chuàng)新讓機(jī)器學(xué)習(xí)模型從固定的邏輯跳躍到靈活的隨機(jī)領(lǐng)域,就像爵士樂手能夠在固定的音樂結(jié)構(gòu)中即興創(chuàng)作。
在物理學(xué)中,路德維希·波爾茲曼通過研究氣體分子運(yùn)動中的能量分布,提出了著名的波爾茲曼分布。
他發(fā)現(xiàn),物理系統(tǒng)中低能量狀態(tài)的粒子比高能量狀態(tài)的粒子出現(xiàn)的概率更大,這種概率與粒子的能量成指數(shù)關(guān)系。
簡單來說,系統(tǒng)中更穩(wěn)定的狀態(tài)出現(xiàn)的概率更大,而高能量狀態(tài)雖然可能出現(xiàn),但頻率較低。
這一觀點(diǎn)將隨機(jī)性帶入了物理學(xué)核心概念。波爾茲曼解釋了為什么在微觀層面上,粒子之間的碰撞會導(dǎo)致能量的分布不均勻,進(jìn)一步揭示了宏觀系統(tǒng)中的不確定性。
這為量子力學(xué)中的概率解釋奠定了基礎(chǔ)。量子世界中的每個事件都遵循某種概率規(guī)律,精確預(yù)測每個單獨(dú)事件幾乎不可能,但可以通過概率統(tǒng)計對整體行為進(jìn)行推測。
這種隨機(jī)性也滲透到了社會和金融領(lǐng)域。塔勒布的第一本書就叫《隨機(jī)漫步的傻瓜》。
在人生中,隨機(jī)性也扮演著關(guān)鍵角色。正如人類無法預(yù)知未來的一切細(xì)節(jié),我們的命運(yùn)也往往受到各種隨機(jī)因素的影響。
真正的智慧不是消除不確定性,而是在升維思考中擁抱隨機(jī)性,借助概率找到那個最佳行動方案。
《人工智能:現(xiàn)代方法》寫到:
“按照常規(guī)的理解,邏輯要求關(guān)于世界的認(rèn)知是確定的,而實際上這很難實現(xiàn)......概率(probability)論填補(bǔ)了這一鴻溝,允許我們在掌握不確定信息的情況下進(jìn)行嚴(yán)格的推理。”
也許隨機(jī)性帶來了混亂,帶來了不安,但是,隨機(jī)性也是生命之源,是能量之本嗎,甚至也是時間的秘密。?
假如熱力學(xué)第二定律決定了孤立系統(tǒng)會自發(fā)地朝著最大熵狀態(tài)演化,為什么地球上會出現(xiàn)生命?為什么人的大腦能夠以如此復(fù)雜的機(jī)制去思考宇宙????????
玻爾茲曼的解釋是:
我們觀測到的低熵世界來源于高熵宇宙的隨機(jī)漲落。
大的漲落可以造成熵很低的狀態(tài),概率也很低,但在宇宙廣闊尺度下仍然會發(fā)生,而我們自身的存在也是來源于這種漲落帶來的低熵世界。
一個奇怪的演繹是:如果宇宙可以通過某種隨機(jī)波動從虛無中冒出來,那么相比之下,更簡單的東西,比如一個大腦,隨機(jī)出現(xiàn)的可能性會更大。
想象一下,你正坐在沙發(fā)上刷這篇文章,感覺一切都很真實。
可根據(jù)“玻爾茲曼大腦”的假設(shè),你有可能根本不在客廳里,也沒有在看電影。你只是一個孤立的大腦,突然從虛無中“蹦”出來,帶著完整的記憶和感知。
盡管這個大腦只會存在極短的時間,然后很快消失,但在那短暫的一瞬間,它堅信自己正處于一個完整的、真實的世界里——正在和舒適的沙發(fā)上享受本文的摧殘,然而這一切只是大腦的幻覺。
另外一個懸念是:隨機(jī)漲落中生成的人類,有機(jī)會更長久地避開熵增定律,逃離死寂的命運(yùn),去宇宙深處探尋秘密嗎??????????
十
請AI幫我為本文總結(jié)出10條有價值的思考工具和行動指南--雖然有點(diǎn)兒多余。
1、升維思考:更高維度和多維度分析
在遇到復(fù)雜問題時,引入額外的維度(如時間、溫度、空間)幫助你從多個角度進(jìn)行分析。就像在毒酒問題中從二維升到三維,再到“七維”,增加維度可以發(fā)現(xiàn)更多的信息和解決方法。
2、降維行動:全局壓縮與奧卡姆剃刀
在面對復(fù)雜問題時,降維行動不僅是簡化思維,而是基于對全局的深刻理解,將冗余信息壓縮,保留最核心的要素。
就像奧卡姆剃刀的原則——去除不必要的假設(shè),選擇最簡潔的路徑。
通過全局的思考做出局部的行動決策,確保簡化后的方案依然有效并且精準(zhǔn),避免因過度復(fù)雜而拖延或增加不必要的風(fēng)險。
3、成為有Taste的人:培養(yǎng)獨(dú)特的判斷力
通過積累知識、體驗和反思,逐步建立對事物的“感覺”,培養(yǎng)你自己的Taste。?
Taste 是判斷力的高維版本,能夠幫助你迅速分辨重要信息,提升你的洞察力和決策效率。
4、概率思維:接受不確定性并優(yōu)化決策
現(xiàn)實中常存在不確定性,采用概率思維可以幫助你在不確定中找到最優(yōu)方案。通過貝葉斯推理或隨機(jī)策略,訓(xùn)練自己根據(jù)有限信息做出合理的推斷,并擁抱不確定性。
5、訓(xùn)練你大腦的大模型:持續(xù)的權(quán)重更新
在深度學(xué)習(xí)中,權(quán)重更新通過反向傳播不斷調(diào)整模型,使其表現(xiàn)越來越好。
類似地,我們在生活中的每一次嘗試、成功或失敗,都可以視為對自我權(quán)重的“更新”,通過不斷反思和調(diào)整行為策略,優(yōu)化自己。
將每一次失敗視為反向傳播的反饋,不斷調(diào)整你的思維和行動模式。以成長為目標(biāo),注重逐步優(yōu)化,而不是尋求一次性的成功。
6、擁抱隨機(jī)性:把握你的概率權(quán)??
利用變化中的機(jī)會隨機(jī)性不僅是混亂的來源,也是機(jī)遇的來源。
在你的工作和生活中,適當(dāng)引入隨機(jī)性的概念,在多種可能性中大膽嘗試,利用“漲落”帶來的突破,找到隱藏的解決方案。
7、建立人生的估值函數(shù):以終局目標(biāo)為導(dǎo)向采取行動
在行動時,不要追求最完美的選擇,減少不必要的思維復(fù)雜性。類似于李昌鎬在領(lǐng)先時縮短戰(zhàn)線的做法,鎖定目標(biāo)后迅速行動,避免過度優(yōu)化帶來的拖延。
8、時間維度利用:加入時間因素來解決問題
在現(xiàn)實世界里,總是可以看到但又被忽略的,是時間。
長期主義,必須將時間和空間整合成一個系統(tǒng)。
通過觀察事物在時間上的變化來做出判斷,將時間因素融入決策,提升長遠(yuǎn)的判斷力。
9、可操作的二進(jìn)制思維:把所有復(fù)雜難題簡化為二選一
學(xué)習(xí)二進(jìn)制的思維模式,幫助你在復(fù)雜情況下簡化決策。通過將問題拆解為“是/否”、“0/1”形式,快速找到核心點(diǎn),這種思維方式有助于提升處理復(fù)雜問題的效率。
10、提問的藝術(shù):用高維問題打開局面
大模型時代,人類最強(qiáng)的能力是提問。培養(yǎng)提出優(yōu)質(zhì)問題的能力。讓AI幫助你在探索過程中找到突破點(diǎn)。
最后
也許你還記得本文以盲人的難題開頭,請允許我用盲人的故事結(jié)尾。?????
盲人失去了觀察這個世界最重要的維度之一:視覺。這是普通人無法理解的沉重和不公。?
而有一位盲人不僅失去了視力,還失去了聽力。??
一個人處在這樣一個黑暗的、無聲的世界里,該如何活下去?
我想分享的故事的主角是海倫·亞當(dāng)斯·凱勒,她在19個月大的一次疾病中失去了視力和聽力。
1924年2月1日,紐約的WEAF廣播電臺播出了紐約交響樂團(tuán)現(xiàn)場演奏的貝多芬第九交響曲。
海倫·凱勒在家里“聽”了這場音樂會。如下圖:
后來她寫信給紐約愛樂,分享了自己的體驗。以下是該信。?????????
(中文翻譯來自網(wǎng)絡(luò)。)
親愛的朋友們:
雖然我既瞎且聾,我仍然懷著歡躍之情告訴你們:昨晚我度過一段光輝燦爛的時光,靠著收音機(jī)聆聽了貝多芬的《第九交響曲》。
我并不是說像其他人一樣“聽到”音樂;我也不知道是否能讓你們了解,我如何能從交響曲得到快樂。這連我自己都驚訝不已。
我早已從雜志上讀到收音機(jī)帶給盲者的幸福:它能帶領(lǐng)看不見的人到任何地方去。
我很高興知道盲者獲得了新的樂趣來源;但我從未夢想能得到和他們一樣的快樂。
昨晚,當(dāng)家人聆聽你們精彩的演出這不朽的交響曲時,有人建議我把手放在收音機(jī)上,看看我能不能感受到任何各式各樣的震動。
他旋開收音機(jī)的喇叭蓋,于是我輕輕碰觸敏感的震動膜。我驚奇地發(fā)現(xiàn)我能感受到的不只是震動,而且是充滿熱情的節(jié)奏、以及音樂的悸動和涌蕩!發(fā)自各種不同樂器的震動交纏并融合在一起,使我陶醉不已。
我能確切分辨短號、急切的鼓聲、低音的中提琴和優(yōu)雅合奏的小提琴。當(dāng)小提琴淹漫并鉆犁過其它樂器的最低音調(diào)時,它的演奏是多么地美妙!
當(dāng)人聲從和聲的波濤中顫栗躍出時,我馬上分辨出它們是更加狂喜、迅速上揚(yáng)如燃燒的火焰,直令我的心跳嘎然而止。
而女聲部的歌聲似乎具備了天使般的聲響,在美麗而鼓舞人的聲音洪流中和諧涌動。
接著所有的樂器和人聲一起爆發(fā)出來——像在天堂搖蕩的海洋——然后像風(fēng)一樣漸微漸消,于甜蜜音符的柔和沐浴中結(jié)束。
當(dāng)然這不是“聆聽”,但我確知這些音符與和聲傳達(dá)給我雄美和壯麗的情愫。同時我感受到——或者我自認(rèn)為感受到——自然的溫柔歌聲唱進(jìn)我手中;感受到搖擺的蘆葦和風(fēng)、以及潺潺的溪流。我以前從未因這么多的音調(diào)震動而狂喜過。
當(dāng)我聆聽時,黑暗和旋律、陰影和聲音充滿整個房間,我忍不住想到傾注如此甜蜜洪流給世界的這位作曲家,竟是和我一樣耳朵聾了。我驚訝于他不滅的精神所產(chǎn)生的力量,從他的痛苦中為別人粹練出歡樂——而我坐在這兒,用我的手感受這神奇的交響曲,仿佛海洋一般拍擊著他和我兩人寂靜的靈魂海岸。
這是一篇令所有能聽見、能看見的人汗顏的文字。
為什么失去了觀察世界的很多個維度,海倫·凱勒依然比絕大多數(shù)健全的人更能感知這個世界的秘密?
她自己曾經(jīng)給出過答案:?
“世界上最好和最美的東西是看不到也摸不到的……它們只能被心靈感受到。”
也許靈魂,才是一個人最重要的維度。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.