網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

升維思考，降維行動

2024-09-21 15:51:31　來源: 孤獨(dú)大腦

北京舉報

分享至

聰明如你，請做題：

一個盲人有5雙白襪子和5雙黑襪子，除了顏色差異，其它一模一樣，弄混了，請問如何分開？

這是一個簡單而有啟示的智力題。

答案很簡單：拿到太陽下去曬。????

在陽光下，黑襪子吸熱更快，所以通過觸摸，盲人可以感知到襪子的溫度差異，從而將白襪子和黑襪子分開。

最初，盲人只能通過觸摸襪子的材質(zhì)，但無法區(qū)分顏色。因此，我們可以引入“溫度”這個維度，通過陽光加熱，創(chuàng)造了一個新的識別維度（溫度差）。

這就類似于在復(fù)雜問題中引入額外的信息維度，以便更好地理解問題。

我曾經(jīng)寫過“灰度認(rèn)知，黑白決策”，本文像是下聯(lián)。

順著這一點(diǎn)，我想談及信息的“維度”。

最有名的“升維思考”，也許是愛因斯坦的相對論。???

在牛頓物理學(xué)中，我們處理的通常是三維空間中的物體運(yùn)動，時間是一個獨(dú)立的量。

但愛因斯坦在狹義相對論中提出了一個全新的框架，稱為四維時空，將時間和空間視為相互關(guān)聯(lián)的統(tǒng)一結(jié)構(gòu)。

在廣義相對論中，物質(zhì)和能量會彎曲時空，而物體在彎曲時空中的運(yùn)動實際上是沿著時空曲線運(yùn)動。

由此，人類對物理世界有了更加精確的解釋。

就你我而言，我們究竟是如何理解這個世界的？我們?nèi)绾闻袛嘁粋€未知的事物？我們?nèi)绾卧谛畔⒉怀浞值那闆r下做出決策？????????

也許每個人都是如盲人摸像一般，通過不同角度的特征做出推斷。????

了不起的高手，往往比普通人有更高的認(rèn)知維度，例如圍棋天才獨(dú)具的“感覺”，楊振寧推崇的“Taste”。??????????

AI通過降維簡化問題，通過升維來揭示更多的隱藏信息，這一點(diǎn)在深度學(xué)習(xí)的領(lǐng)域產(chǎn)生了神奇的效果，以至于機(jī)器可以獲得8年前人類還自以為獨(dú)具的“感覺”。??

在大模型時代，AI借助于算法、算力和數(shù)據(jù)，獲得了在某些方面超越人類的“高維思考”能力。

而此時，人類的聯(lián)想和提問能力，就像是構(gòu)建一個維度，或是在大模型的向量空間里，勾出一段彩虹。

就像扔出一個骰子，對于未來的可能性，我們要升維思考，考慮6個面的概率，可結(jié)果只有一面。???????????

這大概是“升維思考、降維行動”的一個簡單隱喻。

《人工智能：現(xiàn)代方法》說：

?人工智能(artificial intelligence，AI)領(lǐng)域不僅涉及理解，還涉及構(gòu)建智能實體。這些智能實體機(jī)器需要在各種各樣新奇的情況下，計算如何有效和安全地行動。

我們需要理性思考，也需要理性行為，尤其要在“存在不確定性時取得最佳期望結(jié)果而采取行動。”

升維思考與灰度認(rèn)知，都和概率論有關(guān)，再加上基于時間的與外部環(huán)境的互動，貝葉斯定律常常現(xiàn)身其中。?????????

更現(xiàn)實一點(diǎn)的場景是：對于一個投資者，需要升維思考。例如芒格的多元思維模型。但是他的模型是通過多個維度的證偽，來切割出鉆石的。--本文提及的樸素貝葉斯分類，底層的原理（可感知的那部分）是想通的。????

而行動本身，往往是降維的。

從數(shù)學(xué)的角度看，我們需要一個（相對）最優(yōu)概率；???

從物理的角度看，系統(tǒng)需要（相對）最低勢能狀態(tài)；?????

從決策的角度看，人類必須采取行動并接受一個黑白分明的結(jié)果。

多面骰子在空中飛舞，最終只能選擇一面朝上。

投資者最終需要做出“買或不買、賣或不買”的決策，而且行動越少越簡單越好。

降維行動的例子：京東說要“多快好省”，拼多多只要一個“省”。????

那些大事不糊涂的人，那些過得不錯并且還能輕松的人，大多是在維度上取得了勝利。

現(xiàn)在做事不容易，許多行業(yè)和公司都在談“轉(zhuǎn)型”。但是，如果沒有維度上的突破，可能只是在原路上瞎撲騰。

活在二維世界里的生物的死局，往往要靠超越維度來破解。?

“井底之蛙”看似是關(guān)于視野的隱喻，其實是關(guān)于維度的類比。

本文從一個我喜歡的智力題開始，將毒酒問題的二進(jìn)制解法，類比為更高維度的勝利。??????

類比可能是鮮活的，但絕不嚴(yán)謹(jǐn)。甚至于在文章的推進(jìn)過程中，升維和降維都會出現(xiàn)一些概念的交錯。

類比和隱喻都是思考的腳手架，請你能用且用，用完后記得拆除。

更廣闊的意義上，每個人都是全體人類的一個維度。

所以，請活出你自己。

一

讓我們從一道有趣的題開始：

國王有一百桶酒，比自己的生命還重要。結(jié)果有一天其中一桶被投了慢性毒藥，喝了以后半個小時就會死掉。國王大怒，命令玩忽職守的侍衛(wèi)去試毒。酒不能被混合，一個侍衛(wèi)可以喝多桶酒，一桶酒也可以由多個侍衛(wèi)喝。

請問：怎么樣才能用最少的侍衛(wèi)、在半小時內(nèi)知道哪桶是毒酒？

解法1：一維法

最簡單的方案，是讓每個人試一桶酒，用時30分鐘，就可以判斷出哪一桶酒有毒。

這個是“一維”的直線思維，在現(xiàn)實生活中也未嘗不可，好過什么都不干。

這樣的解法，答案是：99個人。

解法2：二維法

從二維層面去思考，引入笛卡爾的坐標(biāo)。

把100桶酒擺成10??10的矩陣，如下：

接下來：

讓阿拉伯?dāng)?shù)字編號的1號侍衛(wèi)（如上圖，黃色），把第1行酒每桶喝一口，一直到10號喝第10行；
讓漢字編號的一號侍衛(wèi)，把第一列酒每桶喝一口，一直到十號喝第十列；
由于坐標(biāo)的定位功能，假如毒酒在圖中綠色的位置，那么3號侍衛(wèi)和二號侍衛(wèi)都會死，自然可以鎖定毒酒的位置。
但是因為第10行和第十列可以不用安排人，也能獲取信息，所以可以減少兩個人。?????

這樣的解法，答案是：18個人。

解法3：三維法

能否再延伸至三維層面去思考呢？

我們很容易想到，搭建一個5??5??4的三維模型，正好有100個位置放酒，如下：

接下來（和二維解法差不多）：

讓阿拉伯?dāng)?shù)字編號的1號侍衛(wèi)（如上圖，黃色），把黃色箭頭這一面墻的酒每桶喝一口，一直到5號喝第5面墻；
讓漢字編號的一號侍衛(wèi)（如上圖，橙色），把橙色箭頭這一面墻的酒每桶喝一口，一直到五號喝第五面墻；
讓字母編號的a號侍衛(wèi)（如上圖，藍(lán)色），把藍(lán)色箭頭這一層的酒每桶喝一口，一直到d號喝第四層；
同理，通過三個維度，也可以鎖定毒酒的位置；
以及，每個維度都可以少一個人。??

這樣的解法，答案是：11個人。

最笨的方法1，會死一個侍衛(wèi)；方法2會死兩個（或1個，或零個），方法3會死三個（或兩個，或一個，或零個），總之一個維度需要獲取一個信息，可能會死一個，或者提供零的信息。

所以題目中有含糊的地方，到底是用最少的侍衛(wèi)，還是死最少的侍衛(wèi)？考慮到國王的殘酷，我們姑且認(rèn)為是前者。

然而，即使聰明如你想明白了上面三個維度的解法，還是沒有找到最優(yōu)答案。

解法4：二進(jìn)制

如果用計算機(jī)的思維來分析這個問題，那么首先考慮如何存儲這100桶酒。100桶酒可以用二進(jìn)制7個比特來表示（2的7次方>100）。

上面的解法1到解法3，都是用100個位置存儲100桶酒，只是描述位置的坐標(biāo)，從一維到三維，效率越來越高，所以用的侍衛(wèi)越來越少。

如果用二進(jìn)制呢？

二進(jìn)制，是逢二進(jìn)一的計數(shù)編碼方法，只有0和1兩個數(shù)碼。那到了2怎么辦？只有往前進(jìn)一位，變成10。

所以，十進(jìn)制的2、3、4、5，二進(jìn)制分別表示為10、11、100、101。二進(jìn)制廣泛應(yīng)用于電子計算機(jī)的數(shù)據(jù)處理。

回到我們的題目，計算如下：

第一步：對于每一桶酒的二進(jìn)制表示，編碼后，最長的數(shù)字是7位數(shù)，不足七位前面用0表示；

1號桶是0000001，

2號桶是0000010，

3號桶是0000011，

4號桶是0000100，

100號桶是1100100；

第二步：可以找七個侍衛(wèi)，從左到右，編號“一”至“七”，每人對應(yīng)一個位數(shù)，從第一位到第七位。

第三步：負(fù)責(zé)第一位數(shù)的侍衛(wèi)“一”，只要這100桶酒中，二進(jìn)制編碼的該位數(shù)對應(yīng)的數(shù)字是1，則喝掉此桶酒。

如此類推，每個侍衛(wèi)喝掉他所負(fù)責(zé)的位數(shù)上數(shù)字是1的酒。

第四步：30分鐘后，侍衛(wèi)按照“一”至“七”，死掉的置為1，活著的置為0。

例如，假如第七桶酒為毒酒，其二進(jìn)制編碼是0000111。那么按照上面的喝酒規(guī)則，其五、六、七位都是“1”，所以編號五、六、七的侍衛(wèi)都會死。

前四個侍衛(wèi)，遇到這瓶毒酒，因為對應(yīng)的數(shù)字是0，所以都會活。

二進(jìn)制的0和1，正好對應(yīng)了活和死。

根據(jù)7個侍衛(wèi)喝酒后半小時的生死狀態(tài)，能夠得出毒酒的二進(jìn)制編碼。

這樣的解法，答案是：7個人。

以下，請允許我從一個非專業(yè)人士的“感知”的角度，來說說這道題的啟示：

1、第一種方法，是簡單的線性搜索；

2、第二、第三兩種方法，是增加了維度的線性搜索，可以理解為交叉搜索，等價于坐標(biāo)系；

3、前三種解法，維度越高，效率也就越高；

4、因為有“半小時”的時間約定，所以不能用簡單的二分法來解答。所以，第四種解法用二進(jìn)制為100瓶酒編碼，進(jìn)而用0和1對應(yīng)不喝與喝（也對應(yīng)了撞見毒酒后的生和死）。

5、那么第四種用二進(jìn)制的解法，是否可以理解為“7維”的解法？

第一種解法有1個維度，該維度上有100種可能。這其中的99種，每種可能都需要1個侍衛(wèi)去通過喝酒“消除不確定性”；
第二種解法有2個維度，每個維度上有10種可能，每種可能都需要1個侍衛(wèi)去通過喝酒“消除不確定性”，然后這兩個維度的交叉點(diǎn)，就是毒酒的位置；
第四種解法有7個維度，每個維度上有兩種可能，每兩種可能，只需要1個侍衛(wèi)去通過喝酒，就可以“消除不確定性”。于是，這七個維度的交叉點(diǎn)（表述為一串二進(jìn)制數(shù)字），就是毒酒的位置。

在這道題目中，使用二進(jìn)制編碼的策略是核心。通過將100桶酒編碼為7位二進(jìn)制數(shù)，我們能夠用最少的侍衛(wèi)（7個）來解決問題。

這種方法背后的原因是二進(jìn)制的指數(shù)效應(yīng)：每增加一位二進(jìn)制位，就可以表示更多的狀態(tài)，極大地減少了解決問題所需的資源（在這個例子中是侍衛(wèi)的數(shù)量）。

相比于簡單的線性搜索，二進(jìn)制讓我們進(jìn)入了一個更高效的“維度”空間。

在這個空間里，每個侍衛(wèi)只需要判斷一個“0”或“1”的狀態(tài)，就能為100桶酒中的每一桶賦予唯一的二進(jìn)制編碼。

這種策略不僅有效地消除了不確定性，還展示了通過增加維度解決問題的力量。

這一過程展現(xiàn)了升維和降維的相互配合：

升維思考：通過引入多個侍衛(wèi)，每個侍衛(wèi)相當(dāng)于引入了一個新的維度，讓我們能夠從更多角度捕捉信息。

降維行動：通過侍衛(wèi)生死的二值化狀態(tài)，我們將所有復(fù)雜性壓縮為一串二進(jìn)制信息，這一信息指向毒酒的唯一桶號。

二

在上面遞進(jìn)的解體過程中，將二進(jìn)制的方法，類比為7維，是一個有趣的想法。???

進(jìn)而，我們可以用一種更直觀的方式，來闡述“升維思考、降維行動”。??

我喜歡用可感知的思考來理解一些概念，而不是單靠文字本身的解釋。?

讓我們再來看一道有趣的題目，以感知“維度”。

有三盞白熾燈泡和三個開關(guān)，每個開關(guān)控制一盞燈泡，但你不知道哪個開關(guān)對應(yīng)哪個燈泡。

你可以進(jìn)入一個房間控制開關(guān)，但燈泡在另一個房間，你只能進(jìn)入燈泡房間一次來檢查結(jié)果。

如何在最短時間內(nèi)確定每個開關(guān)對應(yīng)的燈泡？

聰明如你，即使知道答案，也不妨從維度的角度重新思考一遍。?

難題在于，開和關(guān)只有兩個維度，要想界定出三個燈泡，必須創(chuàng)造出一個新的維度。

白熾燈的另外一個屬性是發(fā)熱，所以可以引入“冷熱的維度”。

解決方法：

打開第一個開關(guān)，保持它打開。
打開第二個開關(guān)一段時間后關(guān)閉它。
保持第三個開關(guān)關(guān)閉。
然后進(jìn)入燈泡房間檢查燈泡：

點(diǎn)亮的燈泡對應(yīng)第一個開關(guān)。
熱的但不亮的燈泡對應(yīng)第二個開關(guān)。
冷的并且不亮的燈泡對應(yīng)第三個開關(guān)。

這三種狀態(tài)相當(dāng)于在這個系統(tǒng)中添加了不同的維度：

亮/不亮的維度：開關(guān)是否正在控制燈泡。
熱/不熱的維度：燈泡是否曾被打開過但關(guān)閉。
冷/熱的維度：燈泡的物理狀態(tài)（熱與冷）提供了額外的信息。

上面的冷和熱，也是與時間的維度關(guān)聯(lián)的。

事實上，精確而言，如上方法應(yīng)該能夠識別出四個燈泡。你覺得呢？

三

用類比和隱喻的方式，來表達(dá)一些主題，有“生動性”的優(yōu)點(diǎn)，也有不精確的缺點(diǎn)。

再次聲明，請你務(wù)必僅僅將其視為理解和感知的腳手架。???????

讓我們回到數(shù)學(xué)和物理。

1854年，黎曼在哥廷根大學(xué)發(fā)表的演講改變了數(shù)學(xué)和物理學(xué)的進(jìn)程。他引入了一個革命性的概念：高維幾何學(xué)，推翻了歐幾里得幾何的傳統(tǒng)觀念。

（圖片來自網(wǎng)絡(luò)）

在歐幾里得幾何中，空間是平坦的，二維或三維的，而黎曼發(fā)現(xiàn)了空間的彎曲性質(zhì)，提出可以通過引入更高維度來解釋自然界的現(xiàn)象。

黎曼的幾何學(xué)不僅改變了數(shù)學(xué)的基礎(chǔ)，也為物理學(xué)提供了新的工具。

尤其是在1915年，愛因斯坦借助黎曼的幾何學(xué)，提出了廣義相對論，用四維時空的彎曲來解釋引力。黎曼的思想啟發(fā)了后來的科學(xué)家，使他們進(jìn)一步探索更高維的宇宙。

歐幾里得幾何學(xué)認(rèn)為兩點(diǎn)之間的最短距離是直線，而黎曼指出，這個定律只適用于平坦空間。

在彎曲空間中，比如球面上，兩點(diǎn)之間的最短路徑是曲線。黎曼通過引入“度規(guī)張量”這一工具，能夠精確描述空間在每一點(diǎn)的彎曲程度。

這一創(chuàng)新讓科學(xué)家可以用數(shù)學(xué)來描述任何維度的空間，無論是平坦的還是彎曲的。

更令人驚嘆的是，黎曼的理論揭示了“力”可能只是空間幾何變形的結(jié)果。

比如，當(dāng)我們在三維空間中感受到引力時，實際上是因為空間在我們感知不到的第四維中發(fā)生了褶皺。這一概念為將來用高維幾何學(xué)統(tǒng)一所有物理定律鋪平了道路。

高斯較早前已經(jīng)提出了平面“書蟲”的思想實驗，黎曼進(jìn)一步將其擴(kuò)充：

如果一張紙上生活著二維生物，把它們生活的紙褶皺之后，它們依然會覺得世界是平的，但當(dāng)它們在褶皺的紙上運(yùn)動時，它們就會感到一股看不見的“力”阻止它們沿直線運(yùn)動。

黎曼幾何不僅讓愛因斯坦能夠理解引力的本質(zhì)，還讓他開始思考，其他的自然力是否也是時空在更高維度中的褶皺結(jié)果。

這種思維方式為后來物理學(xué)家嘗試統(tǒng)一電磁力、弱力和強(qiáng)力奠定了理論基礎(chǔ)，并成為現(xiàn)代超弦理論的先聲。

黎曼還提出了“黎曼切口”的假設(shè)，在這一模型中，兩張紙代表兩個不同的二維曲面，切口則是這兩個曲面之間的通道。

（圖片來自《超空間》）

二維的“書蟲”在自己的世界里是無法察覺到這個切口的存在的，但如果它無意中進(jìn)入切口，就會突然出現(xiàn)在另一個曲面上。

這個切口是它們在二維世界中無法理解的，而在更高維度的觀察者眼中，這個過程卻是可以輕松解釋的。

黎曼切口可以看作是后來物理學(xué)家提出的“蟲洞”概念的早期雛形。蟲洞是一種理論上連接不同空間或時空的橋梁，可以讓物體穿過極端彎曲的時空區(qū)域，在看似瞬間移動到另一個位置，甚至是另一個時空。

在愛因斯坦的廣義相對論框架下，黎曼切口的思路進(jìn)一步發(fā)展，成為探索時空結(jié)構(gòu)和多連通空間的一種方式。

物理學(xué)家馬里特10歲的時候，33歲的父親就去世了。他一直渴望建造一臺時光機(jī)器。從物理學(xué)的角度看，“蟲洞”是實現(xiàn)時光旅行的一種方法。

神秘的時間之箭。

你還記得上面那兩個智力題嗎？靠溫度差別來區(qū)分的燈泡和襪子，依然要靠時間來實現(xiàn)。?????

溫度，熱力學(xué)，時間，我們似乎隱隱約約能看到玻爾茲曼的身影。

四

在電影《星際穿越》中，導(dǎo)演克里斯托弗·諾蘭通過五維空間的設(shè)計來表現(xiàn)時間、空間和平行宇宙的概念，尤其在影片結(jié)尾，主人公庫珀進(jìn)入的“Tesseract”（超立方體）成為了關(guān)鍵場景之一。

四維的時空，建立在愛因斯坦的理論之上，過去、現(xiàn)在和未來是“平鋪”著的。時間是四維生物能夠感知到的某種“實體”，就像我們對二維世界生物的某種優(yōu)勢。

電影里的小布蘭德博士對此這樣解釋：“過去是可以穿行的峽谷，未來是可以攀爬的山峰”。

諾蘭加入的第五個維度，是平行宇宙的概念。

五維空間不僅包含了四維時空，還包括了不同可能性的存在，反映了量子力學(xué)中關(guān)于平行宇宙的理論。

這意味著，在五維空間中，可以同時訪問不同時間節(jié)點(diǎn)和不同的空間狀態(tài)。

（圖片來自網(wǎng)絡(luò)）

在我們?nèi)粘５母兄校澜缢坪跏蔷€性的：我們生活在一個三維的空間中，并經(jīng)歷時間的流逝。

然而，物理學(xué)中存在一種更為復(fù)雜的理論——如果有第五維度存在，并且這個維度代表的是平行宇宙，那么我們的宇宙可能只是這些平行宇宙中的一個“投影”。

想象一下，所有的量子事件、選擇和行為就像擲骰子。

每次擲骰子，骰子會展示一個面，這是我們所感知到的“現(xiàn)實”。但在更高維度的五維空間中，骰子的其他面仍然存在，意味著還有無數(shù)可能的結(jié)果。

平行宇宙理論認(rèn)為，每一種可能的量子狀態(tài)都對應(yīng)著一個新的宇宙，因此我們當(dāng)前的宇宙只不過是五維空間中無數(shù)可能性之一的“坍縮”結(jié)果。

這種理論被稱為多世界詮釋，它告訴我們，每一次選擇和量子事件都可能創(chuàng)造一個平行宇宙。

我們的四維現(xiàn)實——即三維空間加一維時間——是這無數(shù)可能性的其中之一。

就像骰子在擲出后展示的某一面一樣，我們的宇宙是基于概率選擇的，其他可能性雖然存在，但我們無法直接觀察到它們。

這為我們提供了一個深刻的視角：我們所體驗到的世界，或許只是無數(shù)可能世界中的一個，而真正的“全貌”還隱藏在更高維度的神秘之中。

五

人類到底是如何理解這個世界的？

什么叫“看到”？

又有什么可以稱為“知道”？

而在休謨看來，“人類心靈中的一切素材，不管是簡單的還是復(fù)雜的，不管是具體的還是抽象的，都無一例外地來自人的感覺經(jīng)驗。”

他有一段杠精似的驚人陳述：??

實體(substance)觀念是從感覺印象得來的呢，還是從反省印象得來的呢？如果實體觀念是從我們的感官傳給我們的，請問是從哪一個感官傳來的，并以什么方式傳來的？

如果它是被眼睛所知覺的，那么這個觀念必然是一種顏色；如果是被耳朵所知覺，那么它必然是一種聲音；如果是被味覺所知覺，那么它必然是一種滋味；其他感官也是如此。

但是我相信，沒有人會說：實體是一種顏色，或是一個聲音，或是一種滋味。因此實體觀念如果確實存在，它必然是從反省印象得來的。但是反省印象歸結(jié)為情感和情緒，兩者之中沒有一個能夠表象實體。

因此，我們的實體觀念，只是一些特殊性質(zhì)的集合體的觀念，而當(dāng)我們談?wù)搶嶓w或關(guān)于實體進(jìn)行推理時，我們也沒有其他的意義。

在“看到”一物時，我們不僅僅是接收光線，還通過經(jīng)驗和知識賦予這個物體意義。

看到一棵樹，我們不僅識別出形狀和顏色，還通過記憶理解這是一棵樹，它可能有著生長、開花、落葉等屬性。

“知道”是一種更復(fù)雜的認(rèn)知過程。我們不僅依靠感官“看到”事物，還要通過思維、推理、記憶和反思來理解事物。

知識的獲取過程常常基于經(jīng)驗：我們通過觀察、思考、學(xué)習(xí)、互動等方式形成對世界的理解。

然而，這種知識是否真實或完整？

《科學(xué)之死》一書對此解讀道：

蘋果很常見，很多人都愛吃，但蘋果是什么東西呢？首先，從感官經(jīng)驗的角度，我們可以說蘋果是紅的、圓的、甜的、脆的、硬的、能解渴的、能充饑的等等；

其次，除此之外，人們一般還會認(rèn)為，有一個實體性的東西承載著所有感官告訴我們的這些性質(zhì)，而這個實體性的東西才是真正的“蘋果”。

休謨的意思是，事實上人們對蘋果的認(rèn)識只能限于上述的第一個階段，至于說是不是有一個實體性的“蘋果”存在，人們是一無所知的，因為這個實體沒有在人的感官當(dāng)中引起任何印象。

經(jīng)驗主義的另一位代表人物洛克提出，知識的來源有兩種：

外部感官經(jīng)驗（通過五感獲取的信息）和內(nèi)在反思經(jīng)驗（對心靈自身活動的反思）。

感官經(jīng)驗幫助我們接觸外部世界的事物；

反思經(jīng)驗則是通過觀察我們自己的思維過程來理解抽象概念。

為了解釋我們?nèi)绾瓮ㄟ^感知理解物質(zhì)，洛克提出了物質(zhì)的第一性質(zhì)和第二性質(zhì)的區(qū)分。

第一性質(zhì)：這些是物體固有的屬性，它們獨(dú)立于觀察者的感知存在。無論有沒有人感知，這些性質(zhì)都客觀存在，如物體的形狀、大小、堅硬度、重量、密度等。

洛克認(rèn)為，這些性質(zhì)是物體本身構(gòu)成的一部分，任何物質(zhì)都具有這些性質(zhì)。

第二性質(zhì)：這些性質(zhì)是物體在與感知者互動時產(chǎn)生的，它們依賴于觀察者的感官才能存在，如顏色、味道、氣味和聲音等。

洛克認(rèn)為，第二性質(zhì)并不直接存在于物體中，而是通過第一性質(zhì)的作用在感官中產(chǎn)生的感覺。例如，顏色并不是物體本身的固有屬性，而是光線與物體表面的相互作用在我們眼中產(chǎn)生的結(jié)果。

人類如何識別一個蘋果？

按照洛克的理論，當(dāng)我們面對一個蘋果時，我們的感官通過接觸蘋果的不同性質(zhì)來認(rèn)識它。

第一性質(zhì)：形狀，重量，硬度等等；

第二性質(zhì)：味道，口感，氣味，甚至顏色，等等。

（圖片來自網(wǎng)絡(luò)）

以我們“早熟”的哲學(xué)習(xí)慣，看到洛克和休謨的觀點(diǎn)，會感覺非常幼稚，極其啰嗦，這有啥用？??????

的確有用。

接下來，我們看一下，AI如何識別出一個水果。

六

延續(xù)洛克樸素而直白的思想，我們識別一個蘋果，是根據(jù)其性質(zhì)，將其與別的物體、別的水果區(qū)別開來，這是一個分類的過程。?

洛克和休謨杠精似的哲學(xué)背后，是對因果論的懷疑，是“人類知道自己不知道”的關(guān)鍵一步。?????

盡管被休謨們斬斷了因果的“必然”幻覺，但世界的推理并沒有因此而終止。捍衛(wèi)上帝這一最大“因”的虔誠教士貝葉斯，用自己的數(shù)學(xué)天賦造出了一架懸梯。???

現(xiàn)在，假設(shè)我們造出了一個初級的機(jī)器人，我們?nèi)绾谓虝R別水果？?

這個機(jī)器人沒有任何人類的常識和經(jīng)驗，也因此沒有任何“我以為我知道的幻覺”。

它只能像洛克所說的那樣，如同一張白紙，一點(diǎn)點(diǎn)學(xué)習(xí)。?

現(xiàn)在，我們把一個未知水果放在它面前，已知它只能知道三個基本特征：

顏色是黃的，味道是甜的，形狀是長的。??

這個問題對人類來說很簡單。可是對于機(jī)器智能，或者是對于一個初生的孩子，都是個難題。不要嘲笑，在那些我們并不熟知的領(lǐng)域，我們還不如這個初級的機(jī)器人。???????

黃色的可能是任何一種水果；

甜味兒是個很主觀的概念，有些人覺得酸甜就不是甜；

長是一個相對概念，還是絕對概念？?

總之，一切都很模糊，條件十分不充分，但我們必須做出判斷。--這和我們的現(xiàn)實世界非常像。?????

洛克和休謨對人類的提醒是，別認(rèn)為那些顯而易見的東西就是真相，別以為那些理所當(dāng)然的東西就是因果分明。???

所以，本質(zhì)而言，機(jī)器人的任務(wù)，是在信息模糊的情況下，去猜測該水果最有可能是哪一種？

所謂可能，就是概率。

首先，我們要有最基本的信息，對人類而言是對“第一性質(zhì)”和“第二性質(zhì)”等客觀和主觀特征的觀察與統(tǒng)計，對機(jī)器人而言則是獲取數(shù)據(jù)和訓(xùn)練數(shù)據(jù)。?

（以下案例由網(wǎng)絡(luò)上未署名文章改寫）

假設(shè)我們收集了1000個水果的數(shù)據(jù)，這些水果包括蘋果、香蕉和梨子。

每個水果都有三個特征：形狀（是否長）、味道（是否甜）、顏色（是否黃）。

現(xiàn)在，我們要用貝葉斯分類器來判斷一個新水果，它的特征是“長、甜、黃”。

（圖片來自網(wǎng)絡(luò)）

從數(shù)據(jù)中，我們知道：

50%的水果是香蕉，30%是蘋果，20%是梨子。
80%的香蕉是長的，70%是甜的，90%是黃的。
蘋果中沒有長的，50%是甜的，100%是黃的。
50%的梨子是長的，75%是甜的，25%是黃的。

現(xiàn)在我們使用貝葉斯公式來計算這個新水果的可能性。

香蕉的概率：我們計算“長、甜、黃”的條件下，水果是香蕉的概率。
P(長甜黃|香蕉) = 0.8 * 0.7 * 0.9 = 0.504
P(香蕉|長甜黃) = 0.504 * 0.5 = 0.252
蘋果的概率：蘋果沒有長的，所以概率為0。
P(長甜黃|蘋果) = 0 * 0.5 * 1 = 0
P(蘋果|長甜黃) = 0
梨子的概率：
P(長甜黃|梨子) = 0.5 * 0.75 * 0.25 = 0.09375
P(梨子|長甜黃) = 0.09375 * 0.2 = 0.01875

接著，計算分母P(長甜黃)：

P(長甜黃) = 0.252 + 0 + 0.01875 = 0.27075

最后計算后驗概率：

P(香蕉|長甜黃) = 0.252 / 0.27075 ≈ 93%
P(梨子|長甜黃) = 0.01875 / 0.27075 ≈ 7%
P(蘋果|長甜黃) = 0

因此，這個水果有93%的可能性是香蕉，7%的可能性是梨子，而不可能是蘋果。

在這個過程中，每一個特征（如顏色、形狀、味道）都可以看作是一個維度，而貝葉斯分類器通過將這些維度結(jié)合起來，從不同的角度對水果進(jìn)行推斷和分類。

這種方法本質(zhì)上是對多維信息的整合，通過各個維度上的信息貢獻(xiàn)來計算某種結(jié)論出現(xiàn)的概率。

機(jī)器人費(fèi)了很大力氣，才計算出一個概率，而人類也許不需要一秒鐘就能夠識別。???????

然而，就像一個孩子學(xué)下棋之處顯得很傻，但是可能只需要三個月就能夠戰(zhàn)勝下了三十年臭棋的成年人。

洛克是對的。但是，他的懷疑，并不影響人類基于不完全信息來推斷未來。

機(jī)器通過算法，例如貝葉斯推理，模擬了人類的推理過程，經(jīng)驗主義的理念在今天的數(shù)字化時代展現(xiàn)出強(qiáng)大的生命力和影響力。

洛克和休謨的深刻思考，盡管在當(dāng)時或許被視為繁瑣的哲學(xué)辯論，卻為現(xiàn)代人工智能的核心邏輯奠定了基礎(chǔ)。

經(jīng)驗主義并沒有止步于哲學(xué)課堂，而是通過現(xiàn)代技術(shù)的實現(xiàn)，重新在硅谷和全球科技前沿?zé)òl(fā)出新的火焰。

七

一切皆可計算

有時信仰束縛人的思想，有時信仰令思考者更加狂放。?

對上帝的堅信，令牛頓在“解釋宇宙”的時候，不會因為因果鏈條的某些缺失而停頓。??

既然有“上帝”設(shè)計一切，他只管去探尋設(shè)計的規(guī)則就好了。引力到底是如何產(chǎn)生的？與距離的平方成反比到底是個什么東東？牛頓絕不糾結(jié)于探索路途中的“無知”，亦不因此陷入虛無主義。?????

愛因斯坦是未知論者，所以他要借助于斯賓諾莎的“萬物之神”的力量。

而辛頓則有賴于“差異化的信仰”，用一生去賭相當(dāng)長時間內(nèi)毫無希望的神經(jīng)網(wǎng)絡(luò)。

萊布尼茲更復(fù)雜一些。他相信這個世界是所有可能世界中最好的一個，但什么是“所有可能的世界”？難道上帝在扔骰子嗎？難道已知的宇宙還有另外的選項嗎？

一方面相信“神的目的”，另外一方面，萊布尼茲則相信機(jī)械論的宇宙，并且這個宇宙是由不可再分的“單子”組成的。而令所有這些彼此不受影響的單子，經(jīng)由上帝的算法，如鐘表般穩(wěn)妥地運(yùn)行著。

理性主義的萊布尼茲作為十七世紀(jì)的全才，他發(fā)明了微積分，提出了二進(jìn)制，制造出世界上第一臺能做加減乘除的計算機(jī)器。

萊布尼茲堅信，能夠建立起一種普遍的方法，“把一切正確的推理歸結(jié)為一種計算”，這一思想成為現(xiàn)代計算機(jī)科學(xué)和人工智能的遠(yuǎn)祖，預(yù)示了“一切皆可計算”的未來。

離散與組合?

如同原子論或者微積分的思想，計算機(jī)科學(xué)和人工智能通過將復(fù)雜問題拆解為簡單的、低維的元素（0和1），然后再通過組合形成多維空間來解決更復(fù)雜的問題。

計算機(jī)通過將一切信息，無論是文本、圖像、聲音還是視頻，都拆解為0和1的序列。

每一個0或1代表一個比特位，計算機(jī)通過這些比特位的組合，可以表示任何復(fù)雜的數(shù)據(jù)或結(jié)構(gòu)。

這種拆解和組合的能力，是計算機(jī)處理復(fù)雜問題的核心。

就像在數(shù)學(xué)的微積分中，連續(xù)的函數(shù)被分解成無數(shù)個小的微小變化（微分），從而能夠精確地理解和計算變化的累積效果，計算機(jī)科學(xué)的核心也是通過二進(jìn)制（0和1）來表示離散信息，并進(jìn)行高效的處理。

以圖像數(shù)據(jù)為例，計算機(jī)將圖像的每一個像素拆解為數(shù)值表示，其中每個像素的顏色信息通常以RGB通道表示。

對于一張224x224的彩色圖像，它的表示形式為一個三維張量：224 x 224 x 3，其中：

224x224是圖像的高度和寬度，表示每個像素的空間位置。
**3個通道（RGB）**代表每個像素的顏色強(qiáng)度（紅、綠、藍(lán)）。

每個像素的顏色值本質(zhì)上也是由0和1組成的二進(jìn)制數(shù)字，這些數(shù)字通過不同的強(qiáng)度值（通常是0到255的范圍）來編碼顏色。

如上，這是將一維的比特組合成更高維的空間，從而能精確表示顏色、位置等信息。

這種構(gòu)建方式類似于通過多維度理解現(xiàn)實問題，AI也能夠通過維度的擴(kuò)展與降維操作，更深入地解析復(fù)雜的現(xiàn)實世界。維度是處理復(fù)雜問題的關(guān)鍵工具。

分層處理機(jī)制???????

人工智能的起源可以追溯到公元前400年，哲學(xué)家如柏拉圖和亞里士多德提出，大腦在某種程度上類似于一臺機(jī)器，利用內(nèi)部語言編碼知識，通過邏輯推理選擇行動，這為人工智能的可行性奠定了思想基礎(chǔ)。

此后，數(shù)學(xué)家們引入了運(yùn)算邏輯和概率推理的工具，進(jìn)一步推動了對計算和算法的理解。

20世紀(jì)中期，AI開始從理論走向?qū)嵺`，隨著技術(shù)進(jìn)步，AI從最初的基于布爾邏輯的推理，逐漸轉(zhuǎn)向概率推理和數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)。

這一轉(zhuǎn)變顯著提升了AI的復(fù)雜問題處理能力，推動了實際系統(tǒng)的功能改進(jìn)，并與其他學(xué)科深度融合，使人工智能逐漸成熟為一個多學(xué)科交匯的領(lǐng)域。

（以上概述參考了斯圖爾特.羅素的總結(jié)。）

在此過程中，深度學(xué)習(xí)之父辛頓扮演了重要角色。?????

辛頓此生對“神經(jīng)網(wǎng)絡(luò)”有一種偏執(zhí)狂般的投入。這個過程漫長而跌宕。????????

20世紀(jì)中期，神經(jīng)生物學(xué)家大衛(wèi)·休伯爾和托斯坦·威澤爾通過實驗揭示了大腦視覺系統(tǒng)的分層處理機(jī)制：

人類認(rèn)知過程被視為一種分層迭代、逐步抽象的過程。

辛頓受到的啟發(fā)是：大腦通過分層處理逐步提取信息，人工神經(jīng)網(wǎng)絡(luò)也可以模仿這一過程。

他意識到，神經(jīng)網(wǎng)絡(luò)可以像大腦那樣，使用多層結(jié)構(gòu)從低級特征（如像素或邊緣）到高級特征（如對象或面部識別）逐層抽象。

辛頓在1986年提出的誤差反向傳播算法，使多層網(wǎng)絡(luò)的訓(xùn)練成為可能，但其真正突破是在2006年，他通過“逐層預(yù)訓(xùn)練”有效地克服了深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練的困難。

深度學(xué)習(xí)的核心優(yōu)勢之一，是自動化的分層特征提取。

繼續(xù)我們自由的類比，深度學(xué)習(xí)可以自己發(fā)現(xiàn)維度，自己定義維度，甚至不用對人解釋--有些也解釋不了。????

傳統(tǒng)的機(jī)器學(xué)習(xí)依賴人工定義和選擇特征，而深度學(xué)習(xí)通過多層神經(jīng)網(wǎng)絡(luò)逐層自動學(xué)習(xí)，提取數(shù)據(jù)中的高層次特征。

這一過程不需要人為介入，可以從低級信息（如像素、聲音波形）中逐步提取出更抽象的特征（如物體、語義）。這種自動化極大減少了特征工程的復(fù)雜性。

這像是一個逐步升維、從局部到全局的理解過程。

每一層的神經(jīng)網(wǎng)絡(luò)通過對低維度信息的處理和組合，提取出更高維的特征，最終形成對數(shù)據(jù)的全面認(rèn)知。

正如爬山、解謎、搭建樂高或繪畫的過程一樣，深度學(xué)習(xí)通過分層抽象，讓計算機(jī)能夠自動從簡單到復(fù)雜、從具體到抽象地理解世界。

高維向量??

在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)中，維度通常指的是特征空間的大小。

我們輸入的每一個數(shù)據(jù)點(diǎn)（無論是圖像、文本還是其他形式的輸入）都在一個高維空間中表示。

類似于毒酒問題中將100桶酒用7個二進(jìn)制位表示，在神經(jīng)網(wǎng)絡(luò)中，模型將復(fù)雜的輸入數(shù)據(jù)映射到一個更緊湊的表示空間中，確保通過最低的維度表示出最多的信息。

我們來通過一個實際的簡單例子，描述大模型和Transformer的工作原理。

假設(shè)我們要用一個Transformer模型來完成一個常見任務(wù)：翻譯一句簡單的英文句子到中文。句子是：“I love cats.”

1. 輸入的準(zhǔn)備：將句子轉(zhuǎn)化為向量

Transformer模型不能直接處理文字，它需要將輸入的句子“I love cats.”轉(zhuǎn)化為向量（數(shù)字形式）。這一過程稱為詞嵌入（Word Embedding）。

詞嵌入的過程：每個詞都會被轉(zhuǎn)換成一個高維向量。例如，假設(shè)模型使用768維的向量，那么每個詞都會用一個768維的向量來表示。這些向量不僅僅是隨機(jī)數(shù)字，它們包含了詞的語義信息。例如，“l(fā)ove”和“l(fā)ike”在語義上相近，它們的向量可能相似。

因此，句子“I love cats.”被轉(zhuǎn)換為以下向量序列：

I → [0.5, 0.2, ... , 0.8]（768維向量）
love → [0.3, 0.9, ... , 0.1]（768維向量）
cats → [0.7, 0.4, ... , 0.2]（768維向量）

通過將每個詞轉(zhuǎn)換成高維向量，模型可以更好地表示每個詞的復(fù)雜含義和它與其他詞之間的關(guān)系。

這就是升維思考的第一步：將簡單的文字映射到更高維度的空間，從而捕捉它們的復(fù)雜語義和語境信息。

2. Transformer的自注意力機(jī)制

接下來，Transformer模型使用其核心機(jī)制——多頭自注意力機(jī)制來處理這個向量序列。

自注意力機(jī)制幫助模型理解每個詞與句子中其他詞的關(guān)系，并為每個詞在句子中的重要性分配不同的權(quán)重。

自注意力機(jī)制會為每個詞計算它與句子中其他詞的關(guān)系。例如：
通過這種關(guān)系的計算，模型可以更好地理解整個句子的結(jié)構(gòu)和含義。
- “I”和“l(fā)ove”有關(guān)系（主語和謂語）。
- “l(fā)ove”和“cats”有關(guān)系（動詞和賓語）。
多頭自注意力機(jī)制：每個注意力頭關(guān)注句子中的不同關(guān)系。例如：
- 一個注意力頭可能專注于“l(fā)ove”和“cats”之間的關(guān)系。
- 另一個注意力頭可能專注于句子的整體結(jié)構(gòu)，比如“主語—動詞—賓語”的模式。

這些注意力頭會從不同角度理解句子的每個詞，使模型能夠生成一個更全面的表示。

類比一下：我們可以將注意力機(jī)制類比為毒酒問題中的侍衛(wèi)，每個侍衛(wèi)負(fù)責(zé)檢查一個特定的桶。

每個注意力頭就像一個侍衛(wèi)，負(fù)責(zé)檢查輸入中的特定模式。最終，模型通過多個“頭”捕捉到句子中的豐富信息，類似于侍衛(wèi)通過喝酒推斷哪個是毒酒。

3. 基于概率的輸出生成

輸出生成是基于概率分布的。在每一步翻譯過程中，模型并不是直接生成一個確定的翻譯，而是計算每個可能翻譯的概率分布，并選擇概率最高的詞作為輸出。

例如，當(dāng)模型要翻譯“l(fā)ove”時，它會計算多個可能的翻譯，并生成以下概率分布：
模型會選擇概率最高的詞“愛”作為翻譯。
- “愛” → 85%的概率
- “喜歡” → 10%的概率
- 其他翻譯 → 5%的概率

最后，模型會輸出句子“我愛貓”。

概括而言，大模型之所以能夠在多個任務(wù)上表現(xiàn)出色，主要是因為它們通過大量數(shù)據(jù)學(xué)習(xí)到了豐富的高維表示。

這些表示能夠很好地捕捉輸入數(shù)據(jù)中的模式和復(fù)雜關(guān)系。

相比于傳統(tǒng)模型，大模型的高維表示具有更好的泛化能力，能夠在不同任務(wù)之間遷移學(xué)習(xí)。

為什么大語言模型像最聰明的人那些，能夠?qū)W習(xí)不同領(lǐng)域的知識，并且可以自由遷移？???????

辛頓的解釋非常有趣：

這些大語言模型所做的是尋找共同的結(jié)構(gòu)，通過發(fā)現(xiàn)共同結(jié)構(gòu)，它們可以用更有效的方式對事物進(jìn)行編碼。

讓我給你一個例子，如果你問GPT-4"為什么堆肥堆和原子彈類似"，大多數(shù)人都無法回答，他們認(rèn)為堆肥堆和原子彈是完全不同的事物。

但GPT-4會告訴你，雖然能量和時間尺度不同，但它們都涉及鏈?zhǔn)椒磻?yīng)，當(dāng)堆肥堆越熱就會發(fā)熱越快，當(dāng)原子彈產(chǎn)生的中子越多，產(chǎn)生的中子就越快，所以它們其實都是鏈?zhǔn)椒磻?yīng)的形式。

許多人覺得大模型不過是在拼湊人類已有的知識，辛頓認(rèn)為這是錯誤的。對此我深感認(rèn)同。我最喜歡向ChatGPT問的問題，經(jīng)常與打比方有關(guān)。?????????????????

現(xiàn)實世界中，許多人假裝自己是聰明人，但是有兩點(diǎn)最難偽裝：打比方的能力，和幽默感。

辛頓認(rèn)為大模型能夠理解知識的本質(zhì)（至少是從人類角度定義的“本質(zhì)”），并且把“這種理解壓縮到了它的權(quán)重參數(shù)中”。

多模態(tài)

盡管語言模型已經(jīng)表現(xiàn)出相當(dāng)?shù)目臻g推理能力，但引入多模態(tài)處理將使這些模型獲得更深層次的理解和推理能力。

多模態(tài)模型整合了來自不同感官的信息源——如圖像、視頻、聲音、甚至機(jī)器人操作——這使得模型能夠不僅僅依賴語言來學(xué)習(xí)世界。

多模態(tài)模型使得機(jī)器可以像人類一樣，在更復(fù)雜的“維度”中進(jìn)行操作。?

例如，當(dāng)模型能夠通過視覺看到一個物體，并通過模擬或物理操作與該物體進(jìn)行交互，它就會更直觀地理解物體之間的空間關(guān)系和物理規(guī)律。

這種轉(zhuǎn)變相當(dāng)于將AI從一個符號處理的世界提升到了一個接觸現(xiàn)實的高維世界，從而讓AI更好地理解物理世界中那些難以用語言描述的復(fù)雜概念。

計算既是工具，也是理解世界的視角。

隨著AI技術(shù)的不斷發(fā)展，我們不僅在追求更強(qiáng)大的計算能力，更是在探索“何為智能”的本質(zhì)問題。

從萊布尼茲的普遍計算設(shè)想，到當(dāng)下的大模型和多模態(tài)，世界似乎正在逼近一個神秘的邊界——那就是對世界的全面認(rèn)知，這認(rèn)知可能不僅僅來自算法，更或許是人類與機(jī)器在復(fù)雜維度中的共同演化與創(chuàng)造。

那么，人類正在逼近“上帝的算法”嗎？

八

以上“五、六、七”三節(jié)，我們探討了人類如何理解世界以及何謂“看到”和“知道”。

休謨通過懷疑因果關(guān)系和實體的觀念，提出了經(jīng)驗主義的核心觀點(diǎn)：

我們所有的知識都來自于感官經(jīng)驗。

人類在理解世界時，實際上是通過感官所獲取的印象，將這些印象進(jìn)行組合、記憶和反思，從而形成對事物的認(rèn)知。

而洛克則進(jìn)一步區(qū)分了第一性質(zhì)（物體的固有屬性）和第二性質(zhì)（通過感官與物體交互產(chǎn)生的屬性），為我們提供了一個系統(tǒng)的框架，解釋了人類如何通過經(jīng)驗識別和分類物體。

這種基于經(jīng)驗和感知的認(rèn)知方式，似乎為現(xiàn)代人工智能提供了某種隱喻——機(jī)器通過算法，尤其是大模型和神經(jīng)網(wǎng)絡(luò)，也在執(zhí)行類似的感知任務(wù)。

機(jī)器學(xué)習(xí)模型不具備人類經(jīng)驗的復(fù)雜性，但它們通過多維特征的整合和分類，能夠在模糊信息中找到概率上的最佳解。

這種“經(jīng)驗”不再依賴于人類的主觀感受，而是通過龐大的數(shù)據(jù)和概率統(tǒng)計進(jìn)行決策。

隨著大模型的出現(xiàn)，人工智能通過比特世界中的多維計算，在某種程度上復(fù)制了人類從經(jīng)驗中學(xué)習(xí)的過程。

就像我們在面對一個蘋果時，通過顏色、形狀、味道等特征將其歸類為一種特定的水果，機(jī)器也通過將復(fù)雜信息降維為高維向量來完成分類和推理。

貝葉斯推理等技術(shù)幫助機(jī)器在不確定性中進(jìn)行推斷，模擬了人類在因果關(guān)系模糊時依賴概率推理的方式。

然而，大模型帶來的不僅僅是經(jīng)驗的復(fù)制，它通過升維思考進(jìn)入了更高層次的智能探索。

大模型能夠通過多層神經(jīng)網(wǎng)絡(luò)提取出超越人類感知的特征，不僅是在我們所理解的空間內(nèi)“看到”世界，還能在我們無法直接感知的高維空間中進(jìn)行推理和決策。

正如我們前面所討論的，AI通過“高維空間”在信息上實現(xiàn)了穿墻破壁，仿佛成為了能夠超越感官局限的存在。

似乎只有“神”才可以如此。

從最初的人類經(jīng)驗主義出發(fā)，我們通過大模型進(jìn)入了一個新的認(rèn)知維度，也標(biāo)志著人類對理解世界的新方式：

我們不僅依賴感官經(jīng)驗，通過數(shù)學(xué)和定律，經(jīng)由推理和實驗，還借助AI來拓展我們的認(rèn)知邊界，進(jìn)入那些我們無法直觀感知的高維領(lǐng)域。

AI能夠構(gòu)建出“上帝的算法”嗎？

或許，并非如此簡單。

盡管大模型能夠通過高維向量解析復(fù)雜的現(xiàn)實，捕捉無數(shù)的特征和模式，甚至超越人類的感知范圍，但它仍然受限于我們所提供的數(shù)據(jù)和算法規(guī)則。

我們所逼近的，并非上帝的視角，而是人類所能構(gòu)建的最復(fù)雜、最精確的理解工具。

在不斷的升維過程中，我們確實擁有了窺見更多維度的能力，但真正的“上帝算法”或許仍然超越我們所能觸及的范圍。

我們依然處于對宇宙深層次奧秘的探索階段。通過AI和大模型，我們能夠在多維空間中捕捉到更多的細(xì)節(jié)，重點(diǎn)也許不是找到終極答案，而是維度的突破。

我個人的好奇之處是：

大模型以及之后的AI，是幫助人類完成愛因斯坦的一樣的宇宙認(rèn)知革命，還是說我們不再需要人類的知識結(jié)構(gòu)和因果推理？

畢竟，愛因斯坦是一位堅定的因果信徒。并非是他不接受概率化的方法，而是不相信上帝只是在扔骰子。即使是扔骰子，那是一顆什么樣的骰子？

即使是今天，大部分也無法理解愛因斯坦的相對論。

在相對論的框架中，愛因斯坦提出物質(zhì)不僅能影響空間，還能重塑四維時空。

《歡樂數(shù)學(xué)之瘋狂微積分》里有一個形象的比喻：

太陽并不像盒子里的保齡球那樣靜止不動，而是像床墊上的保齡球，壓在織物上，扭曲了周圍的時空區(qū)域。因此，當(dāng)一顆行星繞太陽運(yùn)行，或一個蘋果朝地球的方向墜落時，它們并不會陷入某種牛頓引力無法解釋的痛苦之中，只是在沿著阻力最小的路徑穿過一個彎曲的四維空間而已。

對此，物理學(xué)家約翰·惠勒總結(jié)道：

“物質(zhì)告訴時空該如何彎曲，而彎曲的空間則告訴物質(zhì)該如何運(yùn)動。”

也許，我們會用一種混合了碳基生物和硅基生物智慧優(yōu)勢的模式，繼續(xù)擴(kuò)展地球文明智慧的邊界。????????

一個簡單而生動的證據(jù)是：

理論上，一百萬只猴子胡亂敲打鍵盤，一定有一只能夠創(chuàng)作出莎士比亞的劇作。但是，這個時間卻要比宇宙的生命還要長。??????????

那么，為什么地球上會出現(xiàn)一個叫莎士比亞的人，創(chuàng)作出那么多劇作？

我的這個思想實驗，一定會有概率上的先后設(shè)定問題。即使如此，下面的答案依然是有利于人類的：?

因為莎士比亞并不是一個在鍵盤前隨機(jī)敲打的猴子，他是基于全體人類的一個知識模型來創(chuàng)作的，包括語言，符號，傳說......甚至可能還夾雜有尼安德特人在篝火旁的故事。所有的在地球上存活的人，都從概率的角度，幫助了一個叫莎士比亞的人消除了雜亂，100%地創(chuàng)作出偉大的作品。???????

也許人類的故事才剛剛開始。

在這一進(jìn)程中，許多時候，維度的突破可能會是關(guān)鍵。

從維度的角度，我們更容易理解愛因斯坦的那句名言：

我們不能用制造問題時同一水平的思維來解決問題。

（The significant problems we face cannot be solved at the same level of thinking we were at when we created them.）?

而所謂更高的水平，往往是基于維度的。

九

關(guān)于思維或者認(rèn)知的維度，我不打算做一些老生常談的陳述。??

我想談及三個關(guān)鍵詞：

厚薄、Taste、隨機(jī)。

厚薄

圍棋是最復(fù)雜的游戲之一，規(guī)則卻很簡單，在一個19??19的二維格子上，演繹出比宇宙間所有原子數(shù)量還要多的變化。???

一個圍棋高手最厲害的地方是什么？

他能夠從更高維度去理解一個局面。

20世紀(jì)最偉大的兩個棋手之一吳清源，在晚年提出了“六合”圍棋。????????

所謂“六合”，指的是四方（東南西北）和天地（上下）。

吳清源認(rèn)為：棋的一子一子必須和所有的方面相和諧，追求的是恰到好處地處于當(dāng)時的位置。

不止是重視中腹，六合之棋的“天地”之維度，超出了棋盤平面的二維世界。

在一個僅有二維的棋盤上，哪有什么天地呢？???

他解釋說：子是有厚度和重量的。

所謂棋的厚與薄，外勢與實力，實質(zhì)上與時間有關(guān)。

圍棋很有趣--由于棋子并不具備可移動性（除非被吃），圍棋的過去和現(xiàn)在是被壓縮在一個坐標(biāo)化的棋盤上的。

我在人生算法里，說人生像是很多個切片串起來的。

圍棋則像是將這些切片層層疊放在一起。

這就是“厚”和“薄”。

理解并區(qū)隔圍棋的厚勢與實利，與許多重要的智慧“同源”。???

20世紀(jì)最偉大的兩個棋手之二李昌鎬，有一個被廣泛誤讀的名言：?????

我的每手棋只追求51%的效率。?????

也許這個話題值得另外寫一篇。對此我的一個簡單解構(gòu)是：???????

假如綠皮火車和高鐵一樣價格，你選哪一個？

除非你要體驗一下新奇或者懷舊，當(dāng)然是高鐵。????????????????

那么，假如有一手棋的效率是51%，另一手棋的效率是81%，如果代價是一樣的，為什么要選擇51%的，而不是81%的？?????????????????

對于一個職業(yè)棋手而言，每一盤棋的目標(biāo)是非常明確的：

令“比對手至少領(lǐng)先半目”的結(jié)果概率最大化。???

李昌鎬也不例外。???

他所說的51%，其實是關(guān)于局部最優(yōu)和全劇最優(yōu)的取舍：

某一手棋A，就局部效率而言，是51%，全局效率是81%；??????????

另一手棋A，就局部效率而言，是81%，全局效率是71%。?

那么，當(dāng)然是選擇51%的A。???????????????????

李昌鎬尤其擅長在領(lǐng)先的局面下，迅速縮短戰(zhàn)線，把棋盤“變小”。他會主動走一些看起來不是最優(yōu)的招法，但是卻能消除掉那些不確定性因素，從而把優(yōu)勢變成了勝勢。????

吳清源和李昌鎬的秘密，都與愛因斯坦的四維時空宇宙觀有相通之處--????????

在圍棋這樣一個基于二圍棋盤的游戲中，他們比對手有著維度之上的碾壓優(yōu)勢。???????

這也是天才棋手和厲害棋手之間的最大區(qū)別所在。???

Taste??

楊振寧曾在紐約州立大學(xué)石溪分校遇到一個15歲的學(xué)生，這個孩子非常聰明，輕松地回答了他提出的幾個量子力學(xué)問題。

楊振寧接著問他：這些量子力學(xué)的問題，哪一個你覺得是妙的？

然而，他卻講不出來。“對他講起來，整個量子力學(xué)就像是茫茫一片。”

楊振寧對他的看法是：盡管他吸收了很多東西，可是他沒有發(fā)展成一個Taste。

什么是Taste？似乎模糊。

還是讓楊振寧來解釋吧：

“......學(xué)一個東西不只是要學(xué)到一些知識，學(xué)到一些技術(shù)上面的特別的方法，而是更要對他的意義有一些了解，有一些欣賞。

假如一個人在學(xué)了量子力學(xué)以后，他不覺得其中有的東西是重要的，有的東西是美妙的，有的東西是值得跟別人辯論得面紅耳赤而不放手的，那我覺得他對這個東西并沒有學(xué)進(jìn)去。“

楊振寧說在西南聯(lián)大七年，對他一生最重要的影響，是對整個物理學(xué)的判斷，已有自己的Taste。

接下來這些內(nèi)容稍顯多余，但是對于教育的啟示太大了：

楊振寧自幼喜愛觀察自然，表現(xiàn)出強(qiáng)烈的愛美之心與好奇心。
父親是數(shù)學(xué)家，楊振寧從小接觸數(shù)學(xué)書籍，打下了扎實基礎(chǔ)。
在西南聯(lián)大期間，受到名師教授數(shù)學(xué)、物理及中文閱讀與寫作。
楊振寧的學(xué)術(shù)啟蒙得益于吳大猷和王竹溪兩位導(dǎo)師，分別引導(dǎo)他進(jìn)入對稱原理與統(tǒng)計力學(xué)領(lǐng)域。

所以，Taste像是一個人認(rèn)知世界的多元思維中的高維鳥瞰，未知世界里隱秘的關(guān)聯(lián)--哪怕只是關(guān)聯(lián)的投影。?????????

我們可以說，喬布斯是個很有Taste的人，這不是指藝術(shù)上的Taste，或是品味上的Taste，而是他能夠橫跨科技、藝術(shù)、商業(yè)，來做出一個超越時間的判斷。???????????????????

前面說的吳清源的對圍棋的天才感覺，也是一種Taste。????

也許每個人在獲取知識和發(fā)展認(rèn)知的過程中，都是在構(gòu)建和訓(xùn)練一個自己的大模型。???

所謂的Taste，就是在”茫茫一片“的神經(jīng)網(wǎng)絡(luò)之中，形成的某些石破天驚的重要連接。??

這和Transformer倒也有可以類比之處。?

Transformer通過自注意力機(jī)制，允許模型在不同維度上“看到”數(shù)據(jù)之間的相關(guān)性，提取出最關(guān)鍵的連接。

同樣地，Taste也是通過對信息的深刻理解，能夠超越表面，找到那些石破天驚的關(guān)鍵連接。

因此，Taste不僅是一種對知識的理解，更是一種超越時間和空間、對事物本質(zhì)的高維度判斷。

人們說，大模型時代，一個人重要的能力是提問。

然而，如果沒有Taste，不可能問出了不起的問題。?

最近一段時間，有些人鼓吹硬科技，重理輕文。可如楊振寧所說，如果沒有Taste，而總是追求有用，可能很難走得遠(yuǎn)。????????

愛因斯坦也有類似的觀點(diǎn)：

“在一定程度上而言，科學(xué)家對自然深層次美的領(lǐng)悟和熱愛，以及所具備的形而上的審美判斷力決定了其研究所能企及的高度。”

這一段落所說的Taste，和上一段落說的厚薄，都像是某種“直覺”。用愛因斯坦的話來說：

“真正有價值的是直覺。在探索的道路之上，智力作用不大。”

這種直覺，也是他眼中“由哲學(xué)的洞察力所創(chuàng)造的獨(dú)立性”，能夠幫助科學(xué)家避免陷入“見樹不見林”，愛因斯坦認(rèn)為這“正是一個工匠或?qū)＜遥c一個真正的真理追尋者之間，最大的區(qū)別。”

隨機(jī)

看起來，不管是厚薄，還是Taste，都是某種只可意會不能言傳的東西。???

那么，機(jī)器智能是如何感知圍棋的“厚薄”的？早在2016年，阿爾法狗已經(jīng)碾壓了人類自以為無法被超越的“靈性”。???

AI可以擁有楊振寧所說的那種Taste嗎？

起初，計算機(jī)像是一種純粹的基于邏輯推理的機(jī)器，直至不確定性和隨機(jī)性被引入。??????

辛頓的玻爾茲曼機(jī)代表了人工智能發(fā)展中的一次關(guān)鍵突破。

最早的神經(jīng)網(wǎng)絡(luò)，如霍普菲爾德網(wǎng)絡(luò)，更多是基于確定性原理來處理信息，擅長記憶和補(bǔ)全任務(wù)。

它通過逐步最小化能量進(jìn)入“能量井”，達(dá)到記憶模式的重現(xiàn)。

然而，這類網(wǎng)絡(luò)的局限在于，它們只能處理已經(jīng)學(xué)習(xí)過的模式，而無法創(chuàng)造新的模式，也無法理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。

辛頓的貢獻(xiàn)在于引入了不確定性和隨機(jī)性。

他提出的玻爾茲曼機(jī)通過模擬物理系統(tǒng)中粒子的隨機(jī)運(yùn)動，捕捉數(shù)據(jù)的概率分布，從而生成新的數(shù)據(jù)。

這個系統(tǒng)不再總是選擇最低能量狀態(tài)，而是根據(jù)波爾茲曼分布，概率性地做出決定。

這一創(chuàng)新讓機(jī)器學(xué)習(xí)模型從固定的邏輯跳躍到靈活的隨機(jī)領(lǐng)域，就像爵士樂手能夠在固定的音樂結(jié)構(gòu)中即興創(chuàng)作。

在物理學(xué)中，路德維希·波爾茲曼通過研究氣體分子運(yùn)動中的能量分布，提出了著名的波爾茲曼分布。

他發(fā)現(xiàn)，物理系統(tǒng)中低能量狀態(tài)的粒子比高能量狀態(tài)的粒子出現(xiàn)的概率更大，這種概率與粒子的能量成指數(shù)關(guān)系。

簡單來說，系統(tǒng)中更穩(wěn)定的狀態(tài)出現(xiàn)的概率更大，而高能量狀態(tài)雖然可能出現(xiàn)，但頻率較低。

這一觀點(diǎn)將隨機(jī)性帶入了物理學(xué)核心概念。波爾茲曼解釋了為什么在微觀層面上，粒子之間的碰撞會導(dǎo)致能量的分布不均勻，進(jìn)一步揭示了宏觀系統(tǒng)中的不確定性。

這為量子力學(xué)中的概率解釋奠定了基礎(chǔ)。量子世界中的每個事件都遵循某種概率規(guī)律，精確預(yù)測每個單獨(dú)事件幾乎不可能，但可以通過概率統(tǒng)計對整體行為進(jìn)行推測。

這種隨機(jī)性也滲透到了社會和金融領(lǐng)域。塔勒布的第一本書就叫《隨機(jī)漫步的傻瓜》。

在人生中，隨機(jī)性也扮演著關(guān)鍵角色。正如人類無法預(yù)知未來的一切細(xì)節(jié)，我們的命運(yùn)也往往受到各種隨機(jī)因素的影響。

真正的智慧不是消除不確定性，而是在升維思考中擁抱隨機(jī)性，借助概率找到那個最佳行動方案。

《人工智能：現(xiàn)代方法》寫到：

“按照常規(guī)的理解，邏輯要求關(guān)于世界的認(rèn)知是確定的，而實際上這很難實現(xiàn)......概率(probability)論填補(bǔ)了這一鴻溝，允許我們在掌握不確定信息的情況下進(jìn)行嚴(yán)格的推理。”

也許隨機(jī)性帶來了混亂，帶來了不安，但是，隨機(jī)性也是生命之源，是能量之本嗎，甚至也是時間的秘密。?

假如熱力學(xué)第二定律決定了孤立系統(tǒng)會自發(fā)地朝著最大熵狀態(tài)演化，為什么地球上會出現(xiàn)生命？為什么人的大腦能夠以如此復(fù)雜的機(jī)制去思考宇宙？???????

玻爾茲曼的解釋是：

我們觀測到的低熵世界來源于高熵宇宙的隨機(jī)漲落。

大的漲落可以造成熵很低的狀態(tài)，概率也很低，但在宇宙廣闊尺度下仍然會發(fā)生，而我們自身的存在也是來源于這種漲落帶來的低熵世界。

一個奇怪的演繹是：如果宇宙可以通過某種隨機(jī)波動從虛無中冒出來，那么相比之下，更簡單的東西，比如一個大腦，隨機(jī)出現(xiàn)的可能性會更大。

想象一下，你正坐在沙發(fā)上刷這篇文章，感覺一切都很真實。

可根據(jù)“玻爾茲曼大腦”的假設(shè)，你有可能根本不在客廳里，也沒有在看電影。你只是一個孤立的大腦，突然從虛無中“蹦”出來，帶著完整的記憶和感知。

盡管這個大腦只會存在極短的時間，然后很快消失，但在那短暫的一瞬間，它堅信自己正處于一個完整的、真實的世界里——正在和舒適的沙發(fā)上享受本文的摧殘，然而這一切只是大腦的幻覺。

另外一個懸念是：隨機(jī)漲落中生成的人類，有機(jī)會更長久地避開熵增定律，逃離死寂的命運(yùn)，去宇宙深處探尋秘密嗎？?????????

十

請AI幫我為本文總結(jié)出10條有價值的思考工具和行動指南--雖然有點(diǎn)兒多余。

1、升維思考：更高維度和多維度分析

在遇到復(fù)雜問題時，引入額外的維度（如時間、溫度、空間）幫助你從多個角度進(jìn)行分析。就像在毒酒問題中從二維升到三維，再到“七維”，增加維度可以發(fā)現(xiàn)更多的信息和解決方法。

2、降維行動：全局壓縮與奧卡姆剃刀

在面對復(fù)雜問題時，降維行動不僅是簡化思維，而是基于對全局的深刻理解，將冗余信息壓縮，保留最核心的要素。

就像奧卡姆剃刀的原則——去除不必要的假設(shè)，選擇最簡潔的路徑。

通過全局的思考做出局部的行動決策，確保簡化后的方案依然有效并且精準(zhǔn)，避免因過度復(fù)雜而拖延或增加不必要的風(fēng)險。

3、成為有Taste的人：培養(yǎng)獨(dú)特的判斷力

通過積累知識、體驗和反思，逐步建立對事物的“感覺”，培養(yǎng)你自己的Taste。?

Taste 是判斷力的高維版本，能夠幫助你迅速分辨重要信息，提升你的洞察力和決策效率。

4、概率思維：接受不確定性并優(yōu)化決策

現(xiàn)實中常存在不確定性，采用概率思維可以幫助你在不確定中找到最優(yōu)方案。通過貝葉斯推理或隨機(jī)策略，訓(xùn)練自己根據(jù)有限信息做出合理的推斷，并擁抱不確定性。

5、訓(xùn)練你大腦的大模型：持續(xù)的權(quán)重更新

在深度學(xué)習(xí)中，權(quán)重更新通過反向傳播不斷調(diào)整模型，使其表現(xiàn)越來越好。

類似地，我們在生活中的每一次嘗試、成功或失敗，都可以視為對自我權(quán)重的“更新”，通過不斷反思和調(diào)整行為策略，優(yōu)化自己。

將每一次失敗視為反向傳播的反饋，不斷調(diào)整你的思維和行動模式。以成長為目標(biāo)，注重逐步優(yōu)化，而不是尋求一次性的成功。

6、擁抱隨機(jī)性：把握你的概率權(quán)??

利用變化中的機(jī)會隨機(jī)性不僅是混亂的來源，也是機(jī)遇的來源。

在你的工作和生活中，適當(dāng)引入隨機(jī)性的概念，在多種可能性中大膽嘗試，利用“漲落”帶來的突破，找到隱藏的解決方案。

7、建立人生的估值函數(shù)：以終局目標(biāo)為導(dǎo)向采取行動

在行動時，不要追求最完美的選擇，減少不必要的思維復(fù)雜性。類似于李昌鎬在領(lǐng)先時縮短戰(zhàn)線的做法，鎖定目標(biāo)后迅速行動，避免過度優(yōu)化帶來的拖延。

8、時間維度利用：加入時間因素來解決問題

在現(xiàn)實世界里，總是可以看到但又被忽略的，是時間。

長期主義，必須將時間和空間整合成一個系統(tǒng)。

通過觀察事物在時間上的變化來做出判斷，將時間因素融入決策，提升長遠(yuǎn)的判斷力。

9、可操作的二進(jìn)制思維：把所有復(fù)雜難題簡化為二選一

學(xué)習(xí)二進(jìn)制的思維模式，幫助你在復(fù)雜情況下簡化決策。通過將問題拆解為“是/否”、“0/1”形式，快速找到核心點(diǎn)，這種思維方式有助于提升處理復(fù)雜問題的效率。

10、提問的藝術(shù)：用高維問題打開局面

大模型時代，人類最強(qiáng)的能力是提問。培養(yǎng)提出優(yōu)質(zhì)問題的能力。讓AI幫助你在探索過程中找到突破點(diǎn)。

最后

也許你還記得本文以盲人的難題開頭，請允許我用盲人的故事結(jié)尾。?????

盲人失去了觀察這個世界最重要的維度之一：視覺。這是普通人無法理解的沉重和不公。?

而有一位盲人不僅失去了視力，還失去了聽力。??

一個人處在這樣一個黑暗的、無聲的世界里，該如何活下去？

我想分享的故事的主角是海倫·亞當(dāng)斯·凱勒，她在19個月大的一次疾病中失去了視力和聽力。

1924年2月1日，紐約的WEAF廣播電臺播出了紐約交響樂團(tuán)現(xiàn)場演奏的貝多芬第九交響曲。

海倫·凱勒在家里“聽”了這場音樂會。如下圖：

后來她寫信給紐約愛樂，分享了自己的體驗。以下是該信。?????????

（中文翻譯來自網(wǎng)絡(luò)。）

親愛的朋友們：

雖然我既瞎且聾，我仍然懷著歡躍之情告訴你們：昨晚我度過一段光輝燦爛的時光，靠著收音機(jī)聆聽了貝多芬的《第九交響曲》。

我并不是說像其他人一樣“聽到”音樂；我也不知道是否能讓你們了解，我如何能從交響曲得到快樂。這連我自己都驚訝不已。

我早已從雜志上讀到收音機(jī)帶給盲者的幸福：它能帶領(lǐng)看不見的人到任何地方去。

我很高興知道盲者獲得了新的樂趣來源；但我從未夢想能得到和他們一樣的快樂。

昨晚，當(dāng)家人聆聽你們精彩的演出這不朽的交響曲時，有人建議我把手放在收音機(jī)上，看看我能不能感受到任何各式各樣的震動。

他旋開收音機(jī)的喇叭蓋，于是我輕輕碰觸敏感的震動膜。我驚奇地發(fā)現(xiàn)我能感受到的不只是震動，而且是充滿熱情的節(jié)奏、以及音樂的悸動和涌蕩！發(fā)自各種不同樂器的震動交纏并融合在一起，使我陶醉不已。

我能確切分辨短號、急切的鼓聲、低音的中提琴和優(yōu)雅合奏的小提琴。當(dāng)小提琴淹漫并鉆犁過其它樂器的最低音調(diào)時，它的演奏是多么地美妙！

當(dāng)人聲從和聲的波濤中顫栗躍出時，我馬上分辨出它們是更加狂喜、迅速上揚(yáng)如燃燒的火焰，直令我的心跳嘎然而止。

而女聲部的歌聲似乎具備了天使般的聲響，在美麗而鼓舞人的聲音洪流中和諧涌動。

接著所有的樂器和人聲一起爆發(fā)出來——像在天堂搖蕩的海洋——然后像風(fēng)一樣漸微漸消，于甜蜜音符的柔和沐浴中結(jié)束。

當(dāng)然這不是“聆聽”，但我確知這些音符與和聲傳達(dá)給我雄美和壯麗的情愫。同時我感受到——或者我自認(rèn)為感受到——自然的溫柔歌聲唱進(jìn)我手中；感受到搖擺的蘆葦和風(fēng)、以及潺潺的溪流。我以前從未因這么多的音調(diào)震動而狂喜過。

當(dāng)我聆聽時，黑暗和旋律、陰影和聲音充滿整個房間，我忍不住想到傾注如此甜蜜洪流給世界的這位作曲家，竟是和我一樣耳朵聾了。我驚訝于他不滅的精神所產(chǎn)生的力量，從他的痛苦中為別人粹練出歡樂——而我坐在這兒，用我的手感受這神奇的交響曲，仿佛海洋一般拍擊著他和我兩人寂靜的靈魂海岸。

這是一篇令所有能聽見、能看見的人汗顏的文字。

為什么失去了觀察世界的很多個維度，海倫·凱勒依然比絕大多數(shù)健全的人更能感知這個世界的秘密？

她自己曾經(jīng)給出過答案：?

“世界上最好和最美的東西是看不到也摸不到的……它們只能被心靈感受到。”

也許靈魂，才是一個人最重要的維度。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.