算法作為工具,使用不好是脫韁的野馬,但如果平臺精準把控、不斷迭代升級,則會成為技術的良駒。
小到拍張照片,大到智能機器人,算法早已悄悄全面“融入”我們的生活。
從簡單的規則到復雜的自我學習,算法不斷賦予機器更接近人類的智能。在算法的推動下,以DeepSeek為代表的生成式AI迅速發展。
不僅如此,無論是社交平臺的短視頻,還是新聞、電子書,甚至購物軟件,手機里的每一個APP能夠精準判斷用戶喜好,完成“猜你喜歡”,都是靠著算法的推動。
一方面,算法不斷推動著技術的進步,與此同時,關于算法“技術陰謀論”的想象也從未缺席,互聯網上從不缺對“信息繭房”和“算法造神”的批評,并把很多關于“算法陰謀”的想象最終指向平臺們的商業行為。
最近,抖音安全與信任中心網站上線,并首次公開抖音推薦算法原理,介紹其推薦算法如何預估用戶行為概率。那么,“信息繭房”到底存不存在?所謂推薦算法“有罪論”,究竟是真相還是背鍋?
爆款視頻真存在所謂的 “流量密碼”?
多年前,抖音憑借音樂卡點短視頻火爆全網,讓不少人對抖音內容的認知一直是“短平快”。然而,除了頭部網紅,去年在抖音上最火的作家,竟然是史鐵生。
根據抖音發布《2024抖音讀書生態數據報告》,抖音上時長大于等于5分鐘的讀書類視頻總數量達1143.43萬個,收藏量達3.91億次;讀書類直播累計730萬場,場均觀看人數3076人;讀書書評相關內容共有541萬個,總評論量為2306萬次,《我與地壇》成抖音最受歡迎的名著經典,報告顯示抖音上史鐵生相關視頻累計18.6萬個,增長192%,總時長增長415%,總分享量增加51%。
這似乎與民間總結的所謂的“流量密碼”背道而馳。
舉個例子,不少“教人做內容”的博主,科普的內容基本都是要先了解“內容平臺的算法邏輯”,才能把握住“流量密碼”,做出爆款。
而民間總結的很多算法邏輯,就是給內容和用戶貼標簽,然后算法就能向具有特定品位的觀眾推送相匹配的視頻。再就是說算法是通過完播率、點贊率、分享率、粉絲轉化率和評論率等各種指標來評估內容的質量水平,再推進內容流量池。
如果根據以上的邏輯來判斷一個視頻是否能成為爆款,那關于“史鐵生”的內容顯然不符合大眾認知里的“熱點”和“流量”。但實際上,民間總結的所謂的“流量密碼”,大部分總結都過于簡單、不夠客觀,甚至出現事實錯誤。
在抖音安全與信任中心中,其實詳細解釋了算法到底是怎么推薦的。
首先,算法是通過數據收集、特征工程、模型訓練等復雜流程預測用戶的行為,其本質是數學模型的運算過程。推薦算法的本質是個極其高效的信息過濾系統。個性化推薦算法,好比給每個人量身定制了一個信息“快遞員”,能更高效、準確地把合適的信息推送到用戶面前,滿足每個用戶各不相同的需求。
而觀眾從打開抖音、觀看視頻、劃過視頻,以及點贊收藏視頻,都是一次反饋動作。抖音公開的推薦算法核心邏輯可以簡化為“推薦優先級公式”:綜合預測用戶行為概率 × 行為價值權重 = 視頻推薦優先級。
也就是說在打開抖音的內容推薦上,是多目標推薦系統,通過非常復雜的體系,優化對內容價值的評估,不僅僅是點贊收藏,不同用戶、作者的行為價值權重等等,共同構成了視頻推薦優先級。
同時抖音還有自己的價值模型評估,簡單來說,通過價值模型,對用戶的互動行為進行價值計算,并通過不斷調整參數,對各類價值進行加權。不僅會關注內容本身以及用戶反饋,還會考慮到作者收益以及平臺生態。
這也就解釋了,為什么史鐵生可以成為抖音上最火的作家:是創作者的精彩輸出、用戶的積極反饋、平臺對優質內容推動等因素的共同作用。
打破信息繭房,才是算法的目標
每當提到算法,必然會有人提及現代網絡世界里的“信息繭房”。
“信息繭房”一詞,最為人熟知的來源是美國法學教授凱斯·桑斯坦的《信息烏托邦》,是指當個體只關注自我選擇的或能夠愉悅自身的內容,而減少對其他信息的接觸,久而久之,便會像蠶一樣逐漸桎梏于自我編織的“繭房”之中。這一沒有實證的假說,在當下互聯網環境中,逐漸被概念泛化和被營銷炒作。
一方面,這個“繭”有可能被技術強化,但不得不承認的是,這種現象更大程度上是由個人偏好引發。簡單來說,人類天生就傾向于接觸符合自己喜好的信息,這才是最終造成所謂“信息繭房”的最主要原因。
但是算法存在的意義,其實是在當下信息過載時代,讓用戶更為高效地獲取信息。
讓我們來看一組數據對比。
在信息時代之間,大部分人獲取信息的方式是通過親朋好友,再多一點是報刊、書籍,而現在,據IDC(國際數據公司)發布的《數據時代2025》報告顯示,全球每年產生的數據將從2018年的33 ZB(1 ZB等于10萬億億個字節)增長到175 ZB,以25Mb/秒的下載速度計算,一個人下載全人類2025年產生的數據需要18億年。具體到每個人,我們每天面對的各個平臺的信息增量,遠超個人所能處理的極限。
所以算法從海量數據中精挑細選,通過計算得出更為優質的內容進行推送,某種程度上來說也可以成為打破信息繭房的存在。從商業理性出發,讓用戶看到更多元的內容,有利于平臺的長期價值,因此和用戶的利益是一致的,各個平臺早就做了不少打破信息繭房的實踐。
比如現在大部分平臺都有“關閉個性化推薦”的選項。更進一步的是各個平臺都在持續不斷優化算法邏輯,比如從最初的單一點贊,增加到對“負反饋機制”的完善,將“不感興趣”等數據納入模型訓練。
像小紅書之前就強調用戶可以通過“內容偏好調節”來掌握對內容的自主選擇和管理權。這樣就更方便用戶主動打破“看過什么就一直推送什么”的循環,讓算法更加高效。
抖音算法在多目標建模體系下,設置了專門的探索維度,通過多樣性探索、興趣探索等目標,引導算法打破“繭房”。
實際上,在各個平臺對算法的不斷完善和實踐中,我們基本已經可以認識到算法雖然復雜,但是同樣可以被“調教”。抖音總裁韓尚佑曾表示:“真正實現算法的‘向上’和‘向善’,需要回到算法的原理和生效機制層面去持續改進。”
比如曾經抖音也嘗試過直接給知識、歷史、科技等內容做簡單的加熱,但這種做法改變了模型正常的計算邏輯,反而讓內容的后續推薦受到了干擾。
為了解決這個問題,抖音轉換思路,專門訓練了預估收藏和重復觀看概率的模型,并且將收藏按鈕,放在了首頁最容易點的地方。通過反復的實踐和不斷試錯,2024年,一條《450分鐘解讀紅樓夢》的超長視頻,在抖音獲得了超過3億的播放,700萬的收藏。
同樣,這也意味著,算法在各個平臺的不斷努力下,更加適配當下的網絡環境和用戶心態了。
當算法走進生活
實際上,前文也提到算法在發展的過程中不斷完善,平臺也是階段性針對市場反饋,主動做出舉措調整。而更重要的意義是,在算法不斷完善的過程中,它帶來的社會價值也正在一點點顯現出來。
首先,推薦算法基本原理是高效分發,將信息、人原本孤立的點連接起來,當不同的信息遇到不同的群體,就會帶來不同的效應,進而帶來更大的社會價值。
2015年,當大部分實體書店都在走下坡路的時候,電商巨頭亞馬遜開出一家實體書店,一年半就實現了盈虧平衡。當所有傳統書店都在震驚的時候,大家發現這家書店最出色的設計就是能夠根據線上的讀者評分、預售情況、銷量排行等通過算法得出“推薦書單”,而很多讀者就是通過這樣高效的推薦方式在貨架上買到了自己想要的書。
而現在,抖音算法更進一步通過精準分法、興趣連接和生態共建,推動實現了知識普惠。
抖音上有個非常有趣的例子,去年一顆長蘑菇的蘋果在抖音上成為了網紅。故事起因于一位浙江網友分享黃梅天里自己家里的蘋果長出了蘑菇,于是被中國科學院昆明植物研究所許博士注意到,并買下來這個蘑菇樣本做研究,并且在抖音上向網友實時匯報進度,還有不少網友在評論區發出自己見到的菌落請教博士,6000多萬網友共同圍觀了這場全民知識接力。
現在,抖音的算法在協同過濾算法和知識圖譜推理的共同作用下,能夠基于用戶行為,推薦相關科普內容,拓展到相關領域形成“知識鏈式反應”,甚至一些甲骨文、弦理論的小眾知識,都能通過算法找到受眾。
再比如,算法正在推動更為實際的惠民。從淄博燒烤、到哈爾濱、天水等小眾城市的走紅,到農產品走出大山,都離不開背后算法的積極作用。
抖音算法通過召回、過濾、排序等環節,重點學習用戶的興趣愛好、瀏覽歷史、購買行為等,通過分析數據,將大山里的農產品精準推送給對農產品感興趣、有需求的用戶,并且通過算法助力打造“新農人IP”,讓大眾通過對農人故事的關注關聯到土特產上。
根據抖音電商發布的《2024豐收節抖音電商助農數據報告》2023年9月至2024年9月,抖音電商累計銷售農特產品71億單,平均每天有1740萬單農特產包裹銷往全國各地,持續帶動優質農特產品“出村進城”。平臺全年農貨商家數量同比增長63%,三農創作者數量同比增長52%。
總而言之,算法作為工具,使用不好是脫韁的野馬,但如果平臺精準把控、不斷迭代升級,則會成為技術的良駒。值得肯定的是,抖音公開算法,是個積極的實踐,至少讓公眾知道,有人工運營和平臺治理做導航,算法會持續向上向善,為人們的數字生活增添絢麗的色彩。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.