近日,一組關于80后死亡率的數據在網上引發廣泛關注。一些微信公眾號發文,“截至2024年末,80后死亡率突破5.2%,相當于每20個80后中就有1人已經去世。”“80后的死亡率已經超過70后?!币恍┪恼绿柗Q這些駭人聽聞的數據是來自第七次全國人口普查的所謂“權威數據”。事實真是如此嗎?
“80后死亡率破5.2%”?
專家:錯得離譜!
這就是日前在網絡社交平臺上廣泛傳播的表格,表格內容顯示“80后累計死亡率為5.20%”。
記者梳理發現,網絡上有不少引用這一數據的關于80后死亡率的文章,還有不少自媒體文章在不斷渲染,比如:“80后5.2%的死亡率,開啟了黃金一代的黯然離場”;再比如:“當80后開始集體謝幕——5.2%死亡率背后,一代人的生存困境與時代之殤”。
更有網絡圖片將所謂80后死亡率做成柱狀圖,稱:“每20人中1人已離世”,并標注對比數據,稱“70后死亡率低于更年輕的80后”。如此駭人聽聞的數據,是真的嗎?
中國人民大學人口與健康學院教授李婷長期從事人口發展研究,她表示,這一數據與事實嚴重不符。李婷在對網絡上相關文章進行梳理后發現,大多數文章都號稱該數據來自第七次全國人口普查的數據。然而第七次全國人口普查的時間是2020年,顯然其結果無法預測2024年的死亡率。此外,人口普查數據,只會公布去年一年對應時期的死亡率,比如2020年的第七次全國人口普查,反映的是2019年11月1日到2020年10月31日的死亡率,其中并不存在針對特定群體,比如“80后的累積死亡狀況”這樣的統計。
中國人民大學人口與健康學院教授李婷:從國家的統計流程,包括國家衛健委公布的每年跟死亡相關的數據,它都是一個時點數據。就是說,比如說公布的今年的預期壽命、死亡率、某個年齡的死亡率,它都是實時刻畫的,比如說,1990年死亡率、2000年怎么樣,這個也是國際上的官方統計最常用的方式。
而對于網絡上出現的關于“5.2%”的這個死亡率的數據,李婷教授也表示,錯誤非常明顯,因為專業統計數據中關于死亡率用千分率表示,而不是百分率。
此外,李婷教授認為,它還混淆了“累計死亡比例”與“年死亡率”的定義。
中國人民大學人口與健康學院教授李婷:死亡率數值比較小,一般是千分之幾,不可能高到5%的水平,“每20個80后中1人已離世”描述的是累積的死亡比例。
錯誤死亡率源頭
可能為“AI運算偏差”
這一聳人聽聞又漏洞百出的死亡率數據又是從何而來呢?中國人民大學人口與健康學院教授李婷梳理發現,很有可能是AI大模型在問題回答過程中出現錯誤。
李婷教授在AI大模型中輸入了“50、60、70、80,這幾代人的死亡率分別是多少”的問題,大模型顯示,根據網絡信息得出了“80后現存2.12億,存活率94.8%,死亡率5.2%”的表述。
中國人民大學人口與健康學院教授李婷:這其實依賴于訓練AI的語料。死亡率、累計死亡概率這些概念是相對很專業的,可能普通人都不會去理解。總體來說是一個相對冷門的知識點,因為它不是在日常大量使用的話語中,可能語料的質量不夠高。
對外經濟貿易大學法學院教授博士生導師張欣:“大模型幻覺”本身一個最重要的原因還是它的這個Transformer(編碼和解碼)的架構,現在大部分大模型都是使用這樣的一個架構。這個架構,本質上來講,其實還是基于統計的,或者說基于隨機性的這樣的一個概率生成,所以其實不管你是用什么樣的、哪家的大模型,它的本質上都是預測下一個字詞最有可能出現的概率生成的這樣的一個情況。
記者就發現,經過網絡發酵,死亡率竟然成為一些自媒體帶貨的噱頭。
可見,AI大模型雖然有超強的數據儲存和運算能力,但由于訓練的語料不足、數據來源局限等,就可能導致錯誤推算。而一些自媒體為了變現流量,也會斷章取義、借題發揮,助長這些離譜數據的炒作和傳播。
編輯 | 趙寧寧
主編 | 徐 菁
監審 | 宋錦峰
來源 | 央視新聞
部分素材來源網絡,如有侵權請聯系刪除
點擊下方公號名片,閱讀更多科普信息
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.