我課題組在心理學領域知名國際期刊Computers in Human Behavior(IF=9.9,JCR Q1, 中科院 Q1)上發表了題為“Detecting the risk of bullying victimization among adolescents: A large-scale machine learning approach”的研究成果,探索使用大樣本機器學習方法識別青少年欺凌受害的風險因素。
青少年處于身心發展的關鍵時期,在此期間遭受欺凌可能會導致其出現抑郁、社交焦慮、學業挫敗、自卑、孤獨、甚至自殘和自殺等負面結果。大量研究表明,經歷欺凌不是隨機事件,可以通過諸多風險因素來識別和預測。過往關于欺凌受害的風險因素研究多用傳統的回歸分析方法來探究單個因素與欺凌受害之間的線性關系,缺少對諸多因素同時作用的整體考慮。部分研究采用機器學習識別網絡欺凌風險,但數據來源局限于社交媒體中的文本語義識別,未能直接探討個人和環境因素對欺凌受害的識別。
本研究采集了來自全國各地40多萬名4-12年級兒童青少年的行為數據,包括人口學變量、家庭環境、同伴關系、學校環境等40個特征。研究團隊對比了六種機器學習算法的預測能力:邏輯回歸(Logistic Regression)、樸素貝葉斯(Naive Bayes)、決策樹(Decision Tree)、隨機森林(Random Forest)、K近鄰 (KNN) 和LightGBM,并選出表現最佳的模型。然后將40個特征帶入模型中按照重要值大小排序,最終選出了對于識別傳統欺凌受害和網絡欺凌受害分別最重要的9個風險因素。同時還分析了兩種欺凌受害(傳統欺凌、網絡欺凌)與其最重要風險因素之間的非線性關系,并將這些關聯與之前通過傳統回歸分析方法得出的研究結論進行了對比。
(據Random Forest和LightGBM算法對風險因素按特征重要值排序)
(基于LightGBM算法對風險因素按照特征重要值排序)
(識別傳統欺凌受害最重要的9個因素)
(識別網絡欺凌受害最重要的9個因素)
研究發現,經常感到抑郁、經常就醫吃藥、年齡小于13歲、經常處于二手煙環境、小學低年級、好朋友數量少、較高的消極情緒指數、較低的積極情緒指數,性別為男性是識別青少年傳統欺凌受害相對更重要的9個風險因素。經常感到抑郁、經常處于二手煙環境、每天觀看視頻超過半小時、每天玩電子游戲超過半小時、經常參與線上課外班、經常就醫吃藥、小學或初中年級的學生、較高的消極情緒指數、較低的積極情緒指數則是識別青少年網絡欺凌受害相對更重要的9個風險因素。總體而言,本研究結果表明抑郁癥狀、身體疾病、消極情緒和不健康的生活環境可能是增加欺凌受害的重要風險因素,而積極情緒可能降低欺凌受害的風險。
這些結果為進一步理解青少年欺凌受害的發生和發展提供重要的方向。基于大樣本的機器學習可能是從諸多相關因素中發現關鍵因素的有效手段。這有助于更有針對性的開展青少年欺凌的早期預防和干預,并根據重要性的排序為青少年建立更高效的心理健康支持體系。
本研究第一作者為我系博士畢業生,現斯坦福大學博士后閆偉,通訊作者為我系彭凱平教授和張鵬博士后。合著作者為英國杜倫大學社會學系研究生袁藝丹(現為清華大學積極心理學研究中心兼職研究助理),以及斯坦福大學博士后楊孟昊。本研究得到清華大學春風基金(2020Z99CFG013) 的支持,特此致謝。
文章鏈接:
Yan, W., Yuan, Y., Yang, M., Zhang, P., & Peng, K. (2023). Detecting the risk of bullying victimization among adolescents: A large-scale machine learning approach.Computers in Human Behavior, Article 107817. https://doi.org/10.1016/j.chb.2023.107817
責任編輯 | 吳衛國
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.