新智元報道
編輯:英智
【新智元導讀】從編程到論文,AI無處不在! 一項針對百萬條學生對話的分析顯示,AI不僅能調試代碼,還能潤色文章,甚至生成學習資料。但這背后,學術誠信的邊界在哪里?
如今,AI不再只是專業的研究工具,它已成為大學生日常學習的好幫手。
隨著AI越來越深入地融入教育環境,需要思考一系列關于學習、評估和技能培養的重要問題。
目前,大多數相關討論都基于調查和對照實驗,卻缺乏學生在真實學習場景中自然融入AI的直接證據。
為了填補這一空白,Anthropic開展了一項針對高等教育中AI實際使用的大規模研究,分析了Claude.ai平臺上100萬條匿名學生對話記錄。
報告的主要發現如下:
理工科學生是Claude等AI工具的早期使用者,其中計算機專業尤為突出。計算機專業僅占美國學位的5.4%,但在Claude.ai的對話中,占比卻高達36.8%。相比之下,商科、健康科學和人文學科的學生,Claude的使用率相對較低。
總結了學生與AI交互的四種模式,每種模式在數據中的占比大致相同(各占對話總數的23-29%),分別是直接解決問題、直接生成內容、協作解決問題和協作生成內容。
學生使用AI主要是為了創造新知識和進行分析,如創建編程項目或分析法律概念。這與布魯姆分類法中的高階認知功能相契合。不過,這也引發了人們的擔憂:如何防止學生過度依賴AI,而放棄自身關鍵認知能力的鍛煉?
教育領域的AI使用情況
研究人們如何使用AI模型時,保護用戶隱私是重中之重。
Claude Insights and Observations(簡稱Clio)是一款自動分析工具,能幫助了解人們使用Claude的具體情況。
Clio能深入挖掘用戶與Claude的對話內容,將其提煉成諸如「調試代碼」「解釋經濟概念」等高層次的總結,從而發現AI的使用模式。
研究中,Clio分析了來自Claude.ai免費和專業賬戶約100萬條匿名對話。
然后,進一步篩選出與學生學業緊密相關的對話,如課程作業、學術研究,最終得到574,740條有效對話。
接著,Clio對這些對話進行分類匯總,從不同角度得出有價值的見解,包括不同學科在對話中的占比、學生與AI交互方式的差異,以及學生交給AI完成的任務類型等。
學生用AI做什么?
研究發現,學生使用Claude的主要目的,是跨學科地創建和優化教育內容,這類對話占比達到39.3%。
具體為設計練習題、潤色論文、總結學術資料等。
33.5%的對話是讓Claude為作業提供技術解答,如幫學生調試代碼、修復編程錯誤、實現算法和數據結構,或解答數學難題。
其中部分行為可能存在作弊嫌疑,后面會詳細討論。
另外,還有一部分學生用來分析和可視化數據(11.0%)、輔助研究設計和工具開發(6.5%)、繪制技術圖表(3.2%),以及進行翻譯和校對(2.4%)。
下圖是各學科常見請求的詳細分類。
各學科使用AI的情況
通過對比Claude.ai的使用模式和美國各學科頒發學士學位的數量,發現計算機專業使用Claude的比例極高。
雖然計算機專業在學士學位中僅占5.4%,但在Claude.ai的對話中卻占了38.6%。這可能是因為Claude在編程方面的獨特優勢。
自然科學和數學專業Claude.ai的使用占比,也高于這兩個專業的學生人數的占比(分別為15.2%和9.2%)。
理工科學生,特別是計算機專業的學生,可能更早地將Claude用于學習。
這可能是因為計算機學生對Claude更熟悉,同時AI系統在處理STEM任務時,也更出色。
商科相關的對話在Claude.ai上僅占8.9%,而商科學位在美國學士學位中占比高達18.6%,可見Claude在商科領域的使用率較低。
學生如何與AI互動
分析學生與AI的交互時,識別出了四種不同的交互模式,按照兩個不同維度分類,具體如下圖。
第一個維度是「交互模式」,包括:
(1)直接對話,指的是用戶期望盡快得到問題的答案,解決自己的疑問。
(2)協作對話,即用戶主動與模型展開交流,通過對話來實現自己的目標。
第二個維度是交互的「期望結果」,分為:
(1)解決問題,也就是用戶尋求問題的解決辦法或解釋。
(2)生成輸出,意味著用戶想要生成像演示文稿、論文這類較長的內容。
這4種交互在對話中的占比相近(均在23%-29%之間),體現了學生對AI的多元應用。
傳統的網絡搜索通常只能提供直接答案,而AI支持更為豐富的交互方式,為教育帶來了新的機遇。
以下是一些用于學習的案例:
闡釋哲學概念與理論,幫助理解其內涵。
打造全面的化學學習資料,助力化學知識的學習。
為作業講解肌肉的解剖結構、生理機能和功能概念。
與此同時,AI也帶來了新的難題。
一個備受關注的問題是:「學生在多大程度上利用AI作弊?」
這個問題很難給出確切答案,因為并不清楚Claude的每一個回復在具體學習場景中的實際用途。
比如「直接解決問題」的對話,既可能是學生在居家考試中作弊,也可能只是在檢查練習題答案。
「直接生成成果」的對話,也許是學生想直接生成一篇論文,也可能是為進一步研究總結知識要點。
至于協作對話是否屬于作弊,也取決于具體的課程規定。
實際上,近一半(約47%)學生與AI的對話屬于直接對話,即參與度較低,只是單純尋求答案或內容。
雖然很多對話是出于合理的學習目的(如詢問概念性問題、生成學習指南),但還是發現了一些令人擔憂的情況:
讓AI提供機器學習選擇題的答案。
直接獲取英語測試題的答案。
借助AI改寫營銷和商業文本,以躲避抄襲檢測。
這些現象引發了關于學術誠信、批判性思維能力培養,以及如何有效評估學生學習效果的思考和討論。
即使是協作對話,學習成果也可能存在爭議。
比如「求解概率和統計作業問題并給出解釋」,雖然涉及學生與AI的多次交流,但大部分思考過程是由AI完成的。
Anthropic會持續關注這些交互情況,努力甄別哪些真正有助于學習和批判性思維的養成。
特定學科的AI使用模式
不同學科的學生與AI的互動方式存在差異。
在自然科學與數學領域,學生的對話多圍繞解決問題展開,常見的如「通過逐步計算求解特定概率問題」「為學術作業或考試題目提供詳細解答」。
計算機科學、工程以及自然科學與數學專業的學生,更傾向于選擇協作對話。而人文、商業和健康領域的學生,在協作對話和直接對話之間的選擇相對均衡。
教育領域的對話中,生成輸出的需求最為突出,占比達到74.4%。不過,這可能是由于篩選方法不夠完善。
這表明,針對不同學科制定專門的AI教育策略,或許能取得更好的效果。
學生交給AI的認知任務
團隊還研究了學生將哪些認知任務交給AI處理。
研究采用了布魯姆分類法,這是一種在教育領域用于將認知過程從簡單到復雜進行分類的框架。
雖然該框架最初是針對學生思維設計的,對其進行調整,用來分析Claude與學生對話時的回復。
研究結果顯示,Claude主要承擔高階認知功能,創造(39.8%)和分析(30.2%)是最常見的操作。
低階認知任務的占比相對較低,應用(10.9%)、理解(10.0%)和記憶(1.8%)。
生成學術文本摘要、撰寫論文反饋等生成任務,更多涉及創造。而解決微積分問題、解釋編程基礎知識等任務,則更多運用分析功能。
雖然AI具備這些能力,但這并不意味著學生不能自己運用這些技能。
比如,學生可以和AI共同完成項目,或者在其他場景中利用AI生成的代碼來分析數據集。
不過,這確實引發了人們的擔憂,學生是否會過度依賴AI,導致自身認知能力發展受阻。
畢竟,如果基礎技能得不到鍛煉,就如同倒金字塔一樣,難以穩固支撐高階思維的發展。
參考資料:
https://www.anthropic.com/news/anthropic-education-report-how-university-students-use-claude
https://x.com/AnthropicAI/status/1909626720476365171
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.