歡迎收看最新一期的 Hunt Good 周報!
在本期內容你會看到:
11 條新鮮 資訊
5 個有用 工具
3 個有趣 案例
4 個鮮明 觀點
Hunt for News|先進頭條
雷軍回應 AI 語音被惡搞
據紅星新聞報道,昨日,在十四屆全國人大三次會議北京市代表團小組會議上,全國人大代表、小米集團創始人雷軍分享了自己遭遇 AI 換臉技術濫用的親身經歷,并呼吁相關部門加強對人工智能新技術應用的立法監管。
雷軍在會上表示,這兩年人工智能技術快速突破以后,出現了很多老百姓喜聞樂見的應用,比如 AI 換臉、擬聲等,但任何一個人的臉和聲音都能輕松被用來做各種視頻,成了新的違法重災區。
雷軍闡述自身經歷說:「 去年『十一』,有網友說過了 7 天假,被我整整罵了 8 天,剛開始我覺得網民拿我開涮我也能接受。但這類內容增多且質量低劣后,防不勝防,網友也紛紛投訴。」
雷軍表示,當他想通過法律維權時,卻發現對此沒有專門的立法,只能用隱私權、肖像權、名譽權等法律起訴,而這些都要量化損失。
「 在網上被罵 8 天,損失根本沒法量化。」雷軍說。雷軍在發言中呼吁,人工智能技術興起以后產生了很多新問題,相關部門要提前預判,提前立法。
值得一提的是,雷軍在此前公布的 2025 兩會建議就提到,加強「AI 換臉擬聲」違法侵權重災區治理。
「人工智能深度合成技術的快速發展,推動了『AI 換臉擬聲』在影視、廣告、社交等領域的廣泛興起,成為喜聞樂見、傳播力強、易成熱點的技術應用。但同時也看到,『AI 換臉擬聲』不當濫用成為違法侵權行為的重災區,易引發侵犯肖像權、侵犯公民個人信息以及詐騙等犯罪行為,不利于構建『以人為本、智能向善』的人工智能發展生態。」
蘋果承認 Siri 新功能開發延遲
蘋果公司近日正式確認,將推遲發布部分 Apple Intelligence 功能,特別是「更加個性化的 Siri」體驗。
據蘋果發言人 Jacqueline Roy 表示, 這些新功能的開發「需要比預想更長的時間」,預計將在「明年」才能向用戶推出。
在去年 6 月的 WWDC 開發者大會上,蘋果曾重點宣傳了 Siri 的全面升級計劃,承諾通過 Apple Intelligence 技術讓 Siri 具備個人背景感知能力,從而為用戶提供更加個性化的服務。
這些功能包括能夠在用戶的各種應用中搜索和提取信息,例如從郵件、短信或筆記中找出特定內容;具備屏幕感知能力,可以理解并執行與屏幕內容相關的指令;以及跨應用操作功能,讓用戶能夠通過語音在不同應用間無縫執行復雜任務。
盡管推遲了這些功能,蘋果在過去六個月中仍推出了一系列 Apple Intelligence 相關功能,包括讓 Siri 更具對話性、引入 ChatGPT 集成、添加寫作工具、生成表情、圖片游樂場、減少干擾模式、郵件和消息摘要、智能回復以及照片 app 中的自然語言搜索等功能。
https://9to5mac.com/2025/03/07/apple-intelligence-personal-siri-delayed/
? 蜜月期結束,微軟自研 AI 模型
據 The Information 援引知情人士消息稱,微軟公司已成功研發一系列內部人工智能模型,名為 MAI,其測試性能表明可與 OpenAI 和 Anthropic 的模型相媲美。
這些模型有望為微軟的 Copilot 智能助手提供支持,增強其處理用戶問題和提供具體建議的能力。
除基礎模型外,微軟還在開發「推理模型」,旨在解決更復雜的查詢并展現類人思維能力。值得注意的是,微軟上月已將 OpenAI 的 o1 推理模型整合進 Copilot 產品中。
有趣的是, 報道中提到微軟希望能夠查看 OpenAI o1 模型在推理過程中的「思維鏈」,以便在自家的 AI 模型中復制相關技術。 然而,OpenAI 拒絕了微軟的要求,這也讓微軟的研究團隊在研發自己的 AI 模型時遇到了困難。
此外,微軟發言人表示,公司正采用混合模型策略,包括繼續與 OpenAI 保持深度合作,同時利用自研 AI 模型和開源模型。這一策略可能減輕微軟對 OpenAI 的依賴,后者已獲得微軟約 130 億美元的投資。
兩家公司最近重新談判合作協議,允許 OpenAI 在某些條件下使用其他云計算服務商的服務器,該協議將持續至 2030 年。
微軟首席財務官艾米·胡德在近期會議上強調,雙方都在為未來十年乃至二十年的發展做規劃。除 MAI 外,微軟已推出名為 Phi 的小型模型,并銷售多家公司的 AI 模型產品。
據報道,微軟還測試了包括 Anthropic、Meta 和馬斯克的 xAI 等公司模型作為 Copilot 的備選方案。艾米·胡德表示, 雖然微軟為擁有 OpenAI 的領先模型感到自豪,但也需要構建和引入其他模型以確保選擇多樣性。
https://www.theinformation.com/articles/microsofts-ai-guru-wants-independence-from-openai-thats-easier-said-than-done?rc=a4cwro
Manus 發布、質疑與回應,復現項目爆火
近日,時下火熱的 AI Agent 產品「Manus」開通了其 X 賬號「ManusAI_HQ」。但在前日,Manus 的 X 賬號突然被封禁,并顯示賬號違反了 X 的社區規則。
隨后,Manus 聯合創始人兼首席科學家 Yichao Peak Ji(季逸超)在 X 平臺發文稱,據初步調查,本次賬號封禁可能與加密貨幣騙局有關。季逸超強調,Manus 未涉及加密貨幣項目、代幣發行或者區塊鏈倡議,并提醒任何與 Manus 關聯的加密貨幣項目都為騙局,而公司也正在對該類冒名者進行起訴。
此外,季逸超強調目前正在努力與 X 平臺的支持團隊聯系,并重新恢復賬號運營。截至目前,賬號已解除封禁。
Manus 于 3 月 5 日晚間正式亮相, 一經公布后,Manus 迅速在互聯網各大社交平臺引起熱議。但目前 Manus 采用邀請碼的方式進行內測,且邀請碼數量有限,導致出現「一碼難求」的情況,在某二手平臺甚至出現高達 5 萬元的「轉手邀請碼」價格。
Manus AI 合伙人張濤也在近日發文回應稱,團隊低估了大眾的熱情,目前服務器資源無法滿足市場需求,因此只好采用邀請碼機制,同時也表示團隊正在全力輸出,爭取讓大家早日體驗到更好的產品。同時,張濤還澄清了 「付費獲取邀請碼」的傳聞,并透露 Manus 從未投入任何市場推廣預算。
隨著 Manus 在國內的爆火出圈,其聲浪也逐漸在國外的 Reddit 和 X 平臺泛起了漣漪。知名 X 博主 Rowan Cheung 在體驗完 Manus 之后,認為其表現「瘋狂得令人深刻」。
在開源領域,近日,MetaGPT 的 4 名團隊成員在 GitHub 發布了名為「OpenManus」的開源項目,旨在復刻 Manus 的核心功能,同時降低使用門檻。
令人驚訝的是,該項目僅花費了 3 小時便開發完成,目前 OpenManus 在 GitHub 已獲得超 1 萬的星標。據官方介紹,OpenManus 支持 SEO 審計與報告生成,同時采用輕量化設計。
其基于 MetaGPT 的多智能體協作框架,支持利用不同角色分工并自動化生成代碼與文檔;此外,OpenManus 的開源特性,允許社區為其貢獻擴展功能。OpenManus 由 Anthropic computer-use 和 broswer-use 提供了基礎支持。
值得關注的是,OpenManus 與 Manus 有所不同,前者開發目標相較于后者更加側重技術驗證和社區協作,以及 OpenManus 的功能深度更加特定,無法像 Manus 一樣覆蓋廣泛。
同樣在 3 月 7 日,CAMEL AI 的 OWL 項目公布,并劍指 Manus。官方表示 OWL 直接做到開源界 GAIA 性能天花板,達到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表現。
據 CAMEL AI 介紹,OWL 通過逆向工程將 Manus 工作流拆解為 6 步,并開源所有模塊;支持 GitHub 一鍵 clone,同時工具鏈能夠自由擴展,執行環境也支持云端和本地任選。
CAMEL AI 強調,OWL 完全免費,且優化了 Token 消耗。值得一提的是,這些熱門開源項目的背后作者也不乏 00 后的身影。
OpenAI 計劃推出高端 AI Agent 服務,收費可達 2 萬美元
據 The Information 報道,OpenAI 計劃推出高端 AI Agent 服務,每月收費最高可達 2 萬美元。據悉,此類 Agent 主要針對高水平研究領域,長期目標是使該業務貢獻 OpenAI 約 20% 至 25% 的收入。
消息人士稱,OpenAI 高管已向投資人透露了明確的定價計劃:
面向「高收入知識工作者」的 Agent 收費約 2000 美元 / 月;針對軟件開發人員的 Agent 定價約 10000 美元 / 月; 而面向博士級別研究工作的 AI Agent 定價則高達 20000 美元 / 月。
據此前的報道,上述的 AI Agent 應用場景包括針對高收入知識工作者的 ChatGPT 版 Agent,用于篩選并排序銷售線索;面向資深軟件工程師的高級編碼助手;以及幫助勞倫斯·利弗莫爾國家實驗室研究人員解決核聚變相關問題的 OpenAI o1 模型 Agent。
此外,OpenAI 的投資方之一軟銀已承諾今年內將在 OpenAI 的 Agent 產品上投入 30 億美元。
https://www.theinformation.com/articles/openai-plots-charging-20-000-a-month-for-phd-level-agents?rc=a4cwro
聯手 Perplexity,德國電信計劃年內推出「AI 手機」
德國電信近日在 MWC 上宣布,將與 AI 公司 Perplexity 聯合打造一款 AI 手機。
這款手機將于今年下半年正式亮相,并計劃在 2026 年正式上市銷售,售價將低于 1000 美元,初期主要針對歐洲市場。
Perplexity 聯合創始人兼 CEO Aravind Srinivas 表示, Perplexity 正從一個簡單的「回答機器」轉變為「行動機器」,不僅能回答問題,還能為用戶預訂航班、安排餐廳、發送郵件、撥打電話、設置提醒等多種任務。
德國電信表示,其推出的 AI 手機能夠扮演用戶「虛擬助手」的角色。
無論是查找信息、預訂出租車、安排餐廳用餐,還是完成購物等任務,都可以通過一個統一的應用程序實現,省去了在不同應用之間來回切換的麻煩。
此外,這款手機內置的人工智能功能還可以優化多種日常操作,例如撰寫電子郵件、進行語言翻譯、播放音樂以及撥打電話等。
用戶只需雙擊電源鍵,或者從鎖屏界面直接點擊,即可進入 Magenta AI 平臺。
該平臺初期將整合 Perplexity 提供的 AI 助手服務,后續還將陸續引入 Google Cloud AI(內容分析)、ElevenLabs 以及 Picsart 等功能模塊,進一步擴展其服務能力。
https://techcrunch.com/2025/03/03/deutsche-telekom-and-perplexity-announce-new-ai-phone-priced-at-under-1k/
? 馬斯克阻止 OpenAI 轉型營利性公司的訴訟請求被駁回
美國加利福尼亞州奧克蘭地區法官伊馮娜·岡薩雷斯·羅杰斯本周駁回了馬斯克提出的初步禁令請求。
這項請求本想暫停 OpenAI 向營利模式的轉變。不過,法官同意在今年秋季對此案進行審判。法官表示,馬斯克沒有達到「初步禁令所需的高門檻」。
但她強調,考慮到「公眾利益和可能的違法轉型帶來的潛在危害」,她希望快速解決這起訴訟。
OpenAI 對法官的裁決表示歡迎。他們認為馬斯克的訴訟「始終是關于競爭的」,暗指馬斯克所創立的競爭對手 xAI。馬斯克的律師則表示,他們很高興法官同意「快速審理此案的核心指控」。
馬斯克在 2015 年共同創立了非營利組織 OpenAI,但后續因與團隊存在分歧離開 OpenAI。
現在,他指責 OpenAI 背離了最初使命。他認為 OpenAI 本應為人類利益開發人工智能,而非追求企業利潤,OpenAI 及其 CEO Sam Altman 否認了這些指控,并表示轉向營利模式對于籌集資金、在 AI 競爭中保持優勢至關重要。
https://www.theguardian.com/technology/2025/mar/05/musk-openai-for-profit-shift
2024 圖靈獎得主正式公布
美國計算機協會(ACM)宣布, 以表彰他們在強化學習領域奠定的概念與算法基礎。
據了解,從 20 世紀 80 年代起, Barto 和 Sutton 通過一系列論文提出了強化學習的核心思想,構建了其數學基礎,并開發了關鍵算法,使其成為智能系統研究中最重要的方法之一。
值得一提的是, 被譽為「強化學習之父」的 Richard Sutton,曾是 Barto 的博士及博士后學生,兩人的師生合作成就了這一領域的基石。
目前流行的 ChatGPT 和 DeepSeek 均廣泛使用了強化學習技術。強化學習的應用還涵蓋了多個領域,包括網絡擁塞控制、芯片設計、提升聊天機器人的行為和推理能力以及改進計算機科學中的經典問題。
此外,包括 Barto 在內的研究表明,某些強化學習算法實際上是對人腦多巴胺系統運作機制的最佳解釋之一,加深了人類對大腦學習過程的理解。
ACM 主席 Yannis Ioannidis 評價表示,Barto 和 Sutton 的貢獻不僅僅是一個過渡階段的成果,而是一個仍在持續發展的領域。強化學習仍在不斷進步,不僅推動計算機科學的發展,也為許多其他學科帶來了無限可能。因此,ACM 授予他們計算機領域最具影響力的獎項。
https://awards.acm.org/about/2024-turing?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=openai-s-20-000-ai-agents
全球首個人形機器人半馬將在北京亦莊舉辦
2025 北京亦莊半程馬拉松將首次增設人形機器人半程馬拉松比賽,賽事主題為「亦馬當先,智領未來」。
這場創新賽事將于 4 月 13 日 7 點 30 分鳴槍起跑。根據安排,賽事報名通道將于 3 月 5 日 10 時開放,3 月 11 日 17 時截止。
本次賽事特別之處在于采取「同步報名、同一賽道、同時起跑」的原則,讓人形機器人與運動員共同參賽。為確保安全,雖然路線相同,但機器人與運動員將通過鐵馬或綠化帶隔離,擁有單獨賽道。
考慮到人形機器人技術的現狀,組委會將機器人比賽關門時間設為 3 小時 30 分鐘左右。
參賽機器人必須具備人形外觀且能實現雙足行走或奔跑,明確禁止輪式結構。控制方式可以是手動遙控(包含半自主)或完全自主。
參賽團隊需確保機器人安全,不得對賽道、其他機器人和周邊人員造成損害。為增加比賽趣味性和可完成性, 規則允許在比賽過程中更換電池或以接力形式更換機器人完賽,但每次更換機器人將被罰時 10 分鐘。
https://mp.weixin.qq.com/s/EZuXOSmsLm20\_OxD6FgN2g
? Ilya 在做什么?沒有人知道
離職僅一年,OpenAI 前首席科學家 Ilya Sutskever 所創立的 Safe Superintelligence(SSI)公司已躋身全球最具價值的科技企業之列。
據知情人士透露,SSI 正獲得約 20 億美元新一輪融資,估值達到 300 億美元,估值增長了六倍,此輪融資由 Greenoaks Capital 領投。
與大多數 AI 初創公司不同,SSI 并不高調宣傳。
公司網站僅有 223 字的使命聲明,約 20 名員工被建議不要在 LinkedIn 上提及公司名稱。來面試的候選人甚至需要將手機放入屏蔽無線信號的法拉第籠中,才能進入 SSI 辦公室。
據 WSJ 報道,Ilya 向合作伙伴透露, 他并未采用他在 OpenAI 時的研究方法,而是發現了一座「不同的山峰」,并已顯示出早期成功跡象。
在去年底罕見的公開演講中, Ilya 討論了他正在努力開發的超級智能,指出這類系統可能是不可預測的、具有自我意識的,甚至可能要求自身權利。
他表示:「如果 AI 只是想與我們共存,這并不是一個壞結果?!?/p>
https://www.wsj.com/tech/ai/ai-safe-superintelligence-startup-ilya-sutskever-openai-2335259b?mod=tech\_trendingnow\_article\_pos1
? Llama 4 將在幾周內推出
據金融時報報道,Meta 公司計劃在未來幾周推出的最新開源大型語言模型 Llama 4 中引入改進的語音功能。
據知情人士透露, Meta 將注重打造更接近自然對話的用戶體驗,允許用戶在交流過程中隨時打斷 AI 助手,而非遵循嚴格的問答模式。
商業方面,報道稱 Meta 正考慮為其 AI 助手推出高級訂閱服務,提供預訂和視頻制作等 Agent 功能。
公司還計劃在 AI 助手的搜索結果中引入付費廣告或贊助內容。另外,扎克伯格今年還宣布了打造具備中級工程師能力的 AI Agent,他認為這一領域擁有非常大的市場潛力。
Meta 首席產品官克里斯·考克斯近日在摩根士丹利會議上表示,Llama 4 將是一種「全能模式」,其中語音將成為「原生功能」,而非簡單地將語音轉文本再轉回語音的過程。
他強調:「你可以與互聯網對話,向它詢問任何事情,這種能力的強大之處我們仍在不斷探索。」
https://www.ft.com/content/a1014427-c2ce-4204-b41a-001277309cea
Hunt for Tools|先進工具
騰訊混元「圖生視頻模型」正式發布并開源
3 月 6 日,騰訊混元發布圖生視頻模型并對外開源,同時上線對口型與動作驅動等玩法,并支持生成背景音效及 2K 高質量視頻。
官方介紹,基于圖生視頻的能力, 用戶只需上傳一張圖片并簡短描述,混元即可按照用戶要求讓圖片動起來,變成 5 秒的短視頻,還能自動配上合適的背景音效。此外,上傳一張人物圖片,并輸入希望「對口型」的文字或音頻,圖片中的人物即可「說話」或「唱歌」;如果選擇動作模版,還能一鍵生成同款跳舞視頻。
騰訊混元表示,此次開源的圖生視頻模型,是混元文生視頻模型開源工作的延續,模型總參數量保持 130 億,適用于多種類型的角色和場景。開源內容包含權重、推理代碼和 LoRA 訓練代碼,支持開發者基于混元訓練專屬 LoRA 等衍生模型。
目前用戶通過混元 AI 視頻官網即可體驗,企業和開發者可在騰訊云申請使用 API 接口使用;同時,混元視頻生成開源模型目前在 Github、HuggingFace 等主流開發者社區均可下載體驗。
https://mp.weixin.qq.com/s/HnJuExUxqxJqDmm6LQkz4A
阿里發布 QwQ-32B
3 月 6 日凌晨,阿里巴巴發布并開源全新的推理模型通義千問 QwQ-32B。通過大規模強化學習,千問 QwQ-32B 在數學、代碼及通用能力上實現質的飛躍,整體性能比肩 DeepSeek-R1。
官方介紹,千問 QwQ-32B 是阿里探索推理模型的最新成果。在冷啟動基礎上,阿里通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習,在 32B 的模型尺寸上獲得了令人驚喜的推理能力提升,應證了大規模強化學習可顯著提高模型性能。
在一系列權威基準測試中,千問 QwQ-32B 模型表現異常出色,幾乎完全超越了 OpenAI-o1-mini,比肩最強開源推理模型 DeepSeek-R1。其中,在測試數學能力的 AIME24 評測集上,以及評估代碼能力的LiveCodeBench中,千問 QwQ-32B 表現與 DeepSeek-R1 相當,遠勝于o1-mini及相同尺寸的R1蒸餾模型。
在保持強勁性能的同時,千問 QwQ-32B 還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。
目前,千問 QwQ-32B 已在魔搭社區、HuggingFace 及 GitHub 等平臺基于寬松的 Apache2.0 協議開源,所有人都可免費下載模型進行本地部署,或者通過阿里云百煉平臺直接調用模型 API 服務。同時,用戶也將可通過通義 App 免費體驗最新的千問 QwQ-32B 模型。
3 月 6 日, 全球最大的 AI 開源社區 HuggingFace 更新了大模型榜單,QwQ-32B 成功登頂。據顯示,QwQ-32B 居于榜單第一,超越微軟的 Phi-4、DeepSeek-R1 等模型。
https://qwenlm.github.io/blog/qwq-32b/
字節跳動發布國內首個 AI IDE
字節跳動最近正式上線了國內首個 AI 原生集成開發環境(AI IDE)— Trae 國內版,其配置 Doubao-1.5-pro 模型,并支持切換滿血版 DeepSeek R1、V3 模型。
據官方介紹, Trae 定位「智能協作 AI IDE」,以「人機協同、互相增強」為核心理念,對代碼補全、代碼理解、Bug 修復、基于自然語言生成代碼等開發過程全場景都有非常好的適應性。
其中,Trae 的全新 Builder 模式能充分利用 AI 的能力:只需要用簡單的語言描述需求,Trae 就可以迅速搭建起項目框架,還能持續進行調優修改,產出可用代碼。
在代碼理解維度,Trae 能夠對開發項目上下文的極致理解,深入剖析代碼倉庫,實時獲取 IDE 中的各種環境上下文,為開發過程提供最為契合、準確的解決方法。Trae 的實時代碼續寫技術可基于開發項目整體上下文進行智能補全,提升編碼效率。
此外,在 Trae 的交互體驗方面,開發者可以便捷地將 AI 生成的代碼一鍵應用到多個模塊,還能根據實際需求隨時靈活調整指令,并實時預覽 AI 生成代碼的前端效果。
目前,Trae 國內版已上線官網,并提供下載安裝包,已支持 MacOS 和 Windows,Linux 版本已開啟預約。
https://mp.weixin.qq.com/s/I8GBoOkLk030Sa3pePYgSA
Mistral AI 推出號稱世界最強 OCR
「法國版 OpenAI」Mistral 本周推出了一款號稱世界上最強的 OCR 模型的全新 API 服務,專為處理復雜 PDF 文檔的開發者設計,能夠將任何 PDF 文檔轉換為 Markdown 格式文本文件。
以干凈格式存儲和索引數據已成為企業構建 AI 工作流的關鍵環節,而與市場上大多數 OCR 服務不同,Mistral OCR 采用多模態技術,能夠識別文本中的插圖和照片,并在輸出結果中保留這些圖形元素的位置信息。
該公司聲稱,其 OCR 性能優于 Google、微軟和 OpenAI 的同類服務,特別是在處理包含數學表達式、復雜排版和表格的文檔時表現出色,同時對非英語文檔的支持也更為友好。
更重要的是,該服務不僅輸出純文本,還會自動轉換為 Markdown 格式。
這種格式化語法允許開發者添加鏈接、標題等富文本元素。Markdown 已成為大語言模型訓練數據集的重要組成部分,同時也是 AI 助手生成結構化內容的常用格式。
Mistral 已將這項技術應用于其 AI 助手 Le Chat,當用戶上傳 PDF 文件時,系統會在后臺使用 Mistral OCR 理解文檔內容。附上 Le Chat 體驗地址:
https://chat.mistral.ai/chat
https://mistral.ai/news/mistral-ocr
macOS 版 ChatGPT 升級,開發者可在 IDE 中編寫代碼
ChatGPT 本周增添了直接編輯代碼的新功能。
具體來說,最新版 macOS ChatGPT 應用已支持在 Xcode 和 VS Code 等主流開發工具中直接編輯代碼。用戶還可以啟用「自動應用」模式,讓 ChatGPT 無需額外確認即可自動完成代碼修改。
從本周四開始,ChatGPT Plus、Pro 和 Team 訂閱用戶可通過更新應用獲取此功能,而企業版、教育版和免費版用戶則需等到下周。
OpenAI 產品團隊成員 Alexander Embiricos 在社交媒體上表示,Windows 版 ChatGPT 應用也將「很快」獲得此功能。
隨著直接編輯功能的加入, ChatGPT 現在能夠與 Cursor 和 GitHub Copilot 等專業 AI 編碼工具展開更直接的競爭。據報道,OpenAI 計劃在未來幾個月推出專門支持軟件工程的產品。
https://techcrunch.com/2025/03/06/chatgpt-on-macos-can-now-directly-edit-code/
Hunt for Fun | 先玩
? 一張照片,AI 就能知道你在哪里?
近日,Moonpig 公司的 AI 主管 Peter Gostev 最近發現,OpenAI 最新的 GPT-4.5 模型展示出超強的圖像地理位置識別能力,即使是背景極其模糊、幾乎看不清任何細節的照片,它也能準確識別出拍攝地點。
據 Gostev 表示,他進行了一系列測試,向 GPT-4.5 展示了多張具有挑戰性的圖片,包括偏僻街道、海岸線、咖啡館和庭院的照片。
而 GPT-4.5 幾乎每次都能準確猜出確切位置。唯一的例外是一張缺乏細節的隨機小街道照片,即便如此,它仍然正確識別出了國家。為排除元數據泄露的可能性,Gostev 特意使用了圖片的屏幕截圖進行測試,結果依然驚人。
他指出,雖然 Claude 3.7 在這項任務上表現最接近 GPT-4.5,但準確度和自信度仍有差距,而其他語言模型要么完全錯誤,要么給出過于模糊的回答,如「地中海某處」。
這一發現在 LinkedIn 上引發熱議。有用戶猜測模型可能在讀取 EXIF 數據,但 Gostev 確認已排除這種可能性。另有網友認為,盡管這種經過充分訓練的系統是基于對全球圖像和元數據的大量接觸做出的「有根據的猜測」,但仍然是基于概率的,并非總是 100% 準確。
現在,GPT-4.5 已經向所有 Plus 用戶開放,感興趣的朋友不妨去測試一下。
https://www.linkedin.com/posts/peter-gostev_one-shockingly-impressive-capability-of-gpt-activity-7301990052614574080-PeBv/
讓 AI「推箱子」,效果會怎樣?
近日,Hao AI 實驗室做了一個有趣的測試,通過讓多款頂級 AI 模型挑戰 1989 年經典游戲「推箱子」(Sokoban),測試它們的空間推理和決策能力。
結果慘不忍睹, o3-mini 僅能達到第 4 關,且在處理兩個相互糾纏的箱子時就遇到了瓶頸。Claude-3.7-thinking 和 Deepseek-R1 分別只解決了兩關和一個關卡,而 Gemini-2.0-flash-thinking 則完全無法解決任何關卡。
研究人員指出,「推箱子」游戲雖然規則簡單,但它要求玩家具備長期規劃和強大的空間感知能力,這恰恰是當前 AI 模型的弱點。
為改善 AI 在此類任務中的表現,Hao AI 實驗室開發了一個將游戲視覺狀態轉換為文本的模塊,并通過重新設計關卡調整難度,同時嘗試賦予 AI 代理自我一致性和記憶能力。
該研究還發現,非推理型 AI 模型在這類任務中表現更為糟糕,甚至連第一關都無法完成。
Hao AI 實驗室強調,像「推箱子」這樣的經典游戲應成為評估人工通用智能(AGI)的重要工具,為 AI 研究提供可重復使用的測試基準。
https://x.com/haoailab/status/1897792946646421514
? 硅碳生命交流群
大家是否想過,把幾個知名的 AI 拉進一個群聊,會是怎么樣的局面?
現在,這個想法得到了實現。
近日,基于 React和 Cloudflare Pages 的多人 AI 聊天項目 Botgroup.chat 上線。在聊天窗口中,用戶可以與多個 AI 角色同時參與對話,Botgroup 將提供類似群聊的交互體驗。
同時 Botgroup 還支持自定義 AI 角色和個性、AI 角色禁言功能等特點。
目前,Botgroup.chat 已上線 GitHub,并且也有線上體驗鏈接。 https://botgroup.chat/
Hunt for Insight|先知
馮遠征回應「用 DeepSeek 寫劇本」:缺乏人的溫度
據中國日報報道,知名演員馮遠征近日在采訪中分享了他使用 DeepSeek 生成劇本的經歷。
他表示, 自己曾嘗試利用 DeepSeek 將小說提煉成話劇劇本的提綱,結果令他印象深刻——不到一分鐘,AI 就完成了這項任務,且提煉效果出人意料地好。
隨后,他繼續使用 DeepSeek 生成劇本,
他表示,從技術角度看,AI 生成的劇本質量確實很高,語言嚴謹規范,結構完整,但 「它可能缺少了一個溫度,就是真正人的溫度。」
馮遠征認為,科技是無限的,但有限之處在于如何讓人去真正利用它,而不是它來左右人。
Hugging Face 首席科學官:我們需要敢質疑的 AI
Hugging Face 聯合創始人兼首席科學官 Thomas Wolf 最近發文稱,如果人工智能研究沒有實質性突破,AI 可能僅會成為「服務器上的唯唯諾諾者」,而非真正的創新者。
Wolf 認為,當前的 AI 發展路徑難以產生能夠進行創造性思考和突破性解決方案的系統。
他指出,現有的 AI 模型更像是「非常聽話的學生」,擅長填補已知知識之間的空白,但缺乏質疑現有認知框架和提出全新問題的能力。
「人們通常犯的主要錯誤是認為牛頓或愛因斯坦等人只是優秀學生的放大版。」
沃爾夫在文章中寫道,「要在數據中心創造愛因斯坦,我們不僅需要一個知道所有答案的系統,而且還需要一個能夠提出別人從未想過或不敢問的問題的系統?!?/p>
沃爾夫將這一問題部分歸因于 AI 領域的「評估危機」。
他指出,目前用于衡量 AI 系統進步的基準測試大多集中在有明確、封閉式答案的問題上,這限制了系統發展出質疑和創新能力的可能性。
作為解決方案,他建議行業應當發展新的評估標準,能夠測量 AI 是否能采取「大膽的反事實方法」,并基于微小線索提出一般性建議。
「科學最重要的方面是提出正確問題和質疑自己所學知識的能力, 我們不需要一個能用常識回答所有問題的 A+ 學生,而是需要一個能看到并質疑其他人所錯過的東西的 B 級學生。」
https://techcrunch.com/2025/03/06/hugging-faces-chief-science-officer-worries-ai-is-becoming-yes-men-on-servers/
模型即產品?
近日,科技博主 Alexander Doria 發表了一篇題為《模型即產品》的文章,指出 AI 領域的下一個發展周期將是「模型本身即產品」。
多項關鍵因素正在推動這一轉變:
首先,通用模型 Scaling 已遇到瓶頸,OpenAI 在發布 GPT-4.5 時透露,模型能力呈線性增長,但算力成本卻呈指數級攀升;其次,特定任務的強化訓練效果遠超預期,模型開始真正「學習任務」,呈現出既非傳統機器學習,也非基礎模型的全新特性;再者,推理成本大幅下降,使得單純銷售模型調用次數的商業模式難以為繼。
以 DeepResearch 和 Claude Sonnet 3.7 作為「模型即產品」的典型案例,前者并非簡單在 GPT 基礎上增加外部搜索功能,而是訓練了一個全新模型,能夠完全在內部完成搜索任務。
同樣,Anthropic 也明確表示,真正的智能體必須能自主決定任務實現過程和工具使用方式。
這種趨勢表明,各大 AI 實驗室正逐步停止開放 API,轉向自己訓練并直接提供完整模型服務。 文章引用 Databricks 投資人 Naveen Rao 的預測,未來 2-3 年內,所有閉源 AI 提供商將停止提供 API 服務,只有開源模型才會繼續提供 API 接口。
AI 行業正面臨重大轉型,模型本身已成為產品,未來主導權將掌握在那些專注于模型訓練的公司手中。
https://vintagedata.org/blog/posts/model-is-the-product
圖靈獎得主:科學里沒有權威
Richard Sutton 在榮獲計算機科學最高榮譽——圖靈獎后,接受了一場獨家采訪。
他表示,當初收到獲獎通知時完全出乎意料,甚至因忘記會議時間而遲到,直到看到一群他略感面熟的前圖靈獎得主才意識到發生了什么。
在訪談中,Sutton 強調了強化學習的核心理念——從經驗中學習。
他指出這與大語言模型等其他人工智能技術有著本質區別,大語言模型主要是從人類那里學習并模仿人類行為,而強化學習是從直接經驗中學習,這是最自然的學習方式。
Sutton 還特別提到,這一理念可以追溯到人工智能之父艾倫·圖靈。
早在 1947 年,圖靈在倫敦數學學會的演講中就明確表示「我們想要的是一臺能從經驗中學習的機器?!共粌H如此,圖靈還提出了獎勵和懲罰的概念,這正是現代強化學習的基礎。
面對近年來強化學習技術在 AlphaGo 和最近 DeepSeek 等項目中的重大突破,Sutton 保持著冷靜的態度。他認為 AI 的發展是一場馬拉松而非短跑,盡管取得了巨大進步,「AI 最具影響力的部分還沒到來?!?/p>
對于年輕研究者,這位圖靈獎得主建議要志向遠大,但別驕傲自滿。 他特別強調了「科學里沒有權威」的理念,鼓勵研究者保持質疑精神,不論對方擁有什么頭銜或榮譽。
Sutton 也分享了自己的一個重要理念:「每個人能做的最重要貢獻,往往是那些對自己來說顯而易見的東西?!惯@也許正是這位強化學習先驅最終獲得計算機科學最高榮譽的秘訣。
https://www.youtube.com /watch?v=9\_PepvnqIfU&t=29s&ab\_channel=Amii
彩蛋時間
作者:@yu285338525
工具:Midjourney
Prompt:In the city, a white long-haired Angora cat standing on a rooftop, looking down at the bustling street below. Realistic style, taken with an old-fashioned camera
鏈接:https://www.midjourney.com/jobs/8b97d932-099a-4902-a088-a28c3dfc0fcb?index=0
我們正在招募伙伴
簡歷投遞郵箱
hr@ifanr.com
?? 郵件標題
「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.