99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

我花了2天,找到了我覺得翻譯質量最好的AI大模型。

0
分享至

  做AI自媒體的人,讀前沿學術論文,跟著補課,提升自己的知識體系自然是少不了的。

  僅僅是為了跟上這個時代,就已經得拼盡全力不掉隊了。

  但是吧,不怕各位笑話,我的英語真的很差,最熟練的喊出來的那句英語是:

  I'fine,thank you,and you?

  真的,在讀各種文獻的過程中,即使已經用大模型加持翻譯了,但是還是受盡了各種折磨。

  就比如昨天豆包發了個AI圖像的論文。

  

  我尋思著翻一下之前他們SeedEdit的論文,對照著學習一下。

  

  就是這個。

  別的論文我不太懂,但是這類AI的論文呢,一般上下文邏輯咬的很死,并且充斥著大量高度專業化的術語和學術表達。

  像是:Out-of-Domain (OOD) 、DiT架構這類詞很多。

  光是專業學術用語部分,倒也還好。但遇見一些專業術語搭配復雜表達方式的文段,我說實話,我現在一般用沉浸式翻譯搭配OpenAI或者DeepL的API,翻譯起來還是懵逼。

  

  很多時候,它對于專業術語,即便不懂也要硬翻。對于我這種非專業的人來說,看起來就真的很費勁。

  正好最近又看了玉淵潭天做的關于AI翻譯質量的策劃,非常牛逼。所以我也想,不如我自己也評測一下。

  看看在這個場景下,到底哪個大模型,翻譯質量最好。

  說干就干。

  于是,我跟小伙伴肝了2天時間,測了N多題,找到了我們認為,目前翻譯效果最好的大模型。

  直接說結論:網易有道這個老牌翻譯廠商出的AI大模型子曰翻譯2.0,居然吊打了一切。。。

  說說我們是怎么測大模型的翻譯評測這塊的。

  測試的維度也很簡單,就從我平常受到的折磨體驗出發,梳理出了2點。

  這些AI必須:

  1. 說人話;2. 沒活別瞎翻。

  第一點,說人話。好解釋,翻譯內容符合中國人的語言習慣。

  第二點,沒活別瞎翻,就更好說了。專業術語和一些專有名詞,要是不會翻可以不翻,但別硬翻。其他內容基本正確就行。

  在選手上,我選了海外的Grok3,ChatGPT-4o、Claude 3.7、Gemni 2這標準四人組。國內我把能跑的也都跑了,不過受制于篇幅,文章里面我就只展示DeepSeek R1、智譜GLM-4、有道子曰翻譯2.0、Qwen 2.5-Max這四人組了。

  DeepSeek R1是唯一一個推理模型,雖然理論上我也不應該用推理模型來測翻譯,因為不實用。。。但是誰叫人實在太火了呢= =

  我給這這些大模型出的第一道題,就是SeedEdit這篇論文里的一個稍微復雜點的段落,涉及了一堆高頻專業術語,還包含學術引用信息、作者姓名。

  

  先看國產。

  說人話方面。

  Qwen和智譜GLM在說人話上都需要加強,最具代表性的句子就是這個:

  Qwen:我們注意到,我們的方法主要聚焦于HQ-Edit基準中的應用場景,在這些場景中,我們希望根據任意指令對T2I生成的圖像進行修改。

  智譜GLM:我們注意到,我們的方法主要關注 HQ-Edit 基準中的應用場景,我們希望用任意指令修改 T2I 生成的圖像。

  一個句子中就能出現三個同樣的主語,讀起來就非常的難受,并且斷句也很奇怪。

  子曰翻譯2.0的表現倒是非常的棒。它的主語濫用較少,避免了一大坨過度重復的代詞。尤其在處理“that”和“where”這類句式時,表現不錯。

  DeepSeek比起子曰翻譯2.0,人話輸出上稍微弱了一點,翻譯腔的機械感重了一點。很明顯的例子就是第一句話,不夠簡潔,主語消失了。

  沒活別硬翻方面,子曰翻譯2.0和DeepSeek都明顯好一點。

  對Out-of-Domain (OOD) test的處理上,只有Qwen翻譯成了跨領域測試。智譜GLM和Qwen對real in-the-wild image inputs的翻譯都有點難頂。。。其實,直接翻成真實場景的圖像輸入就行。

  

  國外組這邊,在英譯中的表現上都要比國內組的要稍微差點,那英式中文的感覺實在揮之不去,讀起來非常的不流暢。

  這里面表現最好的就是ChatGPT-4o。它的翻譯整體上是清晰且準確的,算是比較好地展現了原文的技術內容和學術語氣。

  Gemini和Claude基本屬于一個級別的,人話輸出差點兒意思。

  Grok 3的表現也還行,但還是那個老毛病:主語瘋狂堆疊。

  

  這第一道題還只是學術論文中,比較“正常”的一段,理解語義的難度不算太高。

  但是當你看硬核技術論文的時候,我不知道你們有沒有跟我一樣的感覺:AI面對正文中的內容時,表現可能還好。但當對象變為圖注內容時,很大概率開始抽風。

  因為SeedEdit這篇論文里,圖注部分沒有什么復雜的段落,我就從經典神文《Attention is all you need》里摘出來了一段,作為第二道大題

  

  這回,就能很明顯地感受到各個AI大模型在面對這種隱性語境限制的情況下,翻譯英文的能力了。

  開頭的第一個長難句,其實就是對圖片的一個總結,怎么簡潔怎么來。

  

  智譜GLM對圖注語境下的長難句的理解有點不到位。

  DeepSeek、Qwen則選擇在中間進行斷句,無功無過。但是在結尾處,這兩位都選擇“建議以彩色查看”,在學術語境中語氣稍顯隨意了些。但也沒大問題。

  子曰翻譯2.0在一句話的表現非常簡潔,很符合一個正常學術圖注的規范。但是,也出現了個小問題。因為heads這個單詞在前一句出現過了,子曰翻譯2.0直接在下一句省略了,給翻譯成了不同顏色代表不同的頭,這其實會帶來一些理解壓力。

  Gemini和GLM一樣的毛病,ChatGPT-4o直接把第一句的following硬翻譯成了追蹤,Pass。

  Claude對第一個句子的翻譯,也是尬的一批,6層xxx的第5層中。沒有人這么說話的。

  除了上面兩道對象是純文本的測試題,日常看論文時,另一個特別讓我看了心情復雜的一點就是,文本中被插入一堆數學符號。翻譯器很容易被搞懵逼。

  所以我也就把這一點作為第三大題,測試下這八個模型是怎么處理這些數字符號的。

  文本還是用的《Attention Is All You Need》里的一段嵌入數學公式的內容。

  

  總體來看,各家AI大模型對于內嵌數學公式的理解,其實都表現的還挺好的。

  盡管 d2 的數學符號格式在排版上,有些模型處理的不夠規整,但邏輯表達并沒有什么混亂。

  DeepSeek和子曰翻譯2.0在處理技術性內容時,能夠兼顧術語的準確性與說人話的表達方式,這一點明顯勝過其他幾個模型。

  我在做這個測試的時候,還發現了一個很明顯的點,就是最后一句話。

  xxx,the approach we take in our model.

  很明顯地,這句話不應該與前一句區分開。

  因為在中文語境中,它實際上是對前述內容的補充說明。但是除了子曰翻譯2.0外的七家大模型,全都給隔離翻譯了。

  一個逗號,給7個大模型都忽悠過去了。。。

  

  一套流程全部測下來,只說中英互譯的話,你會很明顯地感受到在說人話方面,有道這個子曰翻譯2.0,是真的讓我意外的覺的牛逼。

  在沒活別硬翻上,DeepSeek R1、子曰翻譯2.0,ChatGPT-4o基本算是一個梯隊的,專業術語知道保留,不瞎玩。

  至少在我自己的測試中,最讓我意外的一點,還是有道的子曰翻譯2.0是效果最好的,這個點其實蠻讓我意外。

  但是同時也確實驗證了一個“共識”。

  在垂直場景里,這些積累了N多年數據的行業巨頭,手上握著的資源和數據,確實不是一些通用大模型公司能匹敵的。

  在我找出了我覺得目前最好的翻譯大模型,準備就讓它以后來幫我看論文讀技術文章的時候,我發現。。。

  沉浸式翻譯沒給子曰翻譯2.0留API接口,接不進去。。。

  而有道自己的產品雖然做的很不錯,但是對于我這種每天在各種英文網站里來回蹦跶還要刷X和在arXiv上扒拉論文的人來說,體驗路徑確實有一點長。。。

  這一下子給我整不會了。。。

  不過如果是習慣用應用的,或者是手機主力黨,那我還是無腦推薦你去有道他們自己的產品里面用。

  比如他們的有道翻譯和有道詞典。

  

  截圖翻譯、PDF翻譯啥的都全乎,同傳啥的也都有,這個里面的AI翻譯就是子曰翻譯2.0。

  但是最可惜的就是沒有我想要的瀏覽器翻譯插件。

  所以,在我猶豫了1分鐘之后,為了方便,不用來回多開頁面,省下時間安心做科普閱讀。

  我還是做了一個非常傻der的決定。

  自己用AI手搓一個能接子曰翻譯2.0 API的論文專用的翻譯器插件。。。

  

  EMMMMMMM。

  這個插件翻譯效果是這樣子的。

  

  這個翻譯插件的用戶體驗效果肯定沒有那些商用插件好,但是吧,也是一個無奈之舉。翻譯質量,比體驗重要。

  老規矩,這個插件我也放在了公眾號后臺里,大家隨意取用,直接公眾號后臺私信我"fy"系統就會自動發送你文件了。

  插件的安裝和API的接入,其實都特別簡單。

  先說API怎么獲取。

  直接進下面有道的AI開放平臺申請API:

  https://ai.youdao.com/modelTranslation.s

  在最上面的導航欄里,選擇產品服務,里面有個大模型翻譯,點擊即可。

  

  選擇立即使用

  

  在左側導航欄里選擇自然語言翻譯服務里的大模型翻譯,點擊創建應用

  

  應用名稱可以隨便寫,我寫的是:PDF翻譯,選擇服務欄里要選:大模型翻譯,接入方式選:API,應用類別直接選:實用工具

  選完這四項,直接點確認就行。

  

  下面這倆其實就是你的應用ID和秘鑰了。

  

  在有道API平臺,一實名注冊就會送50塊錢的體驗金。。。

  基本夠用一陣子了,大概能高質量地處理個三五千頁PDF。

  至于我手搓的論文翻譯插件的安裝也很簡單。

  按下面的指導圖,一步一步來就行。

  第一步就是解壓縮我給你的翻譯插件.zip。

  

  然后打開谷歌瀏覽器,點右上方三個點按鈕,進入管理擴展程序。

  

  一鍵把文件拖進來,就能自動安裝。

  

  打開擴展程序按鍵,把【卡茲克論文譯霸】置頂。

  

  

  輸入你在有道API云平臺,注冊得到的API key和API Secret,點保存設置就能用了。

  

  安裝好插件,你刷新一下arXiv,你就會發現右邊就有個【在線查看中文翻譯版】的按鈕。

  

  點進去后,即可開始純享版論文翻譯。你可以點擊隱藏原文,直接就是個子曰翻譯出來的中文版。也可以,一鍵改變布局,原文譯文排版,就像下面這樣。

  

  也支持,圖文混排。

  一些網頁也行。

  

  整個流程,真的幾分鐘就能搞定。

  接下來就能在中英互譯的論文世界里遨游了。

  說實話,我這個手搓的小插件,很蹩腳,如果有道或者沉浸式翻譯能看到我這篇文章,我希望:

  要么有道出個插件,要么沉浸式翻譯支持一下有道的API吧。。。

  真的,我覺得瀏覽器翻譯這個場景,還是蠻剛需的。

  當然,如果你覺得這個插件太矬了(確實也挺挫),那也可以把PDF下載下來,扔到有道翻譯里面直接翻譯。

  或者直接用他們的截圖翻譯吧。

  不過,如果你跟現在的我一樣,就喜歡瀏覽器上苦讀英文文獻,也追求翻譯質量,那我覺得,真的可以考慮湊合用一下我這個小破插件。

  祝我們都能在AI和翻譯的世界里越走越遠,再也不用為語言門檻而撓頭懊惱。

  愿你我的AI路上,都能走的更遠。

  共勉。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
馬克斯:裸簽2-3個頂薪球員的時代已經過去 以后這種操作越來越難

馬克斯:裸簽2-3個頂薪球員的時代已經過去 以后這種操作越來越難

直播吧
2025-04-15 20:24:13
中超第一外援!克雷桑戴帽7輪造9球,泰山200萬歐買下身價已漲5倍

中超第一外援!克雷桑戴帽7輪造9球,泰山200萬歐買下身價已漲5倍

直播吧
2025-04-15 20:45:11
英超總積分超2000有多難?僅4隊做到,槍手上榜,曼聯家底實在厚

英超總積分超2000有多難?僅4隊做到,槍手上榜,曼聯家底實在厚

籃球圈里的那些事
2025-04-15 10:33:08
中企出手接管港口?長和打破沉默,李嘉誠這一次終于硬氣了

中企出手接管港口?長和打破沉默,李嘉誠這一次終于硬氣了

前沿張評
2025-04-15 10:11:00
遼寧9分雙殺新疆!賽后數據一目了然,不是外援,最大功臣是他!

遼寧9分雙殺新疆!賽后數據一目了然,不是外援,最大功臣是他!

侃球熊弟
2025-04-15 21:27:42
《最后生還者2》外媒低分差評:簡直是沒法看的垃圾

《最后生還者2》外媒低分差評:簡直是沒法看的垃圾

游民星空
2025-04-15 13:12:09
網紅李喜梅回應離婚原因,給大雙200萬貨和一輛車,網友提出質疑

網紅李喜梅回應離婚原因,給大雙200萬貨和一輛車,網友提出質疑

古希臘掌管月桂的神
2025-04-15 10:00:14
恭喜,申思正式上任,亮相上海新崗位,多年努力獲最好回報

恭喜,申思正式上任,亮相上海新崗位,多年努力獲最好回報

樂聊球
2025-04-15 12:35:00
中方亮出底牌后,美打破沉默:中方應盡快恢復供應,否則自損聲譽

中方亮出底牌后,美打破沉默:中方應盡快恢復供應,否則自損聲譽

小笛科技
2025-04-15 08:20:09
神仙打架,9部“五一檔”電影定檔搶占市場,誰能拔得頭籌?

神仙打架,9部“五一檔”電影定檔搶占市場,誰能拔得頭籌?

頂流八卦大明星
2025-04-13 13:21:20
毛主席遺體至今仍面色紅潤,但防腐費用每年需上億元,是真是假?

毛主席遺體至今仍面色紅潤,但防腐費用每年需上億元,是真是假?

南書房
2025-04-14 23:40:04
美前財長耶倫:不相信中國會拋售美債,美國完了中國也別想好過

美前財長耶倫:不相信中國會拋售美債,美國完了中國也別想好過

叮當當科技
2025-04-15 17:21:31
60票對25票,美參議院表決出爐,中美若爆發沖突,結局難逃8個字

60票對25票,美參議院表決出爐,中美若爆發沖突,結局難逃8個字

獵火照狼山
2025-04-14 13:45:08
中國下達最后通牒!若美國繼續任意妄為,中方就要動“殺招”了!

中國下達最后通牒!若美國繼續任意妄為,中方就要動“殺招”了!

涵豆說娛
2025-04-15 12:51:37
轟動全國的魯榮漁慘案:33人出海11人返航,活下來的全是殺人兇手

轟動全國的魯榮漁慘案:33人出海11人返航,活下來的全是殺人兇手

貓眼觀史
2025-04-12 22:22:52
拒絕按特朗普政府要求改革,哈佛大學被凍結約23億美元撥款!校長:要求超出聯邦政府權限,不會妥協

拒絕按特朗普政府要求改革,哈佛大學被凍結約23億美元撥款!校長:要求超出聯邦政府權限,不會妥協

每日經濟新聞
2025-04-15 19:01:21
乒乓世界杯女單戰況:王藝迪等七位世界名將提前出局,孫穎莎4分

乒乓世界杯女單戰況:王藝迪等七位世界名將提前出局,孫穎莎4分

冷桂零落
2025-04-16 00:44:18
兩部門:到2027年在難以滿足電網快速調節需求的地區改造和新建一批具有快速變負荷能力的煤電機組

兩部門:到2027年在難以滿足電網快速調節需求的地區改造和新建一批具有快速變負荷能力的煤電機組

財聯社
2025-04-14 19:10:05
首曝|成都國家植物園選址定了!

首曝|成都國家植物園選址定了!

成都向上UP
2025-04-15 14:32:45
戴口罩!北京進入高發期!這些人千萬注意!

戴口罩!北京進入高發期!這些人千萬注意!

美麗大北京
2025-04-15 22:06:32
2025-04-16 01:35:00
數字生命卡茲克 incentive-icons
數字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
283文章數 386關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

旅游
教育
藝術
手機
數碼

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

教育要聞

這道競賽題,很講究數學思維的

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

真我GT7手機三款配色公布,售價不到3000元

數碼要聞

影馳 RTX 5060/Ti 顯卡發布,覆蓋金屬大師、刃、FIRE 三大系列

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 镇康县| 黑水县| 宽城| 汝阳县| 玛曲县| 志丹县| 广州市| 宣恩县| 布拖县| 宽甸| 共和县| 玉屏| 手机| 武川县| 桦南县| 永川市| 泸州市| 营山县| 富顺县| 宁都县| 东阳市| 陇南市| 锦屏县| 武夷山市| 乐平市| 玉田县| 探索| 广宁县| 漳平市| 满洲里市| 东港市| 固安县| 秦安县| 南雄市| 乌什县| 炎陵县| 天镇县| 武冈市| 吉林省| 衡南县| 南木林县|