99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

智譜大模型算法崗面經!

0
分享至

來源:AIGC小白入門記

最近參加了智譜大模型算法崗位的面試,收獲頗豐,特地來分享一下這次的面試經歷,希望能給正在求職的小伙伴們提供一些參考。

一、面試流程

面試整體分為三個部分:手撕代碼、項目介紹以及專業知識問答(八股)。

(一)手撕代碼

面試官首先讓我手撕一個 tokenizer,tokenizer 是自然語言處理中用于將文本拆分成一個個標記(token)的工具。我從最簡單的字符級別 tokenizer 開始講起,然后逐步擴展到基于詞典的分詞方法,最后還提到了一些基于深度學習的預訓練分詞模型,如 BERT 的 WordPiece 算法。面試官對細節把握得很嚴,讓我詳細解釋了如何處理一些特殊字符、未知詞匯等問題;

還讓我用偽代碼簡單描述了 RAG(Retrieval-Augmented Generation)模型的基本流程。RAG 是一種結合了檢索和生成的模型,先從一個大規模的文檔集合中檢索出與輸入文本相關的文檔片段,然后再基于這些片段生成目標文本。我用偽代碼展示了檢索部分和生成部分的交互過程,面試官對這個部分的邏輯和實現細節很感興趣,問了我一些優化思路。

(二)項目介紹

項目介紹部分是面試的重點之一,面試官讓我詳細講解我之前參與的一個項目。

  1. 項目具體解決問題:我介紹的項目是一個智能問答系統,主要解決的是用戶在海量數據中快速獲取準確信息的問題。例如,用戶可以通過自然語言提問,系統能夠理解問題并從數據庫中檢索出相關的答案。

  2. 每個模塊如何實現:這個項目分為多個模塊,包括自然語言理解(NLU)、知識庫管理、問答匹配和答案生成等模塊。在 NLU 模塊,我詳細講解了如何使用深度學習模型(如 LSTM)來提取問題的語義特征;在知識庫管理模塊,我介紹了如何構建和維護一個結構化的知識庫,以支持高效的檢索;在問答匹配模塊,我講述了如何通過計算問題和知識庫中條目的相似度來找到最相關的答案;在答案生成模塊,我提到了使用模板生成和基于生成模型(如 GPT)生成兩種策略。

  3. NL2SQL 在處理多表查詢的時候采取啥策略:這個項目中用到了 NL2SQL(自然語言到結構化查詢語言)技術,用于將用戶的自然語言問題轉換為 SQL 查詢語句。在處理多表查詢時,我采用了基于語義解析的方法,首先解析出問題中涉及的實體、關系和屬性,然后根據這些信息構建出多表連接的 SQL 查詢。例如,對于一個涉及兩個表(如“學生表”和“課程表”)的查詢問題,我會先解析出學生和課程之間的關系(如“選課”關系),然后生成相應的 JOIN 語句來連接這兩個表。

  4. k8s 和 docker 在項目中的作用:在項目的部署階段,我們使用了 Docker 來容器化每個模塊,這樣可以保證每個模塊的運行環境一致,避免了“在我的機器上可以運行”的問題。而 Kubernetes(k8s)則用于管理這些容器,實現自動擴縮容、負載均衡等功能。例如,當問答系統的訪問量突然增加時,k8s 可以自動啟動更多的容器實例來應對高流量,保證系統的穩定運行。

(三)專業知識問答(八股)

這部分主要考察我對一些常見算法、模型和框架的理解。

  1. 對 PPO、DPO、GRPO 計算邏輯的理解:PPO(Proximal Policy Optimization)是一種強化學習算法,通過截斷概率比來限制策略更新的幅度,從而保證更新的穩定性。DPO(Deep Policy Optimization)是 PPO 的一種改進版本,引入了深度學習的思想,可以更好地處理復雜的策略函數。GRPO(Generalized Reinforcement Policy Optimization)則是一種更通用的框架,可以涵蓋多種強化學習算法。我詳細解釋了它們的計算邏輯,包括如何計算目標函數、如何更新策略等。

  2. 對 KL 散度的三種估計的理解:KL 散度(Kullback–Leibler Divergence)是衡量兩個概率分布差異的指標。常見的估計方法有直接計算法、蒙特卡洛估計法和變分估計法。直接計算法需要知道兩個分布的解析形式,蒙特卡洛估計法通過采樣來近似計算 KL 散度,而變分估計法則通過引入一個變分分布來降低計算復雜度。我對比了這三種方法的優缺點,例如直接計算法精度高但適用范圍有限,蒙特卡洛估計法簡單但可能需要大量樣本,變分估計法可以用于復雜的分布但可能存在偏差。

  3. LORA 和 p-tuning v2 的區別,怎么初始化:LORA(Low-Rank Adaptation)是一種參數高效的微調方法,通過在預訓練模型的每一層插入低秩矩陣來實現微調。p-tuning v2 是一種基于提示的學習方法,通過在輸入中添加提示來引導模型生成期望的輸出。它們的主要區別在于 LORA 是直接修改模型的參數,而 p-tuning v2 是通過改變輸入的形式來影響模型的輸出。在初始化方面,LORA 的低秩矩陣通常初始化為小的隨機值,而 p-tuning v2 的提示可以通過一些啟發式方法來設計,例如根據任務的語義來選擇合適的提示詞。

  4. DeepSeek R1 訓練全流程,MLA 具體怎么做的:DeepSeek R1 是一個大規模的預訓練模型,其訓練全流程包括數據預處理、模型初始化、訓練迭代和模型評估等步驟。在數據預處理階段,需要對海量的文本數據進行清洗、分詞和編碼等操作;模型初始化時,會隨機初始化模型的參數;在訓練迭代過程中,使用大規模的計算資源進行分布式訓練,通過反向傳播更新模型參數;最后通過一些指標(如困惑度、準確率等)來評估模型的性能。MLA(Multi-Label Attention)是 DeepSeek R1 中用于處理多標簽分類任務的一種機制,它通過引入多個注意力頭來分別關注不同的標簽信息,從而提高多標簽分類的性能。

  5. 梯度爆炸和消失怎么處理的:梯度爆炸和消失是深度學習訓練過程中常見的問題。對于梯度爆炸,可以采用梯度裁剪的方法,將梯度限制在一個合理的范圍內;對于梯度消失,可以通過使用合適的激活函數(如 ReLU 及其變體)、初始化方法(如 Xavier 初始化)和網絡結構(如殘差網絡)來緩解。我詳細解釋了這些方法的原理和應用場景。

  6. torch 中 register parameter 和 buffer 的區別:在 PyTorch 中,register_parameter用于注冊模型的參數,這些參數會被自動加入到模型的參數列表中,會在訓練過程中被優化器更新。而register_buffer用于注冊一些不需要更新的張量,例如模型的輸入數據、中間變量等,這些張量不會被優化器更新,但會在模型的前向傳播過程中被使用。我通過一個簡單的例子來說明它們的區別。

  7. torch 如何實現不記錄梯度:在 PyTorch 中,可以通過設置torch.no_grad()上下文管理器來實現不記錄梯度。在torch.no_grad()的作用范圍內,所有的操作都不會記錄梯度,這在推理階段或者一些不需要計算梯度的場景中非常有用。例如,在使用預訓練模型進行推理時,可以使用torch.no_grad()來提高計算效率。

  8. torch squeeze 和 unsqueeze 干嘛的torch.squeezetorch.unsqueeze是 PyTorch 中用于操作張量維度的函數。torch.squeeze用于去除張量中大小為 1 的維度,例如將一個形狀為[1, 3, 1, 4]的張量壓縮為[3, 4];而torch.unsqueeze則用于在張量的指定位置插入一個大小為 1 的維度,例如將一個形狀為[3, 4]的張量擴展為[1, 3, 4]。這兩個函數在處理張量的維度時非常方便,尤其是在進行張量拼接、廣播等操作時。

  9. python 設計刪除流程的時候,若涉及可變和不可變對象該如何 debug:在 Python 中,可變對象(如列表、字典等)和不可變對象(如整數、字符串等)在刪除操作時的行為有所不同。對于可變對象,直接修改對象的內容會影響所有引用該對象的變量;而對于不可變對象,刪除操作只是讓變量不再指向該對象,不會影響其他變量。在設計刪除流程時,需要注意這些區別,避免出現意外的錯誤。調試時可以通過打印變量的引用地址(使用id()函數)來檢查變量是否指向同一個對象,從而確定刪除操作是否按預期執行。

  10. 多機多卡和單機多卡的實現上有什么不同:多機多卡和單機多卡都是用于加速深度學習模型訓練的分布式計算方式。單機多卡主要通過

春天的美妙時光

LEARN FROM LEI FENG


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
堅決不和美國續約!中國這次鐵了心,特朗普對華火速變臉

堅決不和美國續約!中國這次鐵了心,特朗普對華火速變臉

搜國天下
2025-04-25 14:44:31
北京朝陽大媽闖大禍!7天偷100多個快遞,是為了解悶,結局舒適。

北京朝陽大媽闖大禍!7天偷100多個快遞,是為了解悶,結局舒適。

楊哥歷史
2025-04-26 10:14:40
“一絲不掛”新舞蹈?惹爭議,被摸下體更不害臊,金星質疑是對的

“一絲不掛”新舞蹈?惹爭議,被摸下體更不害臊,金星質疑是對的

吃魚思故淵
2024-05-16 21:48:21
4月26日中央5套CCTV5、CCTV5+直播節目預告 附國乒WTT常挑賽賽程

4月26日中央5套CCTV5、CCTV5+直播節目預告 附國乒WTT常挑賽賽程

金風說
2025-04-26 13:38:39
烏克蘭,活下去

烏克蘭,活下去

關爾東
2025-03-06 18:25:25
俄軍奪回庫爾斯克99.5%烏控區,攻入別爾哥羅德的烏軍被打退

俄軍奪回庫爾斯克99.5%烏控區,攻入別爾哥羅德的烏軍被打退

科軍論評
2025-04-24 14:32:14
于正回應多名藝人退圈:優勝劣汰,這是一個好事情

于正回應多名藝人退圈:優勝劣汰,這是一個好事情

魯中晨報
2025-04-25 17:04:08
新《奔跑吧》最無聊的3位嘉賓,無趣、無梗、惹人厭,不要再來了

新《奔跑吧》最無聊的3位嘉賓,無趣、無梗、惹人厭,不要再來了

八卦南風
2025-04-26 10:44:53
53歲藤原紀香:曾跟郭富城熱戀,身姿豐滿,成熟富有魅力

53歲藤原紀香:曾跟郭富城熱戀,身姿豐滿,成熟富有魅力

紅大娘娛樂
2025-04-24 12:42:29
佟大為回本溪老家參加婚禮,這畫風反差絕了

佟大為回本溪老家參加婚禮,這畫風反差絕了

鄉野小珥
2025-04-26 14:30:46
24歲女子因胸太大去縮胸,網友吐槽她浪費好身材:身在福中不知福

24歲女子因胸太大去縮胸,網友吐槽她浪費好身材:身在福中不知福

唐小糖說情感
2025-03-26 10:16:34
我國采購越南900萬噸大米,卻用霉大米以次充好,我國:一粒米都不要

我國采購越南900萬噸大米,卻用霉大米以次充好,我國:一粒米都不要

睡前講故事
2025-04-22 11:23:11
新華社發文!高校大門要向公眾打開,讓老百姓都有機會自由出入。

新華社發文!高校大門要向公眾打開,讓老百姓都有機會自由出入。

楊哥歷史
2025-04-23 11:38:57
奧運冠軍家蓋房記:5個孩子等8間房 施工隊連夜推平地基

奧運冠軍家蓋房記:5個孩子等8間房 施工隊連夜推平地基

小呆魚
2025-04-26 07:15:03
DeepSeek評出國內最值得去的十大景點,九寨溝第3,三峽無緣上榜

DeepSeek評出國內最值得去的十大景點,九寨溝第3,三峽無緣上榜

古今小史
2025-04-08 09:34:12
來了來了!巴特勒最新傷情報告!當事人首次正面回應……

來了來了!巴特勒最新傷情報告!當事人首次正面回應……

籃球實戰寶典
2025-04-25 20:46:41
民眾黨5位民代今上凱道“戰獨裁”,陳佩琪也現身力挺,黃珊珊缺席

民眾黨5位民代今上凱道“戰獨裁”,陳佩琪也現身力挺,黃珊珊缺席

海峽導報社
2025-04-26 08:07:03
“你以為我們怕美國嗎?”美媒記者探訪義烏工廠得到這樣的回應

“你以為我們怕美國嗎?”美媒記者探訪義烏工廠得到這樣的回應

環球網資訊
2025-04-26 14:38:32
美艦再次闖臺海,豪賭中國會忍讓?解放軍14機迫近臺島,敢于亮劍

美艦再次闖臺海,豪賭中國會忍讓?解放軍14機迫近臺島,敢于亮劍

博覽歷史
2025-04-25 13:24:08
特朗普體面服軟,90國想不到,中方第1個獲降稅待遇,美安排特殊

特朗普體面服軟,90國想不到,中方第1個獲降稅待遇,美安排特殊

吳欣純Deborah
2025-04-25 16:31:07
2025-04-26 15:47:00
人工智能研究 incentive-icons
人工智能研究
分享深度學習、CV、NLP
258文章數 125關注度
往期回顧 全部

頭條要聞

男子炒股11年賺6000萬:初始本金150萬 曾1天虧1100萬

頭條要聞

男子炒股11年賺6000萬:初始本金150萬 曾1天虧1100萬

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

藝術
親子
旅游
手機
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

尼泊爾年輕媽媽帶孩子吃飯,從小培養孩子獨自吃飯

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

手機要聞

CounterPoint 報告 2024 全球手機攝像頭出貨量:索尼領銜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 库尔勒市| 浙江省| 保德县| 会宁县| 洛隆县| 克什克腾旗| 财经| 沾化县| 库车县| 苏尼特左旗| 新兴县| 吴忠市| 江华| 垣曲县| 吉安市| 江津市| 白朗县| 嘉祥县| 和静县| 洞口县| 滁州市| 潞城市| 岳普湖县| 香港 | 义马市| 花垣县| 龙泉市| 怀柔区| 台北县| 巴中市| 垦利县| 明星| 綦江县| 通辽市| 工布江达县| 雅安市| 无锡市| 清涧县| 利辛县| 沙雅县| 准格尔旗|