針對目前基于體液(如尿液、肺泡灌洗液、腦脊液、血液等)的細胞病理癌癥診斷靈敏度較低的臨床問題,復旦大學生物醫學研究院聯合浙大一院報道了一種適用于各種體液的通用細胞病理單細胞深度學習模型框架,其核心是不依賴于細胞病理學醫生的體液脫落腫瘤細胞標注方法。該方法使數據標注可客觀、準確、自動化的完成,為醫學人工智能(AI)模型的發展提供了新的思路。該工作發表于近日出版的Advanced Science。題為:Single-Cell Sequencing-Guided Annotation of Rare Tumor Cells for Deep Learning-Based Cytopathologic Diagnosis of Early Lung Cancer.
隨著深度學習的迅速發展,AI已在醫學影像與組織病理中獲得廣泛應用,但其在體液細胞病理領域尚缺乏準確性高、可解釋性強的模型,主要原因在于缺乏大規模、準確的標注數據。深度學習模型的訓練高度依賴高質量的標注數據集,但這需專家花費大量時間才能實現,還存在不準確標注、不同專家間標注一致性較低等問題。雖然弱監督算法可部分彌補標注上的缺陷,但從實現效果上仍遜于基于大規模、準確標注數據集所訓練的模型。因此,如何不依賴于專家實現大規模數據的準確標注一直是深度學習領域的重要挑戰。
在細胞病理領域,深度學習在基于宮頸細胞學、細針活檢細胞學的癌癥診斷方面的應用有所報道,但在體液癌癥診斷中存在很大困難,其原因在于細胞病理學醫生難以提供大量準確標注的體液脫落腫瘤細胞圖片。體液通常可無創或微創獲取,因此其在癌癥/癌癥轉移/癌癥復發的早期診斷方面具有重要意義。但由于體液樣本中脫落腫瘤細胞數目少,且形態與良性細胞存在較大重疊,使其難以準確鑒定,因此體液脫落細胞學的惡性診斷靈敏度偏低。
施奇惠團隊以單細胞低深度基因組測序為工具,以體液中多個細胞具有一致的拷貝數變異譜為脫落腫瘤細胞鑒定的客觀標準,通過大規模、低成本的單細胞測序對細胞病理巴氏染色片上的大量細胞進行隨機測序,從而無偏倚的鑒定脫落腫瘤細胞以構建脫落腫瘤細胞數據集。這一包含不同形態脫落腫瘤細胞的數據集不依賴于細胞病理醫生標注,是一種通用、客觀的細胞標注方法,使用自動化的細胞與液體操縱設備可實現整個單細胞提取、測序與標注過程自動化。
本研究以肺泡灌洗液為代表性體液樣本進行深度學習模型的建立。肺癌是我國癌癥發病率、死亡率第一的惡性腫瘤,且大部分肺癌被診斷時已是中晚期。相對于有創的活檢與氣管鏡刷檢,肺泡灌洗是一種微創的醫學手段,所獲得的肺泡灌洗液中可包含從腫瘤組織脫落的腫瘤細胞。團隊從24名肺癌患者的肺泡灌洗液巴氏染色片中隨機測序了3000多個細胞,其中580個被確認為腫瘤細胞,并連同1106個良性細胞構成了深度學習模型訓練的數據集。團隊開發了名為LESSEL的端到端深度學習模型用于單細胞識別與分割、圖片預處理,以及單細胞良惡性分類,其中良惡性二分類模型的曲線下面積大于0.95。基于LESSEL的肺泡灌洗液診斷模型在兩個獨立的中心隊列中進行了驗證,其中中心一(n=158)靈敏度47.6%,特異性97.7%,中心二(n=141)靈敏度60.0%,特異性92.5%,其靈敏度均較細胞病理學有較大提升,為肺癌的早期診斷提供了新的工具。
該論文的第一作者為復旦大學生物醫學研究院研究生趙鐿淳、邱若然及青年副研究員王卓博士,通訊作者為復旦大學生物醫學研究院施奇惠研究員、浙大一院病理科尤啟漢教授和復旦大學基礎醫學院陳自強博士。
原文鏈接:https://doi.org/10.1002/advs.202416921
制版人:十一
BioArt
Med
Plants
人才招聘
會議資訊
學術合作組織
(*排名不分先后)
戰略合作伙伴
(*排名不分先后)
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.