大模型若要成為可信的研發工具,還要實現科學的ranking技術、可解釋性提升等問題。
DeepSeek等大語言模型(LLMs)在很多行業已經引領了智能化的變革,它們在新藥研發行業是否已接近技術的拐點?人工智能正以多大程度推動藥物研發的進步?
IPO早知道對話了科輝智藥創始人、董事長朱振東博士,他分享了AI運用于制藥行業中的成功經驗與未來方向。
科輝智藥專注于AI驅動的藥物研發,公司搭建了先進的AIDD+CADD藥物研發平臺,專注于神經退行性疾病、自身免疫性疾病和腫瘤的藥物開發,為病人提供最佳藥物治療方案,兼顧First-in-class和Best-in-class管線。科輝創始團隊擁有20年的計算機化學研發領域經驗及20年的藥物研發經驗,曾領導多個項目研發進入臨床階段。公司曾獲得冪方健康基金、弘暉基金、健壹資本等知名機構的投資。
2024年10月,科輝智藥的核心管線項目1類小分子新藥ARD-885,用于治療類風濕關節炎(RA)的IND申請先后順利獲得了國家藥監局(NMPA)和美國FDA的臨床試驗許可,這也意味著科輝成為一家臨床階段的生物醫藥公司。此外,科輝目前管線中已有5款靶向創新藥物進入臨床前階段。
朱振東表示,藥物研發是多個參數同步優化的過程,例如優化小分子時會考慮活性、選擇性、毒性、暴露量、PK/PD等不同階段的不同性質的變化。“我們通過將軟件、硬件、數據庫的積累與制藥工業界的經驗相結合,探索AI與CADD如何加速這一系列優化的過程、提高研發的成功率。”
大模型加速分子設計、優化,但可解釋性仍然不夠
科輝AI平臺包含數據分析軟件、分子設計軟件,并且公司于2024年11月上線了內部大語言模型。朱振東表示,大語言模型作為AI工具的一種,在藥物研發的智能化升級、生物醫學文獻與知識管理、基因組學與蛋白質組學的研究解讀和臨床診療與健康管理的革新等領域都帶來了顯著的效率提升。
以藥物研發的關鍵環節為例來看,首先在疾病機制與靶點發現方面,大語言模型可通過分析海量基因組、轉錄組、蛋白質組、文獻、專利和數據庫,挖掘疾病相關基因的調控網絡和信號通路,快速識別潛在藥物靶點(如蛋白質、基因),并預測其與疾病的關聯性。
第二,使用分子生成、優化、合成方面的數據對大語言模型進行微調,可以使大語言模型用于設計具有特定活性的化合物結構,加速分子設計與優化。
第三,在分子虛擬篩選階段,大語言模型可整合化合物物化性質與臨床數據,預測藥物的吸收、分布、代謝、排泄和毒性(ADMET),或整合蛋白信息預測分子與靶蛋白的結合強度。
此外,在臨床試驗方面,大語言模型可用于分析非結構化電子病歷,自動匹配患者與臨床試驗入組標準,提升招募效率。同時,模型通過歷史數據模擬試驗結果,可優化劑量分組和終點指標。
當然,大語言模型在藥物研發的很多環節還并不能成為可靠的工具。朱振東表示,模型的“黑箱”即運作機理和決策過程的不可見性仍是一種主要的困擾;但大語言模型的推理能力未來一定會為生物醫藥研發能力帶來提升,前提是能清楚各種預測模型能被用于哪種場景。
“例如,研發過程中需要用好Ranking技術,在生物醫藥場景中提供客觀的框架,幫助研發人員、開發者了解不同模型的長處和短處,從而選擇最適合特定任務的模型,而這些還處于探索階段。”
數據、算法推動產品能力,優勢與挑戰并行
同樣,朱振東還分析了目前AI應用于制藥行業正在攻克的問題。最重要的是提高數據質量和擴大數據量,以及算法的改進。
他表示:“產品的差異化優勢,包括好的化合物暴露量、生物標志物和毒副作用水平等,對AI新藥研發企業未來商業化能否成功至關重要。因此,對于進入臨床階段的產品,新適應癥的選擇是我們重要的工作,在相關的轉化科學(translational science)研究中,AI已經起到了很大的輔助作用。但相比于化學,整個行業對生物學的理解還很少,這也是受制于數據的不足。”
再例如,我們如何對半結構化數據、非結構化數據處理進行優化,以及如何應對藥物研發很多場景中的正負樣本數量比例失衡導致的模型傾向于預測多數類、降低對少數類的預測性能,而影響模型的準確度等這類問題,都有很大的突破、驗證的空間。
“國外不乏少數公司專注于代謝組學的研究和應用,他們通過分析生物體內的小分子代謝物,研究其與機體生理病理變化的關系,并應用于疾病診斷、藥物開發等。他們可以自己生產數據、模型并預測,這樣有助于掌握數據生成的過程,保障數據質量。但大多數公司很難做到這一點。”
他總結,新藥研發主要由科學驅動而非工程驅動,它的試錯過程不可避免,因此AI還沒進化成一種決策工具。“最典型的場景之一是預測我們所設計出的分子的活性,目前手段仍是通過濕實驗完成驗證,且短期內無法被其他方法取代。”
生物醫藥企業如何用好AI:不止于軟件
生物醫藥及生物科技企業正更深、更廣地在藥物研發工作中部署和利用AI工具。對于未來研發的生態,朱振東認為,中國的IT基礎設施及云服務商最有能力去幫助應用端的生物醫藥企業客戶更好地使用硬件(算力)系統,彌合軟件應用與硬件之間不適配。
“使用AI的藥物研發企業對自己的軟件很了解,但通常沒有能力或資源將自己的應用部署到集群(cluster)上,同時,云服務大廠有豐富的硬件資源,它們如果能像AWS一樣,更多聚焦在中間層(middle-tier)服務,搭建適配不同應用端的“容器”,生物醫藥企業則能更高效、更低成本地使用AI。不過這些云服務廠商還未系統化地去專注完成這種搭建。”
本文為IPO早知道原創
作者|羅賓
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.