作者丨劉楊楠
編輯丨巴里
圖源丨文心一言
無論是早些年的信息化,還是今天的大模型,技術改變世界的宏大敘事里,醫療或許都是最難啃的“硬骨頭”。
數據壁壘高筑、場景復雜多變、容錯率趨近于零......但因其內含的巨大商業價值和社會價值,多年來都吸引著無數創業者奔赴其中。
2016年創辦左醫科技的張超,便是其中之一。張超畢業于電子科技大學,曾經擔任百度NLP知識挖掘方向的負責人、知識圖譜專家,也曾任新國大的研究助理。
左醫科技是一家知識圖譜和醫療大模型協同驅動的醫療科技公司,其客戶已經覆蓋全國200多家三甲醫院,其中40%是top100的醫院,包括北京協和醫院、武漢同濟醫院、中國醫大一院、四川省人民醫院、重慶醫科大學附屬兒童醫院等。
創業十年,張超從未離開技術一線,他幾乎能敏銳捕捉到每一次技術轉折的信號,卻也無法跳出醫療科技變現難的普遍困境。
踩了無數坑之后,張超深知:“一件事能不能做成,時機很重要。”
在“AI醫生”這個最火熱的新趨勢里,他延續著一名技術創業者對技術路徑的敏銳嗅覺,押注“端到端+場景”深度結合的技術路線。同時,他也用更多精力鉆研商業模式,試圖在傳統的醫療服務模式之外,給公司探索更多商業想象。
一、押寶“端到端”
2020年,左醫科技第一次嘗試把Transformer用在醫患對話上,開發了一款智能問診程序,內部稱之為“AI Doctor(AI醫生)”。
張超自己也眼前一亮:“親身體驗后會發現,在Transformer出現之前,所有的人機交互都很‘傻’。”
后來,張超帶團隊嘗試在GPT-2上做微調,發現效果不錯,但成本太高,加之GPT-2參數規模較小,微調很難突破性能天花板。團隊又在國內的一系列模型上嘗試微調,發現效果都不理想。“當時就有些懷疑這條路線了,但現在看來是那時候國內的模型能力確實不行。”張超坦言。
時間到了2022年,在ChatGPT發布前,OpenAI發布instructGPT時,左醫的技術團隊已經注意到其性能有很大躍升。“但我們第一反應是不信,因為谷歌之前發了很多酷炫的demo,都沒有真正落地。”張超表示,直到自己真正體驗了ChatGPT,才確信AI能力真的迎來了歷史性轉折。
起初,左醫科技曾嘗試自己訓練模型,但很快發現,公司很難長期支撐規模如此之大的數據和算力投入。
于是,左醫科技及時停止訓練,轉而在開源模型的基礎上訓練醫療領域的垂類模型。經過一系列測評后,左醫在眾多開源模型中選擇了通義千問。
2023年5月,左醫科技發布了醫療垂類大模型,并應用落地于四川省人民醫院、北京天壇醫院等百強醫院。
DeepSeek出圈后,左醫科技也曾嘗試在DeepSeek上繼續訓練,但團隊權衡之后,還是選擇繼續基于通義千問做訓練。
由于LLaMA、通義千問等稠密模型引領的開源浪潮已經形成了成熟的開源生態,而DeepSeek系列為MoE架構,屬于稀疏模型,其開源生態相對不成熟,原本走稠密模型路線的團隊若想轉換路線,就要面臨更大的工程難題。另外,從實際的場景需求考慮,張超認為,對醫療場景而言,參數規模可能不需要太大。
但隨著通用模型不斷提升,關于“垂直模型是否會被替代”的討論也開始沸沸揚揚。
退一步看,垂直模型之所以會引領一波小高潮,本質是因為通用模型在獲取專有數據方面存在障礙,只要這個問題不解決,垂直模型就會有其特定的價值。“比如DeepSeek在醫療方面幻覺很重,表現比OpenAI o1差很多,是因為OpenAI有專門的醫療團隊。”張超說。
不過,張超坦言,隨著通用模型不斷迭代,未來留給垂直模型的生存空間確實會越來越小,但這并不意味著要直接放棄垂類模型。“飛機比火車跑得快,但火車總能去到一些飛機去不了的地方。未來做垂類模型的人要想一想,哪些事情是通用模型做不到的。”
2024年12月23日,張超在朋友圈發布了一個左醫GPT-o1版的內測視頻,其醫療診斷效果相比指令模型提升15%以上。但DeepSeek-R1發布后,左醫就放棄就發布該推理模型。
張超認為,參考Deep Research圍繞核心場景打造端到端的應用會是未來重要的方向。
目前,AI在醫療領域的落地有三種進階形態:提示詞、工作流和端到端。
市面上很多產品都通過“提示詞”或“工作流(Workflow)”來實現健康咨詢的AI產品,但這類解決方案容易在多步驟流程中累積錯誤,降低整體準確率,也很難滿足越來越復雜多樣的醫學場景。
張超表示:“這兩條路線都需要人類參與設計,人的能力會限制智能應用的能力。而端到端推理能夠讓模型超越人的能力的限制。”
2024年12月,左醫科技開始探索端到端訓練的AI Agent,通過深度強化學習整合CoT(Chain of Thought推理)、智能交互、工具調用和知識檢索等流程,讓AI醫生在面對真實就醫場景時,能自發“想辦法”查找信息和綜合分析,從而做出更符合臨床邏輯的判斷。
“端到端推理和場景深度結合本質不是在做模型,而是把模型能力和場景數據融在一起,最終以Agent的形態呈現。”張超表示。
圖片來源:左醫科技
而端到端的壁壘,很大一部分在于構建數據集的能力。張超坦言:“數據清洗的過程就像‘和面一樣’,水多了加面,面多了加水,本質上是一個要求熟練度的工種。”
換言之,數據清洗真正的Know-how在于,無數次實操過程中積累的“錯題集”。張超舉了一個形象的例子,病歷是很多模型訓練主要的數據來源,但真實的病歷有時會寫明病理,這就會給模型“漏題”,因此要把病歷中解釋病理的部分刪去,再喂給模型。
近期,左醫科技通過端到端構建的Agent已經在重慶醫科大學附屬兒童醫院落地,雙方推出了“重兒·小乙AI家庭醫生”。同時,左醫科技還推出了兒科循證知識庫,基于國內外兒科指南、專家共識、教科書等高質量專業數據源構建,并由專業團隊核驗,保留清晰可追溯的引用來源;能夠讀懂文字、識別檢查報告,并根據需要自動推薦患教視頻、提供預約掛號等服務。
張超表示,知識的來源和組織形式,同樣會影響RAG降低幻覺的效果。“構建高質量的RAG肯定不能簡單把互聯網數據堆進去。即使是學術論文,也并非全篇都有引用價值。”張超表示。
多年來,左醫科技積累了多種數據來源,包括互聯網數據,聽譯機器人采集的真實的醫患交流數據,以及模型在輔助診斷過程中生成的數據。同時,左醫科技會借助多年來積累的專家資源,在海量原始數據中提取最有價值的信息,一篇論文中可能只提取10條真正有價值的數據納入RAG,以此來最大程度提升模型對知識的應用。
二、B端保利潤,C端求增長
毋庸置疑,“AI醫生”是大模型賦予整個醫療行業的新故事,創業邦在此前的文章中曾梳理了AI醫生的市場現狀,可謂是“八仙過海,各顯神通”。
在張超看來,AI醫生在醫院的落地順序應是:全科-專科-專科專家。
從行業發展歷程來看,醫療信息化的過程也是從全科逐漸向專科滲透的。但張超并未給這個結論附加太多合理性。他坦言:“一個人做什么事,很大程度上取決于他手里的資源。我們積累了大量全科數據,從全科切入是水到渠成的結果。”
目前,左醫科技正在探索AI醫生在專科的落地,并率先在兒科達成合作。張超透露,某種程度上,這也是一個無心插柳的結果。“重慶醫科大學附屬兒童醫院領導非常認可這個方向,目標一致,更好執行。”張超表示。
他進一步表示,在醫學界,兒科是一個很好的研究領域,因為很多罕見疾病都在兒科發現,兒童在很多疾病上癥狀也不夠典型。但正因為它很難,所以在商業化過程中要更慎重,例如很多藥都不能給兒童用。從這一點上說,兒科并非一個很好的商業化場景。
在兒科之外,左醫科技還同步嘗試了心理以及內分泌、婦科、呼吸科、神經內科等大內科,未來也會逐步推進AI醫生在各科室的落地。
但張超透露,公司接下來會逐漸調整商業化重心。
目前,左醫科技已經能夠給醫院提供覆蓋“診前、診中、診后”的全流程服務,覆蓋全國200多家三甲醫院,其中top100的醫院達40%。但張超感受到,當前的醫療信息化市場正越來越“卷”。
“醫院臨床要求太高了,很多信息化技術做不到。另外,醫院的用戶流量在下降,醫改政策變化間接導致醫院收入降低,他們投入到信息化轉型的每一分錢都會更謹慎,加上三甲醫院等優質醫療資源本就稀缺,醫院和某家合作后,其他家廠商很難再進來。”
這種情況下,部分廠商會選擇“破釜沉舟”,直接給醫院免費送軟件,送服務。“但這樣終究不是長久之計,”張超說,“甚至現在一些醫院部署DeepSeek一體機都是在浪費錢,本質依然是一個很重商務的模式。軟件項目必須要做到90%以上的毛利,否則一定是虧的。”
在此背景下,左醫科技未來會在B端會爭取更多利潤,保留預問診、分導診、語音轉寫病歷等標準化程度高,且客戶反響好的項目,把項目“做少、做深、做精”。“你不用去追逐馬,當你有一片草原,馬自然會來找你。”
接下來,左醫科技會重點在C端找新的增長曲線。
從2023年開始,左醫就嘗試以B端帶動C端,基于端到端技術打造的AI醫生,與寧夏中衛市、銀川市、北京西城區衛健委簽約,將“AI醫生”升級為“AI家醫”,以此逐漸積累流量和數據。
圖片來源:左醫科技
張超透露,現階段,左醫科技的C端產品采用會員訂閱收費的模式。未來流量足夠大之后,還可以探索更多商業模式,比如AI醫生根據和用戶的交互數據為用戶推薦個性化的健康類產品。
具體到醫療流程上,張超坦言,未來會將重點放在“診前”和“診中”。
他進一步解釋道,從用戶習慣來看,診后的主要場景是慢病管理,但除了腫瘤等疾病外,慢病大多是生活習慣導致的,簡單的人機交互很難真正改變什么;從商業模式來看,慢病管理最終的受益方是政府醫保基金,而醫保基金分配是一件很嚴肅的事情。
不過,就短期來看,獲取流量仍是左醫科技探索C端落地的關鍵關卡。而如何打通C端應用的商業閉環,也是當下最困擾張超的問題。
三、一位技術創業者的自白
十年前,張超還在百度自然語言處理(下文簡稱“NLP”)部門擔任資深研發工程師、文本知識挖掘方向技術負責人以及知識圖譜實體建模專家。
但張超不滿足于大廠相對安穩的生活,隱隱生出創業的沖動。在公司內部一次IBM科學家的分享會上,張超偶然發現,國外有團隊正在探索用NLP技術輔助醫療診斷的應用。
于是,張超產生了一個今天看來“不切實際”的想法:醫療是一個知識驅動的領域,而自己又擅長知識圖譜技術,只要有足夠的醫療數據,構建一個能做各種推理的概率模型,或許就能達到輔助診斷的目標。
“本質上還是覺得,手里有一把錘子,而醫療這個釘子還不錯。”張超說,“畢竟連馬云當時都在說,‘下一個能超越我的人,一定出現在醫療健康行業’。”
但真正啟動創業后,張超發現,自己想得太簡單了。當時的張超,幾乎對醫療一無所知。醫療數據怎么獲取,病歷怎么看,診斷怎么做,甚至到了醫院該找誰談合作都一頭霧水。
無奈之下, 張超從自己最熟悉的技術切入,沒數據就從公開渠道爬數據。但很快,團隊發現公開數據效果太差,只能硬著頭皮想辦法找醫院要數據。
彼時正處國內醫療信息化的熱潮,涌現了很多第三方醫療信息化廠商。
當時,一家腫瘤大數據平臺率先向張超遞出橄欖枝:“你們能不能做一個病歷結構化的系統?”這是張超接到的第一個客戶需求,但他發現,自己完全看不懂病歷。“說白了有點一頭扎猛了,我們只掌握了一些技術,但在醫療領域的認知幾乎空白。”
后來,在投資人的引薦下,一位醫療銷售人員加入左醫。2017年,左醫漸漸開始和第三方醫療信息化廠商合作,左醫提供技術,信息化廠商和醫院溝通提供數據。張超及團隊人員也在項目磨合中逐漸積累醫療認知。
今天回看,左醫做了很多超前的技術,包括目前火熱的CDSS(臨床輔助診斷系統)、預問診系統、聽譯機器人等,但由于技術和商業環境不成熟,最終都沒有引起足夠的市場反響。
客觀來看,醫療信息服務本質上要面臨所有軟件廠商都會面臨的商業窘境——重商務、強定制化的項目制交付,左醫一度也陷入“做得越多,虧得越多”的困境。”張超自己復盤發現,創業早期確實花了很多錢,做一些不該做的項目,找了一些本不需要的人。
“技術創業者太想用技術解決所有事情了,并且會對技術的短期進步更樂觀。之前我們一直想憋個大招,總想做新的東西,覺得有了更牛的技術是不是就能改變公司的境況。”張超說。
但事實證明,至少在醫療行業,醫院不只需要性能拉爆的“滿血”技術,更需要保證錯誤率最低,且能夠長期穩定供應的廠商。直到現在,左醫科技賣得最好的產品仍是五六年前開發的。
而未來,更多故事會發生在C端。對于整個醫療服務行業來說,C端或許都是一個全新的世界:如何獲取流量,如何維持用戶粘性,如何找到合理的收費模式?一切都尚待摸索。
“對于我來說,創業沒有回頭路。”張超說,“一件事能不能做成,時機很重要。我們之前對時機把握得不夠好,但現在我們踩了足夠多的坑,市場需求也很旺盛,我相信我們接下來的路會走得更穩。”
本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯系editor@cyzone.cn。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.