AIcon醫療公司、印尼AIcon公司
巨頭們涌入的醫療大模型,何時迎來最好的商業時代?
作者 | 華衛
采訪嘉賓|劉升平,云知聲 AI Labs 研發副總裁
當下極為火爆的大模型,在醫療賽道同樣炙手可熱。谷歌剛剛發布了準確率達 91.1%、性能遠超 GPT-4 系列的多模態醫學大模型 Med-Gemini,國內市場亦很熱鬧。自 2023 年以來,百度、騰訊、京東等諸多大廠都相繼加碼醫療大模型領域,與醫療相關的大模型產品和應用如雨后春筍般正不斷涌現出來,其中更不乏 AI 和醫療企業的手筆。
目前,已有部分醫療大模型產品投入到導診、預問診等醫院場景中。然而,醫療大模型雖有一定潛力,但現階段仍有不少要跨越的落地門檻。
為此,InfoQ 對云知聲 AI Labs 研發副總裁劉升平進行了專訪,聽他聊一聊現階段醫療大模型的商業化能力,以及面向這類應用場景的行業大模型該如何定制優化。在即將召開的AICon 全球人工智能開發與應用大會 暨 大模型應用生態展上,InfoQ 也邀請到了劉升平老師來做演講分享,他將進一步分享醫療大模型的構建方法和應用落地經驗。
以下為訪談實錄,經編輯。
InfoQ:現階段,醫療大模型要規模化落地還面臨哪些現實問題?
劉升平:主要的問題還是有不少,首先是醫生和患者的接受度,特別是有些場景要改變醫生的使用習慣。還有一個問題是大模型的部署成本,如果在院里大規模并發使用醫療大模型,硬件成本會比較高。
InfoQ:“幻覺”的偶發出現是大模型目前公認的一個問題,醫療場景對準確度要求會更高,山海在這方面是怎么做的?
劉升平:“幻覺”的確是核心要解決的問題,我們采用多種手段從多方面降低幻覺,包括保證醫療預訓練語料和微調數據的質量和多樣性、采用能降低知識幻覺的解碼策略、融合醫療知識圖譜的知識增強大模型技術、醫療知識檢索增強、大模型結果后校驗、大模型輸出置信度評估等。
InfoQ:您認為哪一個評價標準最能代表醫療大模型的水平?
劉升平:臨床有效性是最能代表醫療大模型水平的關鍵評價標準,包括模型在實際臨床環境中的診斷準確性、治療建議的合理性以及與專業醫生的決策一致性。此外,模型的魯棒性、泛化能力、可解釋性、用戶友好性、數據隱私保護以及合規性也是重要的評價維度。然而,臨床有效性直接關系到患者的安全和健康,因此如果把醫療大模型應用與臨床實踐中,它可能是最重要的評價標準。
InfoQ:現在行業內有您認為還不錯的其他醫療大模型產品嗎?國內外均可。
劉升平:除了云知聲的山海大模型醫療版,最近看到的是谷歌的多模態醫療大模型 Med-Gemini,在多項臨床任務評測中都表現很好,但還沒有在醫院得到廣泛使用。
InfoQ:在醫療大模型的技術實現、應用效果以及成本部署上,國內與國外有區別嗎?
劉升平:沒有顯著區別。
InfoQ:您認為醫療大模型真正迎來商業化時代還需要多久?
劉升平:預計 2-5 年吧。今年是醫療大模型的應用元年,有部分醫院開始嘗試一些醫療大模型的應用,隨著這些醫院推廣與積累醫療大模型應用經驗,預計醫療大模型會在 2-5 年內進入更廣泛的商業化階段。
InfoQ:社會接受度上,如何讓大眾認可大模型的診斷或治療方案?
劉升平:要讓大眾接受并信任大模型的診斷或治療方案,是一個長期的過程,要考慮很多方面。第一,要提高模型的決策過程透明度,提供可解釋的輸出,讓用戶理解模型是如何得出結論的。這有助于建立用戶信任,尤其是對于醫療決策這樣敏感的問題。第二,要有嚴格的臨床試驗,證明模型的診斷或治療方案與專業醫生的判斷相當或更優,且這些結果應由獨立的第三方機構審核并公開。第三,要讓醫生參與到模型的開發和應用中,他們可以提供專業知識,確保模型的輸出符合醫學實踐,并在實際應用中監督和調整。第四,要開展公眾教育活動,解釋人工智能在醫療領域的潛力和限制,消除誤解,提高公眾的理解和接受度。 通過這些措施,應該可以逐步提高社會對大模型在醫療領域應用的接受度和信任度。
InfoQ:醫療相比其他場景更復雜且嚴謹,難度自然也不小,驅動云知聲選擇在這一領域開發大模型的最重要因素是什么?
劉升平:云知聲選擇在醫療領域開發大模型,主要有兩個關鍵因素。一是應用潛力,而醫療領域是一個富文本、富知識的行業,并且醫療大模型在處理醫療病歷文書、輔助診斷、藥物研發等方面展現出巨大潛力,因為醫療領域是一個很適合大語言模型技術的應用領域。此外,醫療 AI 市場具有巨大的商業價值,隨著技術的成熟和接受度的提高,未來有望形成規模化的商業模式。二是專業積累,云知聲深耕醫療領域多年,對醫療業務場景有深入的理解,在醫療數據和醫療 AI 技術有深厚的積累,也積累了數百家的醫療客戶,這有助于醫療大模型的研發和商業化推廣應用。
InfoQ:大模型訓練過程本身就對數據質量有較高要求,醫療領域的數據則更為特殊,還具有隱私保護、專業知識復雜、經驗化知識難以結構化等難題,山海是如何克服的?
劉升平:山海醫療大模型在訓練過程中面臨數據質量、隱私保護和專業知識復雜性等挑戰,我們采取了兩種策略來克服這些問題。一是數據清洗與預處理,對收集到的醫療數據進行嚴格的清洗,去除噪聲和不一致的信息,確保數據的準確性和一致性;同時使用專業的醫療知識進行預處理,如標準化術語等。二是匿名化與脫敏,在遵守相關法規的前提下,對個人健康信息進行匿名化和脫敏處理,以保護患者隱私。
InfoQ:使用開源數據集可能出現產品同質化現象,山海在數據資源方面是如何使用的?
劉升平:云知聲在開發山海醫療大模型時,采取了多種策略來避免產品同質化,確保模型的競爭力。第一,我們使用了不少專有數據集,即云知聲多年的醫療業務積累的大量內部醫療數據。這些專有數據可以提高大模型在特定場景的應用效果。第二, 我們采用了一些數據增強技術來自動生成訓練數據,例如,通過數據合成、噪聲注入、標簽變換等技術,增加數據的多樣性和復雜性,使模型在不同條件下表現更為全面和魯棒。第三,我們還與醫療專家合作來確保醫療數據的準確性和專業性,同時利用專家的知識來指導數據的預處理和標注。通過這些策略,云知聲的山海醫療大模型能夠與只使用開源數據集訓練的大模型有顯著區別,并且在面向具體的醫療場景應用時有更好的效果。
InfoQ:云知聲的山海醫療大模型主要做了哪些場景?目前哪個場景的應用率最高?哪個場景能算作山海的“殺手锏”?
劉升平:對于云知聲的山海醫療大模型,主要做了以下場景:
- 病歷生成:包括基于醫患對話的門診病歷和出院小結、手術記錄生成等住院病歷的生成,以及放射科報告生成等醫技科報告。
- 病歷質控:對住院病歷(包括病案首頁)做過程和終末質控,支持 1000+形式和內涵質控點,大幅提高病歷的質量。
- 單病種上報:對國家衛健委要求的 57 個病種做自動數據匯集及上報。
- 醫保控費:按照醫保局的規范,監管醫院的臨床診療行為和收費合理性,確保醫療費用的合規。
- 保險理賠的醫療審核:審核在保險理賠中涉及到的醫療費用,剔除不合理費用。
- 專病庫平臺:將病歷等臨床數據自動抽取和導入到專病庫。
- 智能問診:作為 AI 醫生,與患者進行對話,收集癥狀,并提供初步的健康咨詢和建議。
目前,山海應用率最高的場景是病歷生成、病歷質控和保險理賠的醫療審核。結合云知聲在語音技術上強項開發出的門診病歷生成系統,結合云知聲在醫療知識圖譜的積累開發的病歷質控系統和保險理賠醫療審核系統均可以視為“殺手锏”場景。
InfoQ:針對于山海醫療大模型,您更推薦醫療機構采用哪種部署方式落地?具體是如何考慮的?
劉升平:云知聲的山海醫療大模型在醫療機構的部署通常有以下兩種方式:云端部署和私有化部署。至于選擇哪種部署方式,主要考慮幾個因素吧。一是如果醫療機構對數據安全有極高要求,那就傾向于私有化部署。二是考慮成本與資源,云端部署通常成本較低;私有化部署初期投入大,但長期運營成本可能更低。
InfoQ:現在市面上的醫療大模型不少,國內有許多大廠也在做,山海的獨特之處是什么?
劉升平:這和云知聲做醫療大模型的動機是一樣的,山海醫療大模型的獨特之處主要有兩點。 一是在專業領域深度方面,云知聲專注于醫療領域,有深厚的數據、知識、場景和客戶積累,這使得山海醫療大模型在效果上業內領先,目前在醫療大模型綜合評測 PromptCBLUE 和 MedBench 上都是排名第一。二是在技術融合方面,結合云知聲在語音識別和醫療知識圖譜技術的專長,山海醫療大模型在語音交互式醫療應用上具有優勢,且在臨床應用上的醫療知識幻覺也大為減少。
InfoQ:在即將到來的 AI con 上,您準備向聽眾分享哪些方面的內容?
劉升平:主要是分享醫療大模型是怎么用的,是如何做的。我還會以醫療領域為案例,介紹面向應用場景的通用大模型定制優化方法論,相信這對于大模型的行業應用開發有一定的借鑒意義。
嘉賓介紹:
劉升平,云知聲 AI Labs 研發副總裁,北京大學數學學院博士畢業,是前 IBM 中國研究院資深研究員,中文信息學會語言與知識計算專委會委員。曾在語義網,機器學習、信息檢索,醫學信息學,自然語言處理等領域發表過數十篇學術論文和國際國內發明專利。在 IBM 中國研究院信息與知識組工作期間,劉博士主要負責語義技術及其應用的研發,曾多次獲得過 IBM 研究成就獎。 2012 年底,劉博士加入云知聲 AI Labs,領導認知智能團隊,負責大語言模型、知識圖譜和智慧醫療等方面的研發及管理工作。在云知聲期間,主持研發了山海大模型,獲得國內外 AI 評測冠亞軍 13 個,獲得北京市科技進步獎一等獎一項。
原文鏈接:
新產業動態|安全交付!旗下鴻鵠航空科技全面護航溫敏貨物洲際運輸
新產業動態 | 安全交付!旗下鴻鵠航空科技全面護航溫敏貨物洲際運輸###
近日,海爾生物醫療旗下鴻鵠航空科技應客戶需求,順利使用Aicon系列RKN將一批高價值溫敏藥物從法蘭克福運輸至上海,并安全交付。
本次運輸展現了Aicon系列應對長距離運輸挑戰時穩定的溫控性能,也體現了團隊以用戶為中心的快速響應能力以及解決方案的靈活高效性。
↓↓↓
眾所周知,夏季高溫是溫敏貨物運輸的一大挑戰。七月北半球的夏季,環境溫度可以攀升到40℃以上,即便夜間也不會低于26℃。本次發運客戶要求貨物必須穩定處于15~25℃。
為應對此次挑戰,鴻鵠航空科技積極協同各個操作環節,貨物按計劃順利裝入集裝箱,一段全程監控,安全穩定的旅程就此開啟。
在經歷環溫“過山車”后,AiCon系列主動溫控集裝箱箱內溫度始終穩定在19~21℃之間,體現出卓越的溫控性能。
得益于自主研發設計的ACS(Air Circulation System)與ATC(Adaptive Temperature Control)技術,Aicon可實現對箱內溫度實時監控、自動調節和智慧控制,保證箱內精準的溫度均勻性。
經過十多個小時的飛行,AiCon系列主動溫控箱電量僅消耗10%。可靠的續航能力,得到了用戶的認可,團隊圓滿完成了此次貨物運輸的保障工作。
作為海爾生物醫療旗下專注于主動航空溫控運輸場景的子公司,鴻鵠航空科技一直在與眾多合作伙伴緊密接觸,確保溫敏藥品的安全運輸。
近日,鴻鵠航空科技還順利完成了一批抗癌藥物“上海-芝加哥”國際航線的交付,在11300公里的跨國運輸中,主動航空溫控集裝箱穩定控溫,表現出色,同樣受到了用戶的一致好評。
隨著全球生物類似藥、創新藥等生物醫藥市場的蓬勃發展,在國際航空溫控物流環節,具備安全可靠、精準溫控,同時兼具成本和服務優勢的主動航空溫控解決方案,正受到越來越多客戶的青睞。
海爾生物醫療旗下鴻鵠航空科技肩負綠色溫控,守護生命的使命,秉持以用戶為中心的理念,致力于將環保與高效溫控技術融合,為全球溫敏貨物運輸保駕護航。