近日,由極客邦旗下 InfoQ 中國傾力打造的 AICon 全球人工智能開發與應用大會在北京舉辦。此次大會以“智能未來,探索 AI 無限可能”為主題,匯聚 60 位行業頭部企業嘉賓,帶來精彩紛呈的見解與分享。
作為大會核心論壇之一,“大模型 + 行業創新應用”專題論壇于5月18日如期舉行,聚焦金融、法律、醫療、教育等不同領域,探討分享大模型技術在各自領域內的應用經驗和深刻洞見,推動大模型技術的有效落地和行業創新。云知聲 AI Labs 研發副總裁劉升平應邀出席論壇并發表《山海醫療大模型的構建及其應用實踐》主題演講。
深耕人工智能產業多年,云知聲一直密切關注AI前沿技術在醫療領域的創新應用。入局智慧醫療賽道以來,云知聲針對醫療行業各場景痛點,陸續研發推出了語音電子病歷、智能病歷質控、單病種質控、智能醫保審核等多款智慧醫療產品,覆蓋醫政醫管、臨床診療、醫保管理、患者服務等多個醫療業務環節。山海大模型發布后,云知聲更是基于山海醫療行業版大模型,全面升級了醫療業務線各產品智能化水平,發布門診病歷生成系統、手術記錄撰寫助手、商保智能理賠系統等醫療產品應用,實現從助手到專家的躍遷。
現場,劉升平深入剖析醫療大模型應用價值,并基于山海醫療大模型的構建與實際落地探索,分享了大模型在特定行業中的定制化優化策略。
醫療大模型:技術突破與行業應用實踐
在深入探討醫療大模型之前,我們首先需要了解在擁有通用大模型的基礎上,為什么還需要行業特定的大模型。
劉升平指出,通用大模型雖然能力強大,但它們缺乏針對特定行業的深入理解和優化,而行業大模型正是為了彌補這一空缺而誕生的,它們基于行業知識和任務進行深度學習和優化,從而在各自領域內成為專家級的解決方案。
當前市場上的醫療大模型主要分為四大類別:通用模型、醫學文本模型、臨床多模態模型以及生物醫藥模型。作為通用大模型的代表,山海醫療大模型以其卓越的性能和專業能力脫穎而出。在CCKS 2023 PromptCBLUE醫療大模型評測中,山海模型榮獲通用賽道一等獎,證明了其在多任務學習和應用上的廣泛適用性。此外,在MedBench評測中,山海模型以54.7的高分榮獲榜首,這一成績充分展示了其在醫療領域深度理解和精準應用的專業實力。
依據大模型的核心能力,云知聲將醫療大模型的應用場景細致劃分為四大類別:生成類、理解類、知識類和決策類,以實現對醫療領域不同需求的精準覆蓋。
現場,劉升平分享了山海醫療大模型在具體場景的落地應用,引起與會者的廣泛關注與思考。
針對門診場景中的病歷撰寫需求,云知聲門診病歷生成系統以山海醫療大模型為依托,應用前端聲音信號處理、智能語音識別等技術,結合龐大的醫療知識圖譜,實現了診室復雜環境下的降噪、醫患角色區分、信息摘要及病歷自動生成等功能,有效提升病歷書寫效率,切實為醫務人員減負。
針對醫療質量管理中的病歷審核需求,云知聲依托山海醫療大模型,結合詳盡的醫療規范和標準數據庫,打造智能病歷質控系統,該系統可準確理解病歷內涵并進行缺陷篩查,重塑業務流程,大幅提高病歷質控工作效率,以及質控的深度和廣度。
針對商業保險理賠中的醫療費用審核需求,云知聲以山海醫療大模型和醫療知識圖譜為底層技術支撐,結合醫療文書OCR,構建商保智能監管與審核系統,通過智能錄入、規則配置、智能AI審核、審核報告生成四步走,打造具有醫學知識和保險理賠經驗的虛擬審核員。
云知聲面向應用的行業大模型定制優化策略:
6種武器+1種秘方
論壇現場,劉升平結合云知聲自身實踐經驗,分享了面向應用的行業大模型定制優化的6種武器和1種秘方,這些策略共同構成了一套全面的方法論,確保了山海醫療大模型能夠在實際應用中達到最佳效果。
6種武器
提示工程:通過創造性地設計“咒語”,即輸入提示,引導大模型沿著清晰的思維鏈進行邏輯推理,使其更準確地理解任務需求并生成合適的響應。結合ICL(In-Context Learning),提示工程不僅關注于單個任務的執行,還強調了上下文信息的重要性,使模型能夠在特定情境中學習,利用上下文信息來提高生成回答的相關性和準確性,有助于減少模型在生成回答時可能出現的幻覺,即模型生成與現實不符的輸出。
檢索增強:通過整合外部知識庫,讓模型能夠檢索并利用相關信息,從而提供更準確和全面的答案。其核心在于允許模型在生成回答時,動態地檢索并利用最新的外部信息,通過減少模型依賴于內部知識的限制,有效降低了生成錯誤信息的風險,使得模型在處理需要廣泛背景知識或實時數據的任務時,表現得更為出色。
指令微調:通過針對性的訓練數據,優化模型對特定指令的響應能力,提升模型執行特定任務的效率。通過數據構造、數據合成、指令數據優選與配比等關鍵步驟,不僅提高了模型對特定指令的響應速度和準確性,還增強了模型在特定任務上的執行效率。
對齊(反饋學習):對齊是確保模型輸出與用戶需求保持一致性的過程,它通過整合用戶的反饋來引導模型的持續學習和自我優化。在這個過程中,模型不僅學習用戶的直接反饋,還從用戶的行為中提取隱式的反饋信號。利用這些反饋,模型能夠自動識別和糾正生成內容中的錯誤,實現自我糾錯。
增量預訓練:增量預訓練是一種持續提升模型性能的策略,它允許模型通過定期引入新的數據進行學習,以適應不斷變化的知識環境。這個過程不僅涉及到數據的更新,還需要強大的算力和精細的數據工程支持。
解碼策略:根據不同的應用場景,大模型推理可設置不同的解碼策略。針對創意內容生成或行程安排等場景,可采取Sample Search、Top-P、Top-K Sample等基于采樣概率的解碼策略,增加輸出的創造性和選擇性;針對選擇、推理等答案相對確定的場景,可采取Greedy Search、Beam Search等基于最大概率的解碼策略。此外,還可以采取引入輔助模型實現的對比策略和猜測策略,借鑒AlphaGo實現的樹搜索解碼策略等。
1種秘方
數據的生產、選擇與配比,是確保模型性能最大化的關鍵步驟。在這一過程中,數據的質量和多樣性直接影響到模型的學習和泛化能力。
數據生產涉及到收集、生成和整理用于訓練和微調模型的數據。這不僅包括公開可用的數據集,也包括特定于行業的專有數據。
數據選擇是指從大量可用數據中挑選出對模型訓練最有價值的部分。這一步驟要求我們理解模型的需求和任務的特性,以便選擇能夠最大化模型性能的數據。
數據配比涉及到不同類型和來源數據的混合和權重分配。正確的配比策略可以強化模型對關鍵特征的學習,同時減少對噪聲和不相關信息的敏感性。
綜合來看,大模型的定制優化可采取多層次策略,以適應不同算力條件并提升模型效果——在算力有限的情況下,通過調用大模型API并運用提示工程、檢索增強結合知識增強等技術來解決實際問題;當算力適中,擁有1至20臺服務器時,可通過指令微調、解碼策略優化以及對齊優化(反饋學習)來進一步優化任務性能;對于算力充足的情況,既可以在開源底座模型上進行增量預訓練,還可以從零開始預訓練自己的底座模型,以實現模型性能的根本性提升。
審核編輯:劉清
-
云知聲
+關注
關注
0文章
188瀏覽量
8396 -
人工智能技術
+關注
關注
2文章
216瀏覽量
10563 -
大模型
+關注
關注
2文章
2476瀏覽量
2812
原文標題:云知聲出席AICon全球人工智能技術大會并作主題分享
文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論