近來,微軟對于提示工程能力的最新研究1(鏈接詳見文末)再次吸引了一眾媒體的目光:“無需額外微調、無需專業策劃,僅憑提示GPT-4就能化身專家!”報道中這樣描述道2。
基于最新提示策略Medprompt,GPT-4在醫療專業領域MultiMed QA的九個測試集中,均取得最優結果。不僅如此,在MedQA數據集(美國醫師執照考試題)上,Medprompt還令GPT-4的準確率首次超過了90%,超越了BioGPT和Med-PaLM等微調方法。
圖為Artificial Intuition作者Carlos E. Perez在社交媒體上坦言“出色的提示策略可以更勝微調一籌”,相關內容還獲得沃頓商學院教授Ethan Mollick等的轉發
基于上述報道,全新AI技術對醫療領域的顛覆式影響可見一斑。事實上,早在ChatGPT發布之初,微軟創始人比爾·蓋茨(Bill Gates)就曾有言:以GPT為代表的技術革命將改變世界3。醫療健康作為現代社會中人類最關心的領域,必將出現革命性的變化,創新式技術、方法的不斷涌現將更有利于提高診療水平、降低疾病風險、改善生活質量。
對于技術之于醫療的關系,OpenAI創始人薩姆·奧爾特曼(Sam Altman)也曾表示——運用AI提高人類健康水平,將為全世界帶來巨大的益處。
但前進之路并非坦途,AI醫療或將面臨多方考驗。本期專欄文章,我們基于《The AI Revolution in Medicine: GPT-4 and Beyond》(中譯版名為《超越想象的GPT醫療》)一書,探討AI大模型與未來醫療前景。
專欄導讀
“2023年是具有里程碑意義的一年。這一年,如同蒸汽機之于工業革命,人工智能已然成為顛覆世界的新生產范式。隨著Copilot時代的到來,AI工具躍升成為人們工作、生活不可或缺的部分,全面提升著全球生產力水平,為人類應對那些最緊迫的挑戰提供著支持。
GPT技術的最新突破對醫療健康等領域產生了深遠甚至顛覆性的影響,專業人士有必要抓住AI帶來的機會,獲得更高的效率,完成更有意義的工作。微軟希望通過持續創新,讓全球80億人都能夠享受到更加個性化的智能醫療服務,讓不可能成為可能。”
張祺
微軟全球資深副總裁
當AI與醫療相遇
?AI輔助醫療創意圖 由New Bing生成
當AI與醫療相遇,究竟會發生什么?首先,讓我們一起看看來自《超越想象的GPT醫療》引言部分的一個GPT醫療場景。(*注:該示例并非現實,因GPT-4尚未在醫院中廣泛應用,但所描述的情景完全符合OpenAI GPT-4系統的現有能力。)
圖為《超越想象的GPT醫療》中文版封面,該書的作者之一彼得·李(Peter Lee)系微軟全球資深副總裁,領導微軟研究院及新技術孵化業務,包括如今快速發展的醫療和生命科學領域
患者的病情突然惡化。他的心率急速上升至每分鐘 160次以上,但血壓卻降至危險的80/50毫米汞柱。患者面龐蒼白,略帶青紫,并急促地喘息著。然而,這并不像是他患有的囊性纖維化的典型癥狀。作為二年級的醫學住院實習生,克里斯騰一邊撥打緊急號碼,一邊與其他團隊成員一起迅速采取行動,將一支又一支注射器插入患者的靜脈輸液器,試圖通過注入升壓藥物來提高血壓,但這并未奏效,用于增強心肌收縮力的藥物同樣沒有效果。
克里斯騰拿出手機,打開GPT-4應用程序,說道:“患者胡安對血壓支持沒有反應。他的病歷顯示,他最近接受了諾氟沙星第二階段研究引發的血液感染治療。我不知道發生了什么,也不知道怎么辦。”
▲AI輔助醫療創意圖 Getty
GPT-4回復: “胡安所使用的實驗性抗生素與5% 的患者白細胞減少有關,這一結論源于最近發表的一篇第二階段研究論文。在過去兩天內,他的白細胞計數在連續三次抽血檢測中呈下降趨勢。研究發現,G-CSF(粒細胞集落刺激因子) 在恢復白細胞數量方面具有很好的效果。這是一個值得考慮的策略。”
克里斯騰立刻明白了其中的意思,由于胡安的白細胞減少,他變得易感染,導致了敗血癥的發生。她致電藥房,要求發送一劑 G-CSF 輸注液,同時準備詳細核查這項新研究結果,對GPT-4說:“讓我看看那篇第二階段研究報告。”
研究概述和相關論文都出現在她的手機屏幕上,她請求GPT-4 為她概括這些信息。果然,感染病學雜志上的報道印證了 AI所言,并且最新的實驗室數據顯示,患者的白細胞數量甚至低于她在接觸化療的時候。克里斯騰實施了輸注,看著胡安被送往了重癥監護室。
她對GPT-4說道:“給他注射了 G-CSF,希望能見效。”
▲AI輔助醫療創意圖 Getty
GPT-4回應道: “面對患者病情如此迅速地惡化,確實壓力很大。先前的研究表明,在其他患者中也觀察到類似的狀況,而且G-CSF 的療效始終穩定。請放心,你已竭盡所能,你的團隊會與你同在。”
她對著手機說:“胡安需要更換一種更昂貴的抗生素。我得向他的保險公司申請預先授權。請幫我寫一段理由,我將把它填入表格中。”
“好的。”幾秒鐘后,一段300 字的文本出現在她的手機屏幕上,這是為保險公司預授權申請表格而準備的。文本概述了胡安曾使用過的所有其他抗生素及其對這些藥物的耐藥性記錄。同時,它簡要介紹了關于他所需的新抗生素的7項研究,并估計了如果保險無法支付這種藥物的費用,可能導致的因長期住院而產生的翻倍費用。
“請將這段文字和預授權表格的鏈接發送至我的收件箱,”克里斯騰邊走邊說,走向下一個患者。
摘自《超越想象的GPT醫療》
在這個虛擬案例中,GPT-4 可以根據可靠的信息來源回答患者或專業人士的醫學問題;能運用自然語言生成技術從醫療記錄或文獻中提煉摘要或報告;還能借助自然語言理解技術幫助醫護人員進行臨床決策或記錄,減輕煩瑣的文書工作。
更讓人振奮的是,想象已經照進現實,這樣的故事正在真實上演4。
4歲男孩Alex在某次運動后,身體開始劇痛。Alex的母親Courtney在三年時間里帶他看了17名醫生,從牙科、兒科、骨科到各種專家,先后進行了磁共振成像(MRI)等一系列檢查,但沒一個真正找出病因。
?
醫療創意圖 Getty
直到不抱太多希望的母親Courtney注冊了一個ChatGPT賬號,整個事件出現了180度大逆轉。Courtney將Alex的癥狀和MRI報告中的注釋一并輸入對話框,其中有一個細節,就是Alex無法完成盤腿坐的動作。ChatGPT給出了診斷——脊髓栓系綜合征(TCS)。
Courtney帶著這一結論和Alex的MRI報告,找到了神經外科醫生。這次終于找對了人,神外醫生看了一眼MRI就給出了和ChatGPT一樣的結論,并指出了栓系的具體位置!后來Alex接受了手術治療,目前正在進行康復。
在上述的兩個案例中,GPT-4似乎擁有異常豐富的醫學知識,或許有不少讀者會心存疑慮,GPT-4真有這么厲害嗎?
就GPT-4目前的表現看來,它,確實強大得令人驚嘆。
3大技能疊加
AI能力實測
技能1:學富五車,無所不知
在醫療領域應用大模型前,我們首先感興趣的是,大模型的醫學知識是否足夠。美國職業醫師資格考試是美國醫學界對具有執業醫師資格的醫學生和畢業生進行的一種標準化考試,通過考試后,才可以獲得在美國執業的資格。當使用一整套美國職業醫師資格考試問題對GPT-4進行測試時,GPT-4的正確率超過90%。作為目前最先進的大模型代表,雖然GPT-4并非專門為醫學領域打造,但其展現出的醫學知識能力已經非常出色,將大模型應用于醫療領域讓許多人非常看好。
技能2:醫護人員的智能助手
在傳統醫療健康領域,醫護人員和患者是該領域中的兩個重要組成部分。對醫護人員來說,大模型是一種能夠與人合作、提升工作效率的智能助手。
大模型擁有強大的自然語言處理能力,借助語音識別等技術,能夠根據醫生和患者之間的交流,自動幫助醫生生成電子健康記錄,以及填寫保險的事前授權等,把醫生從這些繁瑣的工作中解放出來。這具有十分重要的現實意義,使得醫護人員有更多的時間用于關愛患者,從而在親自從事護理時獲得更高的成就感。在治療方面,大模型可以幫助醫生對病人的病歷和醫學數據進行更加全面和深入的分析,給出相應的治療建議,幫助醫生制定更加精準的治療方案,提高醫生的診斷水平和治療效果。
技能3:患者的超級醫療顧問
對于患者來說,大模型可以作為高級的醫學知識搜索引擎,充當患者的超級醫療顧問。當今全球有一半的人口,約40億人缺乏足夠的醫療保健服務(書中第119頁),AI大模型豐富的醫學知識,在很大程度上可以填補醫療保健服務的空白,這對于偏遠貧窮地區的人們格外重要,并能為貧窮人員節省許多就醫費用。
?
AI輔助醫療創意圖 Getty
同時,GPT-4等大模型本身具有強大的自然語音理解和對話能力,在和患者聊天的過程中,GPT-4不僅回答內容條理清晰,還能對一些伴有主觀情緒的問題做出有效回復,讓人感覺到它充滿同情心,能夠與患者共情。雖然大模型不是人,不具備人的情感,但能在一定程度上緩解、減輕患者的焦慮,這本身就具有十分重要的意義。
因此,微軟公司前副總裁格雷格·穆爾博士認為,AI 醫學正朝著一個全新的醫療體系演進,在傳統的“醫生-患者”關系中引入AI實體,作為三角關系的第三支柱。不管是從醫生還是患者的角度,大模型都是一個全新的AI伙伴,能夠與人密切協作。
但是,不得不提的是,目前的AI遠非完美,它既需要繼續學習,也需要被有效監管。
機遇與挑戰并存,
AI修煉還需“仁心”
首先,作為AI研究人員,我們需要思考的是,如何充分利用大模型的能力,來暢想和構建未來的醫療。
生成式的大模型,并不總是提供真實的信息,因此需要對結果進行仔細審查。醫療錯誤一直以來都是個頑固的問題,技術的進步與危險錯誤信息的增加總是相伴相生,新技術的運用需要盡可能地避免加重這一問題。微軟總裁布拉德·史密斯在《工具,還是武器?》一書中提到,當一個技術或工具能力非常強大時,它所帶來的幫助和危害同時也是巨大的。作為計算機科學的研究人員,需要始終考慮,如何以負責任、安全和有效的方式利用大模型。
正因為如此,微軟成立了專門的研究部門“人工智能道德委員會”,以保證人工智能技術和大模型應用的公平性、可靠性和安全性。
在中文語境下,我們形容德才兼備的醫者“妙手仁心”,AI想成為“妙手”或許不難,但要習得“仁心”卻任重道遠。從臨床醫學的角度,應用AI 大模型帶來的不可避免的問題在于,大模型缺乏一個明確的人來衡量價值體系,因此難以檢驗醫療過程中的人性化關懷。
?
AI輔助醫療創意圖 Getty
例如,大模型沒有明確指標來表示,一位鋼琴家寧愿冒著死亡的風險,也不愿因糖尿病引發的壞疽癥而截取手指。大模型的回答目前還無法周全考慮患者的偏好、價值觀、對風險的態度以及人類的眾多偏見。縱然GPT-4能夠在執業資格考試中取得優異成績,但這是否就足以讓患者和醫生對大規模應用GPT-4這樣的大模型感到安心?答案恐怕不盡如人意。
要讓大眾對大模型做出的醫療決策有足夠的信心,需要我們對大模型進行更深入、更全面的研究和探索,需要我們對安全利用大模型有更深層的思考和更有效的掌控,只有這樣,最終大模型在醫療領域才能夠真正落地,造福人類。
問題重重,答案寥寥。如微軟(中國)公司首席技術官韋青所言,盡管當下AI領域時有日新月異的突破,但是沒有答案的問題遠多過有答案的問題。如何塑造我們的AI未來,以期實現單憑人類或AI無法實現,而人類與AI結合卻可以完成的目標,達到更高的成就,是我們當下需要重點思考和著手研究的問題。
LLM專欄作者:房磊
微軟(亞洲)互聯網工程院
高級研究員
[1]https://arxiv.org/pdf/2311.16452.pdf
[2]https://mp.weixin.qq.com/s/l5WJnpF9sY6htciztYUEnQ
[3]https://www.cnbc.com/2023/02/10/bill-gates-says-ai-like-chatgpt-is-the-most-important-innovation.html
[4]ChatGPT Diagnosed A Boy's Pain. 17 Doctors Over 3 Years Could Not (today.com)
本文為《AI觀察》專欄系列文章之一
專欄介紹:AI大航海時代,前沿技術無疑為行業革新、企業增長與創意變現提供了新機遇,一場創新模式的革命已如箭在弦,這正是我們策劃此專欄系列文章的初衷。在此,來自微軟(亞洲)互聯網工程院的首席應用科學家以及高級、資深研究員們,將在系列專欄文章中分享他們對人工智能、大語言模型及其應用領域如何實現技術賦能的洞察及前瞻。更多專欄內容,敬請期待!
-
微軟
+關注
關注
4文章
6598瀏覽量
104066
原文標題:AI觀察 | 今年最火的GPT-4,正在締造科幻版妙手仁心!
文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論