十八禁视频网站在线观看,亚洲五月综合缴情在线,欧美国产日韩a在线视频,男人女人做爽爽18禁网站,免费无码av片在线观看网址 ,欧美巨大黑人极品精男,久久亚洲国产成人影院,久99久热只有精品国产15

清華校友立功!谷歌發(fā)布首個(gè)全科醫(yī)療大模型,14項(xiàng)任務(wù)SOTA

來(lái)源: 量子位2023-08-04 00:49:41
  

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

全球首個(gè)全科醫(yī)療大模型正式發(fā)布:

由谷歌Research和DeepMind共同打造的多模態(tài)生成模型Med-PaLM M,懂臨床語(yǔ)言、懂影像,也懂基因組學(xué)。


(資料圖片)

在14項(xiàng)測(cè)試任務(wù)中,Med-PaLM M均接近或超過現(xiàn)有SOTA,前提是所有任務(wù)都使用一組相同的模型權(quán)重

而在246份真實(shí)胸部X光片中,臨床醫(yī)生表示,在高達(dá)40.50%的病例中,Med-PaLM M生成的報(bào)告都要比專業(yè)放射科醫(yī)生的更受采納,這表明Med-PaLM M并非“紙上談兵”,用于臨床指日可待。

對(duì)此,谷歌也自己給出了評(píng)價(jià):

這是通用醫(yī)學(xué)人工智能史上的一個(gè)里程碑。

所以,Med-PaLM M具體什么來(lái)頭?

全球首個(gè)全科醫(yī)療大模型來(lái)了

在正式了解Med-PaLM M之前,我們先簡(jiǎn)單介紹谷歌自建的多模態(tài)醫(yī)學(xué)測(cè)試基準(zhǔn)MultiMedBench

谷歌表示,在MultiMedBench之前,市面上缺乏這樣一個(gè)全面的多模態(tài)醫(yī)學(xué)基準(zhǔn)。

該基準(zhǔn)由12個(gè)開源數(shù)據(jù)集和14個(gè)單獨(dú)的任務(wù)組成,用于測(cè)量通用生物醫(yī)學(xué)AI執(zhí)行各種臨床任務(wù)的能力。

其中12個(gè)數(shù)據(jù)集共包含了六種生物醫(yī)學(xué)數(shù)據(jù)模式(文本、放射學(xué)(CT、MRI和X光)、病理學(xué)、皮膚病學(xué)、乳房X光檢查和基因組學(xué)),14個(gè)任務(wù)則涵蓋五種類型(問題回答、報(bào)告生成和摘要、視覺問題回答、醫(yī)學(xué)圖像分類和基因組變體調(diào)用)。

Med-PaLM M就在上面進(jìn)行了微調(diào)。

正如其名“M”代表多模態(tài),Med-PaLM M相比之前谷歌發(fā)布的Med-PaLM、Med-PaLM-2等醫(yī)療大模型,是一個(gè)主打全科、通才的醫(yī)療AI,不僅能回答各種醫(yī)學(xué)問題,還能直接看片、懂基因組學(xué)。

它的基本架構(gòu)是PaLM-E(多模態(tài)語(yǔ)言模型),并采用ViT預(yù)訓(xùn)練模型作為視覺編碼器,具體實(shí)現(xiàn)了三種組合:

-PaLM 8B+ViT 4B(PaLM-E 12B)-PaLM 62B+ViT 22B (PaLM-E 84B)-PaLM 540B+ViT 22B (PaLM-E 562B)

通過MultiMedBench對(duì)PaLM-E模型進(jìn)行微調(diào),并將其與生物醫(yī)學(xué)領(lǐng)域?qū)R,Med-PaLM M得以誕生。以下是一些實(shí)現(xiàn)細(xì)節(jié):

(1)數(shù)據(jù)集和預(yù)處理方面,將MultiMedBench中所有圖像大小調(diào)整為224×224×3,同時(shí)按需使用填充來(lái)保留原始縱橫比。

(2)由于谷歌的目標(biāo)是訓(xùn)練一個(gè)通用的生物醫(yī)學(xué)AI模型,使用統(tǒng)一的模型架構(gòu)和模型參數(shù),用多模式輸入執(zhí)行多個(gè)任務(wù)。為此,他們?yōu)镸ed-PaLM M提供了特定于各種任務(wù)的指令以及一個(gè)純文本的“一次性示例”。

如下圖所示的胸部x光解讀和皮膚病變分類任務(wù)所示,這些指令有一種寫提示語(yǔ)的味道,以“你是一個(gè)很給力的放射科助理”開頭。

(3)訓(xùn)練過程中,作者對(duì)PaLM-E進(jìn)行了端到端的微調(diào)。在多模態(tài)任務(wù)中,圖像標(biāo)記與文本標(biāo)記交錯(cuò),以形成對(duì)PALM-E模型的多模式上下文輸入。對(duì)于所有微調(diào)任務(wù),多模式上下文輸入最多包含1個(gè)圖像,然而Med-PaLM M能夠在推理過程中處理具有多個(gè)圖像的輸入。

14項(xiàng)任務(wù)接近or超SOTA,臨床戰(zhàn)勝40%放射科醫(yī)生

性能評(píng)估階段,作者主要測(cè)試Med-PaLM M的“多面手”(即全科)能力、突發(fā)涌現(xiàn)能力以及放射學(xué)報(bào)告生成質(zhì)量(與真實(shí)放射科醫(yī)生進(jìn)行對(duì)比)。

結(jié)果顯示:

(1)與專業(yè)SOTA模型和無(wú)生物醫(yī)學(xué)領(lǐng)域微調(diào)的廣義模型(PaLM-E 84B)相比,Med-PaLM M在MultiMedBench上的所有任務(wù)、數(shù)據(jù)集和指標(biāo)組合(共計(jì)14項(xiàng))中,性能均基本接近SOTA或超過SOTA。

需要注意的是,該結(jié)果是在沒有任何特定任務(wù)定制的情況下使用相同的模型權(quán)重集實(shí)現(xiàn)的。

(2)在scale實(shí)驗(yàn)中,三個(gè)不同規(guī)模的Med-PaLM M對(duì)各類任務(wù)的影響各不相同:粗略來(lái)看,對(duì)于純語(yǔ)言任務(wù)和需要調(diào)整的多模式任務(wù)來(lái)說(shuō),模型越大越好;但對(duì)圖像分類和胸部X光報(bào)告生成任務(wù)來(lái)說(shuō),84B的效果比562B表現(xiàn)反而更好一些。

(3)零樣本思維鏈推理能力涌現(xiàn)。Med-PaLM M可以通過胸部X射線圖像檢測(cè)沒有訓(xùn)練過的結(jié)核病,與針對(duì)該類數(shù)據(jù)集進(jìn)行專門優(yōu)化過的SOTA結(jié)果相比,它的準(zhǔn)確率已相差不大。

不過,它給出的具體報(bào)告還是存在具體錯(cuò)誤,說(shuō)明還有不足。

(4)放射性報(bào)告生成測(cè)試中,80B參數(shù)的Med-PaLM M平均有40.50%的報(bào)告比放射科醫(yī)生做的更好(被臨床醫(yī)生采納),而12B和562B,分別為34.05%和32.00%。

另外,遺漏和錯(cuò)誤率測(cè)試顯示,Med-PaLM M 12B和84B模型平均每份報(bào)告的遺漏率最低,為0.12,其次是562B模型為0.13。這一結(jié)果與MIMIC-CXR上人類放射科醫(yī)生基線報(bào)告的相當(dāng)。

多久能實(shí)用?

作為人類首個(gè)全科醫(yī)學(xué)大模型,Med-PaLM M多久能投入實(shí)用,想必也是大家關(guān)心的問題。

雖然它被“自詡”為里程碑(主要是因?yàn)榭恳唤M模型權(quán)重在各種生物醫(yī)學(xué)任務(wù)上接近或超過SOTA),但谷歌也指出目前還有不少局限性待解決。

比如缺乏高質(zhì)量的測(cè)試基準(zhǔn)。谷歌表示,這是迄今為止通用生物醫(yī)學(xué)人工智能發(fā)展的關(guān)鍵瓶頸,因?yàn)橹挥懈哔|(zhì)量的基準(zhǔn)才能在很大程度上促進(jìn)相關(guān)領(lǐng)域的發(fā)展。

而目前的MultiMedBench還存在單個(gè)數(shù)據(jù)集大小有限以及模式和任務(wù)多樣性有限(比如缺乏轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué))等問題。

再比如,擴(kuò)展(scale)多模態(tài)AI模型也具有挑戰(zhàn)性。

在語(yǔ)言領(lǐng)域,這一操作可以顯著提高性能和應(yīng)急能力。然而,谷歌在Med-PaLM M上的初步實(shí)驗(yàn)表明,由于醫(yī)學(xué)數(shù)據(jù)的稀缺性,這對(duì)于生物醫(yī)學(xué)任務(wù)領(lǐng)域的多模態(tài)廣義模型來(lái)說(shuō)并沒有這么簡(jiǎn)單。

作者介紹

目前,谷歌僅發(fā)布了Med-PaLM M的論文。

它一共有兩位共同一作,其中一位叫Tao Tu。

他本科畢業(yè)于北理工(2010年),碩士畢業(yè)于清華大學(xué),博士為美國(guó)哥倫比亞大學(xué),專業(yè)都是醫(yī)學(xué)工程。目前已在谷歌擔(dān)任軟件工程師快兩年。

論文地址:https://arxiv.org/abs/2307.14334

關(guān)鍵詞:

責(zé)任編輯:sdnew003

相關(guān)新聞

版權(quán)與免責(zé)聲明:

1 本網(wǎng)注明“來(lái)源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。

2 在本網(wǎng)的新聞頁(yè)面或BBS上進(jìn)行跟帖或發(fā)表言論者,文責(zé)自負(fù)。

3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實(shí),不對(duì)您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

4 如涉及作品內(nèi)容、版權(quán)等其它問題,請(qǐng)?jiān)?0日內(nèi)同本網(wǎng)聯(lián)系。

主站蜘蛛池模板: 久久精品成人无码观看不卡| 亚洲一区无码精品色| 欧美午夜成人片在线观看| 久久超碰极品视觉盛宴| 亚洲国产成人久久精品99| 在线看午夜福利片国产| 婷婷五月六月综合缴情| 成人免费视频无码专区| 麻豆av无码蜜臀av| 亚洲欧洲自拍拍偷精品 美利坚| 国产熟妇按摩3p高潮大叫| 无码人妻少妇精品无码专区漫画| 无码av中文出轨人妻| 天天av天天爽无码中文| 国产亚洲精品品视频在线| 色又黄又爽18禁免费网站现观看| 无码福利一区二区三区| 曰韩精品无码一区二区视频| 国产精品青青在线观看爽香蕉| 国产女高清在线看免费观看| 久久久久久久曰本精品免费看| 国产公妇仑乱在线观看| 国产高清无套内谢| 国产亚洲精品久久综合阿香| 东京热加勒比视频一区| 国产精品久久亚洲不卡| 无码专区一ⅴa亚洲v专区在线| 天天看片天天av免费观看| 色综合天天综合网国产| 免费看男女做好爽好硬视频| 国产成人一卡2卡3卡4卡| 亚洲美女高清aⅴ视频免费| 玩成熟老熟女视频| 亚洲一区二区三区av天堂| 亚洲国产av天码精品果冻传媒| av无码精品一区二区三区三级| 国产精品亚洲专区无码唯爱网| 欧美人与禽zozo性伦交视频 | 亚洲а∨天堂男人色无码| 99久久精品无码专区| 无码ol丝袜高跟秘书在线观看|