国产欧美日韩三区_偷窥自拍亚洲色图精选_久久大片网站_成人在线黄色_成人亚洲免费视频_99久久久精品_国产美女自拍_韩国19禁主播vip福利视频_色综合视频一区二区三区日韩_日本在线观看一区二区

當前位置:首頁 > 科技  > 資訊

探索醫療科技的未來:達摩院在多模態大模型領域的創新嘗試

來源: 責編: 時間:2025-06-25 09:38:13 107觀看
導讀 在人工智能飛速發展的今天,多模態大語言模型(MLLMs)已在通用視覺理解領域展現出驚人潛力。然而。當AI走進醫院、面對復雜的醫學影像和專業任務時,真正的挑戰才剛剛開始。1.知識

在人工智能飛速發展的今天,多模態大語言模型(MLLMs)已在通用視覺理解領域展現出驚人潛力。然而。當AI走進醫院、面對復雜的醫學影像和專業任務時,真正的挑戰才剛剛開始。Vjf28資訊網——每日最新資訊28at.com

1.知識局限:醫學知識覆蓋不全,僅靠影像遠遠不夠;Vjf28資訊網——每日最新資訊28at.com

2.幻覺頻現:回答看似有理,實則漏洞百出,容易“一本正經地胡說八道”;Vjf28資訊網——每日最新資訊28at.com

3.推理匱乏:面對復雜病情,AI常常缺乏像醫生那樣的推理能力。Vjf28資訊網——每日最新資訊28at.com

為了解決這些難題,阿里巴巴達摩院團隊在醫療領域進行初步嘗試,打造了醫療領域的多模態大模型!Vjf28資訊網——每日最新資訊28at.com

數據底子扎實,懂醫學也懂“常識”:該模型背后是一套覆蓋廣泛的高質量數據處理和合成流程,吸收了海量醫學文本和通用知識內容,通過自動合成技術,構建了高質量的圖文描述、醫學問答和推理樣本。Vjf28資訊網——每日最新資訊28at.com

像醫生一樣進階式學習:模型采用“多階段訓練”策略,從基礎醫學認知,到復雜病例分析,逐步注入專業知識與臨床經驗,模型能力層層躍升。經過訓練,我們希望其更具備基礎的醫學邏輯與推理能力,初步展現出處理真實世界醫療任務的潛力。Vjf28資訊網——每日最新資訊28at.com

考試標準嚴苛,評估體系權威:為確保模型不是“閉門造車”,團隊特別開發了MedEvalKit評估體系,涵蓋多模態問答、文本問答和醫學報告生成等關鍵任務,對接真實醫療場景,全面衡量模型能力與安全性。Vjf28資訊網——每日最新資訊28at.com

成績領先,全面超越主流大模型:在多個權威多模態醫療測試中,32B模型以平均高出第二名7.2個百分點的成績刷新記錄,超越GPT-4.1與Claude Sonnet 4等商用領先模型,展現出強大的專業應用潛力。Vjf28資訊網——每日最新資訊28at.com

    當前多模態大模型在醫療領域面臨的挑戰Vjf28資訊網——每日最新資訊28at.com

    1. 醫學知識覆蓋不全,深度不足Vjf28資訊網——每日最新資訊28at.com

    過于依賴影像-文本對:許多現有工作主要通過對齊醫學影像和相關的文本描述(如放射報告)來學習。這種方式雖然能建立基本的視覺-語言聯系,但對于影像之外的廣闊醫學知識,如藥理學、病理生理學、臨床指南、公共衛生知識等的覆蓋非常有限。Vjf28資訊網——每日最新資訊28at.com

    對多模態整合的深度和廣度不足:可能過于偏重某一模態(如X光片),對其他重要醫學影像模態(如病理、內鏡、超聲等)的覆蓋和理解不足。Vjf28資訊網——每日最新資訊28at.com

    2. 數據質量參差不齊,易產生“幻覺”Vjf28資訊網——每日最新資訊28at.com

    開源數據噪聲大:許多公開的醫學多模態數據集來源于科研論文自動抽取或網絡抓取,不可避免地含有噪聲、不準確信息或冗余內容。Vjf28資訊網——每日最新資訊28at.com

    數據合成質量難控:一些工作嘗試通過模型蒸餾等方式合成數據,但如果缺乏有效的監督和質量控制,合成數據可能繼承甚至放大基礎模型的偏見或錯誤,導致模型更容易產生“幻覺”(即生成不符合事實或無意義的內容)。Vjf28資訊網——每日最新資訊28at.com

    缺乏細粒度標注:醫學影像的解讀需要精確到細節,但很多數據集的標注較為粗糙,難以支撐模型學習細致的病灶特征和微妙的診斷線索。Vjf28資訊網——每日最新資訊28at.com

    3. 缺乏針對復雜醫療場景的推理能力?Vjf28資訊網——每日最新資訊28at.com

    簡單問答為主:現有模型在處理簡單的圖像描述或直接問答(如“圖片中是什么器官?”)方面可能表現尚可,但面對需要多步推理、整合多源信息、進行鑒別診斷等復雜醫療場景時,其推理能力往往不足。Vjf28資訊網——每日最新資訊28at.com

    “黑箱”特性:許多模型的決策過程不透明,難以解釋其診斷或建議的依據,這在對可靠性和可解釋性要求極高的醫療領域是嚴重缺陷。Vjf28資訊網——每日最新資訊28at.com

    4. 評測標準不統一,難以橫向比較Vjf28資訊網——每日最新資訊28at.com

    各自為政的評估:不同研究往往在不同的數據集子集、不同的評估指標上進行評測,導致模型之間的性能難以進行公平、直接的比較。Vjf28資訊網——每日最新資訊28at.com

    復現困難:許多模型的代碼和數據不完全公開,或者環境配置復雜,使得其他研究者難以復現其結果,阻礙了領域的發展。Vjf28資訊網——每日最新資訊28at.com

    為了解決上述問題,我們從數據構造,模型訓練以及評測框架三個層面進行探索。Vjf28資訊網——每日最新資訊28at.com

    數據構造?
    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    要讓AI真正“懂醫學”,離不開高質量的數據,但醫學領域的數據不僅少,而且復雜、難獲取。為此,我們構造了一套全流程的醫療多模態數據收集和合成流程。Vjf28資訊網——每日最新資訊28at.com

    1. 高質量的數據合成和增強:面對一些簡短、模糊的醫學描述,我們用大模型能力“補全細節”,生成更豐富、更專業的圖文解釋。同時從專業醫學教材和題庫提取圖文信息生成指令數據,提高對嵌入文本的識別能力。此外還合成了大量的醫學視覺問答數據,幫助模型回答診斷和醫學相關的問題。最后我們還設計了CoT醫療推理數據合成流程,生成醫療的推理思維鏈路數據,幫助模型更好理解復雜醫學問題。?Vjf28資訊網——每日最新資訊28at.com

    2. 嚴格質量控制:所有數據經過嚴格篩選和清洗,比如圖像和文本去重、答案準確性檢查等,以確保數據的高質量和相關性。Vjf28資訊網——每日最新資訊28at.com

    通過以上流程,我們一共得到2.55M條高質量醫療描述數據和2.5M醫療指令數據,同時引入了大量通用域的數據,作為模型訓練基礎。Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    模型訓練
    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    多模態醫學大模型基于Qwen2.5-VL(7B和32B的Instruct版本)進行持續訓練,為了更好的讓模型深入理解多模態醫療知識,我們設計了以下多階段訓練范式:Vjf28資訊網——每日最新資訊28at.com

    1. 醫療淺層對齊:我們先讓模型對醫學影像(如X光、CT、MRI)與對應的醫學描述的理解能力。初步建立醫學影像特征與語言模型表征空間的連接。通過快速適應醫學影像的基本特征,為后續深層融合奠定基礎。Vjf28資訊網——每日最新資訊28at.com

    2. 醫療深層對齊:我們使用更復雜、更長的圖文數據,還加入了通用世界知識數據,進行端到端微調。 讓模型能深度融合多模態醫學信息,從而有可能處理更細致的醫學內容,比如腫瘤特征、病變位置等,朝著“通用醫生”進行努力。Vjf28資訊網——每日最新資訊28at.com

    3. 醫療指令微調:我們使用大規模、多樣化的醫療指令數據(包括VQA、報告生成、OCR、CoT推理等)以及通用的多模態/文本指令數據和醫學文本數據進行端到端微調,增強模型的任務泛化能力和復雜場景的應答能力,使其更貼近實際醫療應用。Vjf28資訊網——每日最新資訊28at.com

    4. 面向醫療的強化學習 :我們還初步探索了強化學習訓練在對醫療多模態任務提升的潛力。我們構建了約10萬條的醫療可驗證數據集,采用可驗證獎勵強化學習(RLVR)范式,利用GRPO算法進行訓練。期望探索通過獎勵信號引導模型生成更準確、更具邏輯性的醫療推理路徑。Vjf28資訊網——每日最新資訊28at.com

    統一的評測框架 :MedEvalKit
    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    為解決現有醫療MLLMs 評測標準不一、復現困難的問題,我們開發了一個涵蓋面廣,易于使用,高效評測的醫療評測框架MedEvalKit。Vjf28資訊網——每日最新資訊28at.com

    1. MedEvalKit匯集了主流的醫療多模態和文本評測基準,包括:Vjf28資訊網——每日最新資訊28at.com

    a. 多模態QA:VQA-RAD, SLAKE, PathVQA, PMC-VQA (v2), OmniMedVQA, MMMU (Health & Medical), MedXpertQA (multimodal)。Vjf28資訊網——每日最新資訊28at.com

    b. 文本QA:MMLU (medical subset), PubMedQA, MedMCQA, MedQA-USMLE, MedBullets, MedXpertQA (text), SuperGPQA。Vjf28資訊網——每日最新資訊28at.com

    c. 報告生成:MIMIC-CXR, IU-Xray, CheXpert Plus。共計覆蓋16個基準數據集,15.2萬評估樣本和12.1萬張不同的醫學影像。Vjf28資訊網——每日最新資訊28at.com

    2. 標準化流程:統一了數據預處理、模型推理接口和后處理協議,支持一鍵式評估。Vjf28資訊網——每日最新資訊28at.com

    3. 多維度評估:針對不同任務類型采用特定評估指標(如QA任務的準確率,報告生成任務的ROUGE-L, CIDEr, SembScore, RaTEScore, RadCliQ-v1)。并支持“LLM-as-a-Judge”策略輔助評估,兼顧客觀與主觀評價。Vjf28資訊網——每日最新資訊28at.com

    4. 高效與可擴展:支持vLLM進行推理加速;支持多種模型評測;支持多種輸出模式評測(如直接輸出答案評測,先推理后解析答案進行評測等)。Vjf28資訊網——每日最新資訊28at.com

    模型結果?Vjf28資訊網——每日最新資訊28at.com

    我們使用MedEvalKit上對我們的醫療多模態大模型和當前主流多模態醫療模型進行了全面評估:Vjf28資訊網——每日最新資訊28at.com

    1. 醫療多模態問答測試:Vjf28資訊網——每日最新資訊28at.com

    a. 32B模型在所有7個多模態基準測試中取得了平均66.6%的準確率,超越了包括GPT-4.1 (63.4%)、Claude Sonnet 4 (61.5%) 和?Gemini-2.5-Flash (65.1%)?在內的所有專有模型和開源模型,并在VQA-RAD, SLAKE, PathVQA, OmniMedVQA, MedXpertQA-Multimodal?等多個數據集上取得最佳成績。Vjf28資訊網——每日最新資訊28at.com

    b. 7B模型在<10B參數規模的開源模型中表現最佳,平均準確率達到61.8%,顯著優于其他同類模型。Vjf28資訊網——每日最新資訊28at.com

    2. 在醫療文本基準測試和醫學報告生成:我們的模型也表現優異,超越了所有對比的開源模型。Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    3.??除了標準數據評測外,我們也展示了在醫學影像問答、醫學診斷、醫學知識解釋、公共衛生問題分析以及醫學報告生成等真實場景中的應用潛力。Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    Vjf28資訊網——每日最新資訊28at.com

    未來方向Vjf28資訊網——每日最新資訊28at.com

    雖然我們的模型在多個權威多模態醫療測試取得領先,然而在使用過程中仍會出現幻象,無法準確識別病種等問題。因此在推動醫療多模態大模型發展的過程中,我們總結出五個值得關注的核心方向,以突破當前技術瓶頸,提升模型在真實臨床中的應用價值:Vjf28資訊網——每日最新資訊28at.com

    1. 高質量醫療數據的構建 :當前醫學圖文數據稀缺且獲取成本高,未來需投入更多資源構建多樣化、高可信度的數據集,并引入“人在環路”(human-in-the-loop)的自動化評估與優化機制,提升數據質量與產出效率。Vjf28資訊網——每日最新資訊28at.com

    2. 更全面的醫療多模態基準:現有醫療基準未能充分反映復雜的真實場景。未來需借鑒HealthBench等框架,打造更具代表性、更實用的醫學多模態評估體系,更準確地衡量模型在臨床中的表現。Vjf28資訊網——每日最新資訊28at.com

    3. 擴展模型能力邊界:當前模型對3D影像、超高分辨率病理圖(WSI)、組學數據等的支持仍依賴預處理。未來將發展原生支持新模態的能力,使模型更好地理解CT、MRI、病理、基因組等復雜醫學信息。Vjf28資訊網——每日最新資訊28at.com

    4. 面向醫療場景的訓練策略優化:醫學領域推理高度依賴臨床經驗與知識。后續訓練需要更加聚焦醫療語境,開發定制化獎勵函數&過程監督方法,探索針對醫療MLLMs的強化學習方法。讓模型的輸出更契合醫療任務需求,滿足專業醫療場景下復雜的醫療推理需求。Vjf28資訊網——每日最新資訊28at.com

    5. 醫療相關專業評估指標引入:雖然MedEvalKit已初步引入醫學任務指標,但當前仍以通用評估標準為主。未來應進一步引入如C-index、臨床療效評分、決策曲線分析等醫學專用指標,同時結合專家人工評審,全面提升模型評估的可信度、實用性與安全保障。Vjf28資訊網——每日最新資訊28at.com

    本文鏈接:http://www.yifxia.cn/showinfo-16-163686-0.html探索醫療科技的未來:達摩院在多模態大模型領域的創新嘗試

    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

    上一篇: 直播間假老酒亂象被曝光,成本幾塊錢標價899,有老酒商建議引入第三方鑒定機構

    下一篇: 全系標配最新華為全家桶 嵐圖FREE+正式預售22.99萬元起

    標簽:
    • 熱門焦點
    Top 毛片高清| 免费国产在线视频| 国产91精品露脸国语对白| 日韩综合| 亚洲 欧美 成人日韩| 久久精品免视看国产成人2021| 沈樵在线观看福利| 国产原创中文字幕| 日本在线播放一区| 精品毛片视频| 日韩av成人| 久久国产影视免费精品| 一级毛片视频在线观看| 韩国三级香港三级日本三级la | 亚欧乱色一区二区三区| 亚州视频一区二区| 日本特黄特黄aaaaa大片 | 欧美18性精品| 日韩在线观看网站| 97视频免费在线观看| 日韩专区亚洲综合久久| 欧美日本免费| 精品视频在线看 | 精品国产香蕉在线播出| 国产原创视频在线| 久久精品成人一区二区三区| 国产一区免费在线观看| 国产91素人搭讪系列天堂| 精品国产香蕉在线播出| 精品国产亚一区二区三区| 色综合久久天天综合| 精品国产一区二区三区免费| 精品久久久久久综合网| 国产a毛片| 91麻豆爱豆果冻天美星空| 九九九国产| 欧美大片一区| 亚飞与亚基在线观看| 日韩中文字幕在线观看视频| 国产成人精品综合| 国产成a人片在线观看视频| 国产一区二区精品在线观看| 欧美另类videosbestsex视频| 青青青草视频在线观看| 国产国语在线播放视频| 国产伦久视频免费观看 视频| 青青青草影院| 精品视频一区二区三区| 香蕉视频久久| 久久精品成人一区二区三区| 97视频免费在线观看| 尤物视频网站在线观看| 四虎久久影院| 黄色免费三级| 99色播| 久久精品欧美一区二区| 久久成人综合网| 高清一级毛片一本到免费观看| 成人免费一级纶理片| 欧美大片a一级毛片视频| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 免费国产在线观看| 韩国三级视频网站| 午夜家庭影院| 九九精品久久久久久久久| 欧美一级视| 韩国三级一区| 免费国产在线观看| 国产91丝袜在线播放0| 国产视频网站在线观看| 99久久精品国产免费| 天天色色网| 日韩一级黄色大片| 成人a级高清视频在线观看| 亚飞与亚基在线观看| 成人影院一区二区三区| 日韩专区一区| 国产高清视频免费观看| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产成人精品一区二区视频| 91麻豆爱豆果冻天美星空| 精品久久久久久免费影院| 美女免费精品高清毛片在线视| 国产一区二区精品久| 亚欧乱色一区二区三区| 91麻豆爱豆果冻天美星空| 欧美1区| 欧美一级视频高清片| 黄视频网站在线看| 午夜在线观看视频免费 成人| 欧美激情一区二区三区在线| 欧美a级v片不卡在线观看| 精品国产一区二区三区久久久狼| 青青久热| 一本伊大人香蕉高清在线观看| 成人高清免费| 国产91丝袜高跟系列| 国产欧美精品午夜在线播放| 亚洲天堂免费| 可以免费在线看黄的网站| 亚洲 欧美 成人日韩| 欧美α片无限看在线观看免费| 亚飞与亚基在线观看| 一a一级片| 欧美另类videosbestsex高清| 国产一区精品| 九九九网站| 日本在线www| 欧美国产日韩精品| 亚飞与亚基在线观看| 精品国产亚一区二区三区| 国产精品免费久久| 成人a级高清视频在线观看| 国产一级强片在线观看| 色综合久久天天综线观看| 欧美爱色| 国产麻豆精品视频| 久久久久久久久综合影视网| 999精品视频在线| 免费一级片在线| 国产精品自拍亚洲| 日日夜夜婷婷| 精品国产香蕉在线播出| 青草国产在线观看| 欧美一级视| 国产一区二区精品在线观看| 国产精品免费久久| 一本伊大人香蕉高清在线观看| 成人影院一区二区三区| 亚洲www美色| 欧美另类videosbestsex高清| 四虎久久精品国产| 欧美大片aaaa一级毛片| 毛片的网站| 久久99这里只有精品国产| 国产不卡精品一区二区三区| 成人在激情在线视频| 久久成人性色生活片| 欧美α片无限看在线观看免费| 午夜激情视频在线观看| 欧美日本国产| 久久久久久久免费视频| 欧美一区二区三区在线观看| 精品国产三级a∨在线观看| 久久国产一久久高清| 久久国产影院| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 国产综合成人观看在线| 麻豆系列 在线视频| 天天做日日干| 成人免费观看的视频黄页| 日韩免费片| 天天做日日爱夜夜爽| 成人a大片在线观看| 国产亚洲精品成人a在线| 日韩在线观看网站| 国产a一级| 99久久精品国产国产毛片| 91麻豆精品国产高清在线| 国产成人精品综合在线| 一级女性大黄生活片免费| 高清一级做a爱过程不卡视频| 韩国三级香港三级日本三级la | 韩国三级视频网站| 免费一级片在线| 久久精品道一区二区三区| 久久精品免视看国产明星| 欧美18性精品| 久久99青青久久99久久| 99热精品在线| 91麻豆精品国产片在线观看| 国产a视频精品免费观看| 欧美日本二区| 成人免费福利片在线观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 成人高清视频免费观看| 国产精品1024永久免费视频| 精品国产一级毛片| 免费毛片基地| 精品视频在线看| 日本特黄特色aaa大片免费| 国产一区二区精品久| 一级片免费在线观看视频| 日韩中文字幕在线观看视频| 国产91精品露脸国语对白| 国产不卡在线观看视频| 免费一级生活片| 精品视频一区二区三区免费| 国产亚洲精品成人a在线| 国产原创视频在线| 日本免费看视频| 亚州视频一区二区| 日韩字幕在线| 免费毛片播放| 精品视频一区二区三区| 青青久久精品国产免费看| 色综合久久天天综合| 亚洲天堂免费| 精品国产一区二区三区久久久狼| 国产伦久视频免费观看 视频|