論文の概要: Instruction-Guided Lesion Segmentation for Chest X-rays with Automatically Generated Large-Scale Dataset
- arxiv url: http://arxiv.org/abs/2511.15186v1
- Date: Wed, 19 Nov 2025 07:17:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.676942
- Title: Instruction-Guided Lesion Segmentation for Chest X-rays with Automatically Generated Large-Scale Dataset
- Title(参考訳): 大規模データの自動生成による胸部X線画像の命令ガイドによる病変分割
- Authors: Geon Choi, Hangyul Yoon, Hyunju Shin, Hyunki Park, Sang Hoon Seo, Eunho Yang, Edward Choi,
- Abstract要約: 単純でユーザフレンドリーな命令に基づいて,多様な病変を分類するインストラクションガイド付き病変分割(ILS)を導入する。
本パラダイムでは,CXR病変分割のためのMIMIC-ILSを構築した。
MIMIC-ILSは、192K画像と91K独自のセグメンテーションマスクから派生した1.1Mのインストラクション・アンサー対を含み、7つの主要な病変をカバーしている。
- 参考スコア(独自算出の注目度): 42.048522149687145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The applicability of current lesion segmentation models for chest X-rays (CXRs) has been limited both by a small number of target labels and the reliance on long, detailed expert-level text inputs, creating a barrier to practical use. To address these limitations, we introduce a new paradigm: instruction-guided lesion segmentation (ILS), which is designed to segment diverse lesion types based on simple, user-friendly instructions. Under this paradigm, we construct MIMIC-ILS, the first large-scale instruction-answer dataset for CXR lesion segmentation, using our fully automated multimodal pipeline that generates annotations from chest X-ray images and their corresponding reports. MIMIC-ILS contains 1.1M instruction-answer pairs derived from 192K images and 91K unique segmentation masks, covering seven major lesion types. To empirically demonstrate its utility, we introduce ROSALIA, a vision-language model fine-tuned on MIMIC-ILS. ROSALIA can segment diverse lesions and provide textual explanations in response to user instructions. The model achieves high segmentation and textual accuracy in our newly proposed task, highlighting the effectiveness of our pipeline and the value of MIMIC-ILS as a foundational resource for pixel-level CXR lesion grounding.
- Abstract(参考訳): 胸部X線(CXR)に対する現在の病変セグメンテーションモデルの適用性は、少数のターゲットラベルと、長く詳細な専門家レベルのテキスト入力に依存することにより制限されており、実用上の障壁となっている。
これらの制約に対処するために、命令誘導型病変分割(ILS)という新しいパラダイムを導入する。
このパラダイムでは,胸部X線画像と対応するレポートからアノテーションを生成する完全自動マルチモーダルパイプラインを用いて,CXR病変分類のための最初の大規模インストラクション・アンサー・データセットMIMIC-ILSを構築した。
MIMIC-ILSは、192K画像と91K独自のセグメンテーションマスクから派生した1.1Mのインストラクション・アンサー対を含み、7つの主要な病変をカバーしている。
その実用性を実証的に示すために,MIMIC-ILSを微調整した視覚言語モデルであるROSALIAを紹介する。
ROSALIAは多様な病変を分類し、ユーザーの指示に応じてテキストによる説明を提供する。
本モデルでは,新たに提案した課題において,画素レベルのCXR病変の根拠となるMIMIC-ILSの有効性と有効性を強調し,高いセグメンテーションとテキスト精度を実現する。
関連論文リスト
- CLAPS: A CLIP-Unified Auto-Prompt Segmentation for Multi-Modal Retinal Imaging [47.04292769940597]
CLIP統合オートプロンプト(CLAPS)は,網膜イメージングにおける様々なタスクとモダリティをまたいだセグメンテーションを統一する新しい手法である。
私たちのアプローチは、CLIPベースの画像エンコーダを、大規模なマルチモーダル網膜データセット上で事前トレーニングすることから始まります。
タスクを統一し、曖昧さを解消するために、各画像のモダリティに固有の「モダリティシグネチャ」を付加したテキストプロンプトを使用する。
論文 参考訳(メタデータ) (2025-09-10T14:14:49Z) - Multimodal Causal-Driven Representation Learning for Generalizable Medical Image Segmentation [56.52520416420957]
医用画像セグメンテーションにおける領域一般化に取り組むために, MCDRL(Multimodal Causal-Driven Representation Learning)を提案する。
MCDRLは競合する手法より一貫して優れ、セグメンテーション精度が優れ、堅牢な一般化性を示す。
論文 参考訳(メタデータ) (2025-08-07T03:41:41Z) - MRGen: Segmentation Data Engine for Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では,データ合成における生成モデルの利用について検討する。
本稿では,テキストプロンプトとセグメンテーションマスクを条件とした医用画像合成のためのデータエンジンMRGenを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models [36.59952396405939]
放射線学レポート生成のためのセグメンテーション対応MLLMフレームワークMAIRA-Segを紹介する。
我々は、CXRにおける放射線学固有の構造のためのマスク擬似ラベルを得るために、専門家セグメンテーションモデルを訓練する。
我々は,プロンプトのマスク・アウェア・プロンプトを用いて,放射線学のドラフトレポートを作成している。
論文 参考訳(メタデータ) (2024-11-18T08:13:22Z) - MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.2585213273821716]
MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文 参考訳(メタデータ) (2024-09-28T23:10:37Z) - MLVICX: Multi-Level Variance-Covariance Exploration for Chest X-ray Self-Supervised Representation Learning [6.4136876268620115]
MLVICXは、胸部X線画像からの埋め込みの形でリッチな表現をキャプチャするアプローチである。
自己教師付き胸部X線表現学習におけるMLVICXの性能を示す。
論文 参考訳(メタデータ) (2024-03-18T06:19:37Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。