論文の概要: MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images
- arxiv url: http://arxiv.org/abs/2511.12110v1
- Date: Sat, 15 Nov 2025 08:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.615033
- Title: MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images
- Title(参考訳): MediRound: 医療画像におけるマルチラウンドエンティティ推論セグメンテーション
- Authors: Qinyue Tong, Ziqian Lu, Jun Liu, Rui Zuo, Zheming Lu,
- Abstract要約: 我々はMEMR-Seg(Multi-Round Entity-Level Medical Reasoning)を紹介する。
MEMR-Segは、エンティティレベルの推論を備えたマルチラウンドクエリを通じてセグメンテーションマスクを生成する必要がある新しいタスクである。
MR-MedSegは、ラウンドごとのエンティティベースの推論を特徴とする、177Kのマルチラウンド医療セグメント対話の大規模データセットである。
- 参考スコア(独自算出の注目度): 10.168003371332746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the progress in medical image segmentation, most existing methods remain task-specific and lack interactivity. Although recent text-prompt-based segmentation approaches enhance user-driven and reasoning-based segmentation, they remain confined to single-round dialogues and fail to perform multi-round reasoning. In this work, we introduce Multi-Round Entity-Level Medical Reasoning Segmentation (MEMR-Seg), a new task that requires generating segmentation masks through multi-round queries with entity-level reasoning. To support this task, we construct MR-MedSeg, a large-scale dataset of 177K multi-round medical segmentation dialogues, featuring entity-based reasoning across rounds. Furthermore, we propose MediRound, an effective baseline model designed for multi-round medical reasoning segmentation. To mitigate the inherent error propagation in the chain-like pipeline of multi-round segmentation, we introduce a lightweight yet effective Judgment & Correction Mechanism during model inference. Experimental results demonstrate that our method effectively addresses the MEMR-Seg task and outperforms conventional medical referring segmentation methods.
- Abstract(参考訳): 医用画像のセグメンテーションの進歩にもかかわらず、既存の方法の多くはタスク固有であり、相互作用性が欠如している。
最近のテキストプロンプトベースのセグメンテーションアプローチでは、ユーザ駆動と推論に基づくセグメンテーションが強化されているが、シングルラウンドの対話に限られており、マルチラウンドの推論の実行に失敗している。
本稿では,マルチラウンドクエリによるセグメンテーションマスクの生成を必要とする新しいタスクであるMEMR-Seg(Multi-Round Entity-Level Medical Reasoning Segmentation)を紹介する。
このタスクを支援するために,MR-MedSegという,ラウンドごとのエンティティベースの推論を特徴とする177Kのマルチラウンド医療セグメンテーションダイアログの大規模データセットを構築した。
さらに,マルチラウンド医療推論セグメンテーションのための効果的なベースラインモデルであるMediRoundを提案する。
多ラウンドセグメンテーションの連鎖状パイプラインにおける固有誤差伝搬を軽減するため,モデル推論において,軽量で効果的な判断・補正機構を導入する。
実験の結果,本手法はMEMR-Segタスクを効果的に処理し,従来の医用参照セグメンテーション法より優れていることが示された。
関連論文リスト
- Sim4Seg: Boosting Multimodal Multi-disease Medical Diagnosis Segmentation with Region-Aware Vision-Language Similarity Masks [54.00822479127598]
医療診断(MDS)という医用視覚言語タスクについて紹介する。
MDSは、医療画像に対する臨床クエリを理解し、対応するセグメンテーションマスクと診断結果を生成することを目的としている。
診断セグメンテーションの性能を向上させる新しいフレームワークであるSim4Segを提案する。
論文 参考訳(メタデータ) (2025-11-10T03:22:42Z) - Integrating Background Knowledge in Medical Semantic Segmentation with Logic Tensor Networks [1.2795501345884845]
本稿では,一階述語論理(FOL)ルールを用いて医学的背景知識を符号化するための論理ネットワーク(LTN)を提案する。
脳MRIで海馬のセグメンテーションの課題について検討した。
論文 参考訳(メタデータ) (2025-09-26T14:26:26Z) - CRISP-SAM2: SAM2 with Cross-Modal Interaction and Semantic Prompting for Multi-Organ Segmentation [32.48945636401865]
CRoss-modal Interaction と Semantic Prompting をベースとした CRISP-SAM2 という新しいモデルを提案する。
このモデルは、臓器のテキスト記述によって導かれる多臓器医療セグメンテーションへの有望なアプローチを示す。
我々の手法は、視覚的およびテキスト的入力を相互に文脈化されたセマンティクスに変換することから始まる。
論文 参考訳(メタデータ) (2025-06-29T07:05:27Z) - MedSeg-R: Reasoning Segmentation in Medical Images with Multimodal Large Language Models [48.24824129683951]
本稿では,複雑で暗黙的な医療指導に基づくセグメンテーションマスク作成を目的とした新しい課題である医用画像推論セグメンテーションを紹介する。
そこで本稿では,MLLMの推論能力を利用して臨床問題を理解するエンドツーエンドフレームワークであるMedSeg-Rを提案する。
1)画像の解釈と複雑な医用命令の理解を行い,マルチモーダルな中間トークンを生成するグローバルコンテキスト理解モジュール,2)これらのトークンをデコードして正確なセグメンテーションマスクを生成するピクセルレベルのグラウンドモジュールである。
論文 参考訳(メタデータ) (2025-06-12T08:13:38Z) - MAMBO-NET: Multi-Causal Aware Modeling Backdoor-Intervention Optimization for Medical Image Segmentation Network [51.68708264694361]
融合因子は、複雑な解剖学的変異や画像のモダリティ制限などの医療画像に影響を与える可能性がある。
医用画像セグメンテーションのためのバックドア・インターベンション最適化ネットワークを提案する。
本手法は, 混乱要因の影響を著しく低減し, セグメンテーション精度を向上させる。
論文 参考訳(メタデータ) (2025-05-28T01:40:10Z) - MediSee: Reasoning-based Pixel-level Perception in Medical Images [6.405810587061276]
MedSD(Medical Reasoning and Detection)を導入した新しい医療ビジョンタスクについて紹介する。
MedSDの目的は、医療画像に関する暗黙のクエリを理解し、対応するセグメンテーションマスクとターゲットオブジェクトのバウンディングボックスを生成することである。
医学的推論のセグメンテーションと検出のために設計された効果的なベースラインモデルであるメディセーを提案する。
論文 参考訳(メタデータ) (2025-04-15T09:28:53Z) - Dynamically evolving segment anything model with continuous learning for medical image segmentation [50.92344083895528]
ダイナミックに進化する医療画像セグメンテーションモデルであるEvoSAMを紹介する。
EvoSAMは、継続的に拡張されるシナリオとタスクの配列から新しい知識を蓄積する。
血管セグメンテーションに関する外科医による実験により、EvoSAMはユーザプロンプトに基づいてセグメンテーション効率を高めることが確認された。
論文 参考訳(メタデータ) (2025-03-08T14:37:52Z) - Generalized Organ Segmentation by Imitating One-shot Reasoning using
Anatomical Correlation [55.1248480381153]
そこで我々は,アノテーション付きオルガンクラスから一般化されたオルガン概念を学習し,その概念を未知のクラスに転送するOrganNetを提案する。
そこで,OrganNetは臓器形態の幅広い変化に効果的に抵抗でき,一発分節タスクで最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-30T13:41:12Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。