論文の概要: MedVeriSeg: Teaching MLLM-Based Medical Segmentation Models to Verify Query Validity Without Extra Training
- arxiv url: http://arxiv.org/abs/2604.10242v2
- Date: Tue, 14 Apr 2026 07:00:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.328758
- Title: MedVeriSeg: Teaching MLLM-Based Medical Segmentation Models to Verify Query Validity Without Extra Training
- Title(参考訳): MedVeriSeg:MedVeriSeg: MLLMベースの医療セグメンテーションモデルを用いて、余分なトレーニングを伴わないクエリ妥当性の検証
- Authors: Ziqian Lu, Qinyue Tong, Jun Liu, Yunlong Yu,
- Abstract要約: MedVeriSeg は LISA ライクな医療セグメンテーションモデルのトレーニング不要な検証フレームワークである。
我々のキーとなる観察は、[SEG]トークン特徴とMLLMイメージ特徴との類似性マップは、真と偽のクエリに対して顕著に異なる分布パターンを示すことである。
SA-Med2D-20Mによる小規模なベンチマーク実験により、MedVeriSegは偽クエリのセグメンテーション要求を効果的に拒否することを示した。
- 参考スコア(独自算出の注目度): 20.87443071413578
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite recent advances in MLLM-based medical image segmentation, existing LISA-like methods cannot reliably reject false queries and often produce hallucinated segmentation masks for absent targets. This limitation reduces practical reliability in both medical education and clinical use. In this work, we propose MedVeriSeg, a training-free verification framework that equips LISA-like medical segmentation models with the ability to identify and reject false queries which contain non-existent targets. Our key observation is that the similarity map between the [SEG] token feature and MLLM image features exhibits markedly different distribution patterns for true and false queries. Based on this, we introduce a Similarity Response Quality Scoring Module that characterizes the similarity map from three aspects: strength, compactness, and purity, producing an initial target-existence prediction. We further incorporate qualitative visual evidence by using GPT-4o to jointly assess the similarity heatmap and the results of Similarity Response Quality Scoring Module for final verification. Experiments on a small-scale benchmark constructed from SA-Med2D-20M show that MedVeriSeg effectively rejects false-query segmentation requests while maintaining reliable recognition of true queries.
- Abstract(参考訳): MLLMベースの医療画像セグメンテーションの最近の進歩にもかかわらず、既存のLISAライクな手法は、偽のクエリを確実に拒否することができず、しばしば欠落したターゲットに対して幻覚的なセグメンテーションマスクを生成する。
この制限により、医療教育と臨床利用の双方において実用的信頼性が低下する。
本研究では,LISAのような医用セグメンテーションモデルを組み込んだトレーニング不要な検証フレームワークであるMedVeriSegを提案する。
我々のキーとなる観察は、[SEG]トークン特徴とMLLMイメージ特徴との類似性マップは、真と偽のクエリに対して顕著に異なる分布パターンを示すことである。
そこで本研究では, 類似度マップを, 強度, コンパクト度, 純度という3つの側面から特徴付け, 初期目標存在予測を生成する類似度応答品質スコアリングモジュールを提案する。
さらに、GPT-4oを用いて類似性ヒートマップと類似性応答品質検査モジュールの最終的な検証結果を共同で評価することにより、定性的な視覚的証拠を取り入れた。
SA-Med2D-20Mで構築された小規模ベンチマークの実験により、MedVeriSegは真クエリの信頼性を維持しながら、偽クエリのセグメンテーション要求を効果的に拒否することを示した。
関連論文リスト
- Lost in the Hype: Revealing and Dissecting the Performance Degradation of Medical Multimodal Large Language Models in Image Classification [14.247959730104085]
マルチモーダル大言語モデル(MLLM)は、医療画像解析の分野で前例のない応用の波を引き起こしている。
しかし、医学画像分類では、最先端の医療MLLMは従来のディープラーニングモデルと比べて一貫して性能が劣っている。
本稿では、3つの代表的な画像分類データセットにまたがる14のオープンソース医療MLLMについて広範な実験を行った。
論文 参考訳(メタデータ) (2026-04-09T15:07:26Z) - M3CoTBench: Benchmark Chain-of-Thought of MLLMs in Medical Image Understanding [66.78251988482222]
CoT(Chain-of-Thought)推論は、ステップバイステップの中間推論を奨励することによって、大規模言語モデルの強化に有効であることが証明されている。
医用画像理解のための現在のベンチマークでは、推論パスを無視しながら最終回答に重点を置いている。
M3CoTBenchは、透明で信頼性が高く、診断的に正確な医療用AIシステムの開発を促進することを目的としている。
論文 参考訳(メタデータ) (2026-01-13T17:42:27Z) - Proof of Concept for Mammography Classification with Enhanced Compactness and Separability Modules [0.0]
本研究では,最近の医用画像分類手法の検証と拡張について述べる。
Inbreast、MIAS、InceptionMのマンモグラフィコレクションを統合したKaggleデータセットを使用して、ベースラインのCNN、ConvNeXt Tiny、InceptionV3のバックボーンをGAGMとSEモジュールで強化したものだ。
その結果, GAGMとSEが特徴識別性を高め, 偽陰性を低下させる効果が確認された。
しかし,本実験では,マンモグラフィの分類条件下において,特徴平滑化損失は測定不可能な改善を得られなかった。
論文 参考訳(メタデータ) (2025-12-06T21:36:05Z) - Sim4Seg: Boosting Multimodal Multi-disease Medical Diagnosis Segmentation with Region-Aware Vision-Language Similarity Masks [54.00822479127598]
医療診断(MDS)という医用視覚言語タスクについて紹介する。
MDSは、医療画像に対する臨床クエリを理解し、対応するセグメンテーションマスクと診断結果を生成することを目的としている。
診断セグメンテーションの性能を向上させる新しいフレームワークであるSim4Segを提案する。
論文 参考訳(メタデータ) (2025-11-10T03:22:42Z) - SemSim: Revisiting Weak-to-Strong Consistency from a Semantic Similarity Perspective for Semi-supervised Medical Image Segmentation [18.223854197580145]
医用画像分割のための半教師付き学習(SSL)は難しいが、非常に実践的な課題である。
セムシム(SemSim)という名前のFixMatchに基づく新しいフレームワークを提案する。
SemSimは3つの公開セグメンテーションベンチマークで最先端の手法よりも一貫した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2024-10-17T12:31:37Z) - Uncertainty-Aware Adapter: Adapting Segment Anything Model (SAM) for Ambiguous Medical Image Segmentation [20.557472889654758]
Segment Anything Model (SAM) は自然画像のセグメンテーションにおいて大きな成功を収めた。
自然画像とは異なり、医療画像の多くの組織や病変はぼやけており、曖昧である可能性がある。
本研究では,不確実性を認識した医療画像のセグメンテーションのためにSAMを効率よく微調整するUncertainty-aware Adapterという新しいモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-16T14:11:54Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - Label Cleaning Multiple Instance Learning: Refining Coarse Annotations
on Single Whole-Slide Images [83.7047542725469]
病理検体の全スライディング画像(WSI)における癌領域のアノテーションは、臨床診断、生医学研究、機械学習アルゴリズムの開発において重要な役割を担っている。
本稿では,外部トレーニングデータを必要とせず,単一のWSI上で粗いアノテーションを洗練するためのLC-MIL (Label Cleaning Multiple Instance Learning) を提案する。
乳癌リンパ節転移,肝癌,大腸癌の検体を併用した異種 WSI 実験の結果,LC-MIL は粗いアノテーションを著しく改善し,単一スライドから学習しながらも,最先端の代替品よりも優れていた。
論文 参考訳(メタデータ) (2021-09-22T15:06:06Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。