論文の概要: MedQ-UNI: Toward Unified Medical Image Quality Assessment and Restoration via Vision-Language Modeling
- arxiv url: http://arxiv.org/abs/2603.18465v1
- Date: Thu, 19 Mar 2026 03:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.949269
- Title: MedQ-UNI: Toward Unified Medical Image Quality Assessment and Restoration via Vision-Language Modeling
- Title(参考訳): MedQ-UNI:ビジョン・ランゲージ・モデリングによる医用画像の品質評価と修復に向けて
- Authors: Jiyao Liu, Junzhi Ning, Wanying Qu, Lihao Liu, Chenglong Ma, Junjun He, Ningsheng Xu,
- Abstract要約: 既存の医用画像復元法(Med-IR)は、通常、モダリティに特有または劣化に特有である。
この制限は、医用画像品質評価(Med-IQA)からMed-IRを分離することに起因すると我々は主張する。
MedQ-UNIは,アセスメント・ザ・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセス
- 参考スコア(独自算出の注目度): 13.15979289867313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing medical image restoration (Med-IR) methods are typically modality-specific or degradation-specific, failing to generalize across the heterogeneous degradations encountered in clinical practice. We argue this limitation stems from the isolation of Med-IR from medical image quality assessment (Med-IQA), as restoration models without explicit quality understanding struggle to adapt to diverse degradation types across modalities. To address these challenges, we propose MedQ-UNI, a unified vision-language model that follows an assess-then-restore paradigm, explicitly leveraging Med-IQA to guide Med-IR across arbitrary modalities and degradation types. MedQ-UNI adopts a multimodal autoregressive dual-expert architecture with shared attention: a quality assessment expert first identifies degradation issues through structured natural language descriptions, and a restoration expert then conditions on these descriptions to perform targeted image restoration. To support this paradigm, we construct a large-scale dataset of approximately 50K paired samples spanning three imaging modalities and five restoration tasks, each annotated with structured quality descriptions for joint Med-IQA and Med-IR training, along with a 2K-sample benchmark for evaluation. Extensive experiments demonstrate that a single MedQ-UNI model, without any task-specific adaptation, achieves state-of-the-art restoration performance across all tasks while generating superior descriptions, confirming that explicit quality understanding meaningfully improves restoration fidelity and interpretability.
- Abstract(参考訳): 既存の医用画像修復法(Med-IR)は、通常、モダリティに特有または劣化に特有であり、臨床で遭遇する異種劣化を一般化しない。
この制限は、医用画像品質評価(Med-IQA)からMed-IRを分離することに由来すると我々は主張する。
これらの課題に対処するため、我々はMedQ-UNIを提案する。MedQ-UNIは、MedQ-IQAを利用して任意のモダリティと劣化タイプをガイドする。
MedQ-UNIはマルチモーダルな自己回帰型デュアルエキスパートアーキテクチャを採用しており、品質評価の専門家はまず構造化された自然言語記述による劣化問題を識別し、回復の専門家はこれらの記述を条件として対象の画像復元を行う。
このパラダイムをサポートするために,3つの画像モダリティと5つの復元タスクにまたがる約50K対のサンプルからなる大規模データセットを構築し,Med-IQAとMed-IRの併用トレーニングのための構造的品質記述と評価のための2Kサンプルベンチマークを構築した。
広範囲にわたる実験により,タスク固有の適応を伴わない単一のMedQ-UNIモデルが,優れた記述を生成するとともに,すべてのタスクに対して最先端の復元性能を実現し,明示的な品質理解が復元精度と解釈可能性を大幅に向上させることを確認した。
関連論文リスト
- MedQ-Deg: A Multidimensional Benchmark for Evaluating MLLMs Across Medical Image Quality Degradations [33.6363892734003]
マルチモーダル大言語モデル(MLLM)は、医療画像が必然的に様々な品質劣化を被る現実的な臨床環境において課題に直面している。
既存のベンチマークでは,(1)医用画像品質勾配における大規模多次元評価の欠如,(2)系統的信頼性校正分析の欠如,の2つの重要な限界が示されている。
MedQ-Degは医用MLLMを画像品質劣化下で総合的に評価するためのベンチマークである。
論文 参考訳(メタデータ) (2026-03-08T19:11:21Z) - MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-10-24T02:11:05Z) - MedQ-Bench: Evaluating and Exploring Medical Image Quality Assessment Abilities in MLLMs [39.33140500353129]
MedQ-Benchはマルチモーダル大言語モデル(MLLM)を用いた医療画像品質評価のための総合的なベンチマークである。
ベンチマークは5つの画像モダリティと40以上の品質特性にまたがっており、合計2,600のパーセプティブクエリと708の推論アセスメントがある。
最新のMLLM14例について評価したところ, 既往ながら不安定な知覚能力, 推論能力を示し, 信頼性に乏しい臨床応用が得られた。
論文 参考訳(メタデータ) (2025-10-02T05:42:00Z) - TemMed-Bench: Evaluating Temporal Medical Image Reasoning in Vision-Language Models [54.48710348910535]
既存の医学推論ベンチマークは、主に1回の訪問からの画像に基づいて患者の状態を分析することに焦点を当てている。
臨床訪問における患者の状態の変化を分析するための最初のベンチマークであるTemMed-Benchを紹介する。
論文 参考訳(メタデータ) (2025-09-29T17:51:26Z) - MedIQA: A Scalable Foundation Model for Prompt-Driven Medical Image Quality Assessment [26.185840831950063]
しかし、既存のIQA法は、様々なモダリティや臨床シナリオにまたがる一般化に苦慮している。
MedIQAは,画像次元,モダリティ,解剖学的領域,タイプにおける可変性を扱うために設計された,医用IQAの最初の包括的基盤モデルである。
論文 参考訳(メタデータ) (2025-07-25T07:02:47Z) - MedGemma Technical Report [75.88152277443179]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。
MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。
また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文 参考訳(メタデータ) (2025-07-07T17:01:44Z) - On the Robustness of Medical Vision-Language Models: Are they Truly Generalizable? [0.9626666671366837]
我々は、複数の医療画像データセットに複数の摂動を適用した汚職ベンチマークであるMediMeta-Cを紹介する。
本稿では,事前訓練されたMVLMの視覚的エンコーダ適応であるRobustMedCLIPを提案する。
論文 参考訳(メタデータ) (2025-05-21T12:08:31Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。