論文の概要: DiN: Diffusion Model for Robust Medical VQA with Semantic Noisy Labels
- arxiv url: http://arxiv.org/abs/2503.18536v1
- Date: Mon, 24 Mar 2025 10:42:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:35:52.342504
- Title: DiN: Diffusion Model for Robust Medical VQA with Semantic Noisy Labels
- Title(参考訳): DiN:セマンティックノイズラベルを用いたロバスト医療用VQAの拡散モデル
- Authors: Erjian Guo, Zhen Zhao, Zicheng Wang, Tong Chen, Yunyi Liu, Luping Zhou,
- Abstract要約: Med-VQAにおけるノイズラベルに対する最初のベンチマークは、意味論的に設計されたノイズタイプによる人間の誤ラベルをシミュレートすることで確立する。
Med-VQAにおけるノイズラベルの処理に拡散モデルを利用するDiNフレームワークを導入する。
- 参考スコア(独自算出の注目度): 23.749617192095204
- License:
- Abstract: Medical Visual Question Answering (Med-VQA) systems benefit the interpretation of medical images containing critical clinical information. However, the challenge of noisy labels and limited high-quality datasets remains underexplored. To address this, we establish the first benchmark for noisy labels in Med-VQA by simulating human mislabeling with semantically designed noise types. More importantly, we introduce the DiN framework, which leverages a diffusion model to handle noisy labels in Med-VQA. Unlike the dominant classification-based VQA approaches that directly predict answers, our Answer Diffuser (AD) module employs a coarse-to-fine process, refining answer candidates with a diffusion model for improved accuracy. The Answer Condition Generator (ACG) further enhances this process by generating task-specific conditional information via integrating answer embeddings with fused image-question features. To address label noise, our Noisy Label Refinement(NLR) module introduces a robust loss function and dynamic answer adjustment to further boost the performance of the AD module.
- Abstract(参考訳): 医用視覚質問応答システム(Med-VQA)は、重要な臨床情報を含む医用画像の解釈に有用である。
しかし、ノイズラベルと限られた高品質データセットの課題はいまだ未解決のままである。
そこで我々は,Med-VQAにおけるノイズラベルの最初のベンチマークを,意味論的に設計されたノイズタイプによる人間の誤ラベルをシミュレートすることによって確立した。
さらに重要なことは、拡散モデルを利用してMed-VQAのノイズラベルを処理するDiNフレームワークを導入することである。
解答を直接予測する支配的な分類に基づくVQAアプローチとは異なり、我々のAnswer Diffuser (AD)モジュールは粗大なプロセスを採用し、解答候補を拡散モデルで精製して精度を向上させる。
解答条件生成装置(ACG)は、解答埋め込みと解答探索機能を統合することにより、タスク固有の条件情報を生成することにより、この処理をさらに強化する。
ラベルノイズに対処するため,我々のNoisy Label Refinement(NLR)モジュールはロバストな損失関数と動的応答調整を導入し,ADモジュールの性能をさらに向上させる。
関連論文リスト
- Unleashing the Potential of Open-set Noisy Samples Against Label Noise for Medical Image Classification [45.319828759068415]
医用画像分類タスクのための拡張ノイズ・ロバスト・コントラスト・オープンセット機能拡張フレームワークを提案する。
このフレームワークにはExtensioned Noise-robust Supervised Convistive Lossが含まれている。
また、機能レベルでオープンセットのサンプルを豊かにするOpen-set Feature Augmentationモジュールを開発し、それらを動的クラスラベルに割り当てます。
論文 参考訳(メタデータ) (2024-06-18T05:54:28Z) - Robust Pseudo-label Learning with Neighbor Relation for Unsupervised Visible-Infrared Person Re-Identification [33.50249784731248]
UVI-ReID (unsupervised Visible-Infrared Person Re-identification) は、視覚的および赤外線モダリティにまたがる歩行者像をアノテーションなしでマッチングすることを目的としている。
近年、擬似ラベル法はUSVI-ReIDにおいて主流となっているが、擬似ラベル法固有のノイズは大きな障害となる。
我々は,雑音の多い擬似ラベルを補正するRPNRフレームワークを設計する。
SYSU-MM01とRegDBの2つの広く知られているベンチマークで実施された総合的な実験は、RPNRが現在最先端のGURを平均で上回っていることを実証している。
論文 参考訳(メタデータ) (2024-05-09T08:17:06Z) - Label-Noise Robust Diffusion Models [18.82847557713331]
条件拡散モデルは、様々な生成タスクにおいて顕著な性能を示した。
訓練には、条件付き入力でしばしばノイズを含む大規模なデータセット、すなわちノイズラベルが必要である。
本稿では,雑音ラベル付き条件付き拡散モデルの学習のための遷移対応重み付きDenoising Score Matchingを提案する。
論文 参考訳(メタデータ) (2024-02-27T14:00:34Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering [56.25766322554655]
MedVQA(Medicical Visual Question Answering)は、診断精度と医療提供を向上する重要な機会を提供する。
本稿では,事前学習した視覚エンコーダの視覚情報を大規模言語モデルに整列させることにより,医用視覚理解のための生成モデルを提案する。
PMC-VQAで提案されたモデルをトレーニングし、VQA-RAD、SLAKE、Image-Clef 2019など、複数の公開ベンチマークで微調整する。
論文 参考訳(メタデータ) (2023-05-17T17:50:16Z) - Learning Confident Classifiers in the Presence of Label Noise [5.551384206194696]
本稿では,ノイズ観測のための確率論的モデルを提案し,信頼性の高い分類とセグメンテーションモデルの構築を可能にする。
実験により,本アルゴリズムは,検討された分類問題と分割問題に対して,最先端の解よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-02T04:27:25Z) - Robust Semantic Communications with Masked VQ-VAE Enabled Codebook [56.63571713657059]
本稿では,ロバストなエンドツーエンドのセマンティック通信システムにおいて,セマンティックノイズに対処するためのフレームワークを提案する。
セマンティックノイズに対処するため、重み付き対向トレーニングを開発し、トレーニングデータセットにセマンティックノイズを組み込む。
ノイズやタスク非関連の特徴を抑える機能重要モジュール (FIM) を開発した。
論文 参考訳(メタデータ) (2022-06-08T16:58:47Z) - Improving Medical Image Classification with Label Noise Using
Dual-uncertainty Estimation [72.0276067144762]
医用画像における2種類のラベルノイズについて論じ,定義する。
医用画像分類作業中にこれら2つのラベルノイズを処理する不確実性推定に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-28T14:56:45Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。