論文の概要: Cause-Effect Driven Optimization for Robust Medical Visual Question Answering with Language Biases
- arxiv url: http://arxiv.org/abs/2506.17903v1
- Date: Sun, 22 Jun 2025 05:20:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.645075
- Title: Cause-Effect Driven Optimization for Robust Medical Visual Question Answering with Language Biases
- Title(参考訳): 言語バイアスを用いたロバストな医用視覚質問応答に対する因果効果駆動型最適化
- Authors: Huanjia Zhu, Yishu Liu, Xiaozhao Fang, Guangming Lu, Bingzhi Chen,
- Abstract要約: 我々はCEDOと呼ばれる新しい因果効果駆動最適化フレームワークを提案する。
MHO(Modality-driven Heterogeneous Optimization)、GMS(Gradient-Guided Modality Synergy)、DLR(Dis Distribution-Adapted Loss Rescaling)の3つの確立されたメカニズムが組み込まれている。
複数の従来の偏見に敏感なベンチマークの実験は、最先端の競合相手に対するCEDOの頑健さを一貫して示している。
- 参考スコア(独自算出の注目度): 27.125693168830832
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing Medical Visual Question Answering (Med-VQA) models often suffer from language biases, where spurious correlations between question types and answer categories are inadvertently established. To address these issues, we propose a novel Cause-Effect Driven Optimization framework called CEDO, that incorporates three well-established mechanisms, i.e., Modality-driven Heterogeneous Optimization (MHO), Gradient-guided Modality Synergy (GMS), and Distribution-adapted Loss Rescaling (DLR), for comprehensively mitigating language biases from both causal and effectual perspectives. Specifically, MHO employs adaptive learning rates for specific modalities to achieve heterogeneous optimization, thus enhancing robust reasoning capabilities. Additionally, GMS leverages the Pareto optimization method to foster synergistic interactions between modalities and enforce gradient orthogonality to eliminate bias updates, thereby mitigating language biases from the effect side, i.e., shortcut bias. Furthermore, DLR is designed to assign adaptive weights to individual losses to ensure balanced learning across all answer categories, effectively alleviating language biases from the cause side, i.e., imbalance biases within datasets. Extensive experiments on multiple traditional and bias-sensitive benchmarks consistently demonstrate the robustness of CEDO over state-of-the-art competitors.
- Abstract(参考訳): 既存の医用視覚質問回答(Med-VQA)モデルは、しばしば言語バイアスに悩まされる。
これらの問題に対処するため、CEDOと呼ばれる新しい因果効果駆動型最適化フレームワークを提案し、因果的・実効的両面から言語バイアスを包括的に緩和する3つの確立されたメカニズム、すなわち、モダリティ駆動型不均質最適化(MHO)、グラディエント誘導型モダリティ構文(GMS)、分散適応型損失再スケーリング(DLR)を提案する。
特に、MHOは不均一な最適化を実現するために、特定のモーダルに対して適応的な学習率を使用し、堅牢な推論能力を向上させる。
さらに、GMSはパレート最適化法を利用して、モダリティ間の相乗的相互作用を促進し、勾配直交を強制することでバイアスの更新を排除し、言語バイアスを効果側、すなわちショートカットバイアスから緩和する。
さらに、DLRは、個々の損失に適応的な重みを割り当て、すべての回答カテゴリでバランスの取れた学習を確実にし、原因側から言語バイアス、すなわちデータセット内の不均衡バイアスを効果的に緩和するように設計されている。
複数の従来型およびバイアスに敏感なベンチマークに対する大規模な実験は、最先端の競合相手に対するCEDOの頑健さを一貫して示している。
関連論文リスト
- Alignment as Distribution Learning: Your Preference Model is Explicitly a Language Model [12.063078727764045]
人間のフィードバックからの強化学習によるアライメントは理論的正当性に欠け、決定論的解のインセンティブを与える。
本稿では, 優先最大推定, 優先蒸留, 逆KL最小化の3つの基本学習目標を提案する。
我々は、我々の分布学習フレームワーク、特に嗜好蒸留が、RLHFとDPOのパフォーマンスを一貫して上回るか、あるいは一致しているかを実証的に示す。
論文 参考訳(メタデータ) (2025-06-02T10:36:31Z) - Unified Enhancement of the Generalization and Robustness of Language Models via Bi-Stage Optimization [2.502393972789905]
本稿では,LMの一般化とロバスト性の両方を均一に向上する二段階最適化フレームワークを提案する。
提案手法は,従来の手法と比較して,LMの一般化とロバスト性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2025-03-19T13:50:36Z) - Uncertainty-Penalized Direct Preference Optimization [52.387088396044206]
我々は、優先不確実性ペナル化スキームを導入し、DPOの悲観的な枠組みを開発する。
ペナル化は、不確実なサンプルの損失勾配を減衰させる損失の補正として機能する。
我々は,バニラDPOと比較して全体的な性能が向上し,高い不確実性選択/拒絶反応によるプロンプトの完成度も向上した。
論文 参考訳(メタデータ) (2024-10-26T14:24:37Z) - Debiased Multimodal Understanding for Human Language Sequences [14.434841446670726]
本研究では,非保守的共同創設者として働く被験者の影響を抑えるために,因果介入モジュールであるSuCIを提案する。
プラグアンドプレイコンポーネントとして、SuCIは偏見のない予測を求めるほとんどの方法に広く適用することができる。
論文 参考訳(メタデータ) (2024-03-08T04:03:54Z) - Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases [76.9127853906115]
拡散モデルと人間の嗜好のギャップを埋めることが、実用的生成への統合に不可欠である。
本稿では,拡散モデルの時間的帰納バイアスを利用したポリシー勾配アルゴリズムTDPO-Rを提案する。
実験の結果,報酬過小評価を緩和する手法が有効であることが示された。
論文 参考訳(メタデータ) (2024-02-13T15:55:41Z) - Causality and Independence Enhancement for Biased Node Classification [56.38828085943763]
各種グラフニューラルネットワーク(GNN)に適用可能な新しい因果性・独立性向上(CIE)フレームワークを提案する。
提案手法は,ノード表現レベルでの因果的特徴と突発的特徴を推定し,突発的相関の影響を緩和する。
我々のアプローチCIEは、GNNの性能を大幅に向上するだけでなく、最先端の debiased ノード分類法よりも優れています。
論文 参考訳(メタデータ) (2023-10-14T13:56:24Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。