論文の概要: DUCX: Decomposing Unfairness in Tool-Using Chest X-ray Agents
- arxiv url: http://arxiv.org/abs/2603.00777v1
- Date: Sat, 28 Feb 2026 18:46:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.357619
- Title: DUCX: Decomposing Unfairness in Tool-Using Chest X-ray Agents
- Title(参考訳): DUCX: ツールを用いた胸部X線剤の不均一性の分解
- Authors: Zikang Xu, Ruinan Jin, Xiaoxiao Li,
- Abstract要約: ツールを用いた医療エージェントは、特殊な視覚と言語モジュールを編成することにより、胸部X線質問応答を改善することができる。
MedRAXを用いた胸部X線剤の系統的評価を行った。
- 参考スコア(独自算出の注目度): 35.69412546569078
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tool-using medical agents can improve chest X-ray question answering by orchestrating specialized vision and language modules, but this added pipeline complexity also creates new pathways for demographic bias beyond standalone models. We present ours (Decomposing Unfairness in Chest X-ray agents), a systematic audit of chest X-ray agents instantiated with MedRAX. To localize where disparities arise, we introduce a stage-wise fairness decomposition that separates end-to-end bias from three agent-specific sources: tool exposure bias (utility gaps conditioned on tool presence), tool transition bias (subgroup differences in tool-routing patterns), and model reasoning bias (subgroup differences in synthesis behaviors). Extensive experiments on tool-used based agentic frameworks across five driver backbones reveal that (i) demographic gaps persist in end-to-end performance, with equalized odds up to 20.79%, and the lowest fairness-utility tradeoff down to 28.65%, and (ii) intermediate behaviors, tool usage, transition patterns, and reasoning traces exhibit distinct subgroup disparities that are not predictable from end-to-end evaluation alone (e.g., conditioned on segmentation-tool availability, the subgroup utility gap reaches as high as 50%). Our findings underscore the need for process-level fairness auditing and debiasing to ensure the equitable deployment of clinical agentic systems. Code is available here: https://anonymous.4open.science/r/DUCK-E5FE/README.md
- Abstract(参考訳): ツールを使用する医療エージェントは、特殊な視覚と言語モジュールを編成することで胸部X線質問応答を改善することができる。
MedRAXを用いた胸部X線剤の系統的評価を行った。
そこで我々は,ツール露出バイアス(ツール存在に条件づけられたユーティリティギャップ),ツール遷移バイアス(ツールルーティングパターンのサブグループ差),モデル推論バイアス(合成行動のサブグループ差)という3つのエージェント固有のソースから,エンドツーエンドのバイアスを分離するステージワイズフェアネス分解を導入する。
5つのドライバーバックボーンにまたがるツール使用型エージェントフレームワークの大規模な実験
(i)人口格差はエンド・ツー・エンドのパフォーマンスにおいて持続し、等化確率は20.79%、フェアネス・ユーティリティ・トレードオフは28.65%まで低下する。
(II)中間動作,ツール使用,遷移パターン,および推論トレースは,エンドツーエンド評価だけでは予測できない部分群差を示す(例えば,セグメンテーション・ツールの可用性を条件とした場合,サブグループのユーティリティギャップは50%に達する)。
臨床薬品システムの均等な展開を確保するため, プロセスレベルの公正度監査とデバイアスの必要性が示唆された。
コードはここで入手できる。 https://anonymous.4open.science/r/DUCK-E5FE/README.md
関連論文リスト
- Developing Fairness-Aware Task Decomposition to Improve Equity in Post-Spinal Fusion Complication Prediction [3.860970992977915]
術後合併症予測のための公平性を考慮したマルチタスク学習フレームワークを提案する。
FAIR-MTLはデータ駆動型サブグループ推論機構を採用している。
AUCは0.86であり、75%の精度でシングルタスクベースラインを上回り、バイアスを大幅に低減する。
論文 参考訳(メタデータ) (2025-11-29T19:06:07Z) - CXRAgent: Director-Orchestrated Multi-Stage Reasoning for Chest X-Ray Interpretation [62.0150409256153]
我々は、CXR解釈のためのディレクター調整型多段階エージェントであるCXRAgentを提案する。
エージェントは、Evidence-driven Validatorによって正規化され検証された出力を持つ一連のCXR分析ツールを戦略的にオーケストレーションする。
様々なCXR解釈タスクの実験は、CXRAgentが強いパフォーマンスを示し、視覚的証拠を提供し、異なる複雑さの臨床的タスクにうまく一般化していることを示している。
論文 参考訳(メタデータ) (2025-10-24T10:31:30Z) - From Detection to Mitigation: Addressing Bias in Deep Learning Models for Chest X-Ray Diagnosis [3.9236980712240217]
胸部X線で診断を行う際に,性別,年齢,人種による格差を対象とする包括的バイアス検出・緩和フレームワークを提案する。
我々は,CNNの最終層をeXtreme Gradient Boosting分類器に置き換えることで,全体の予測性能を維持したり改善したりしながら,サブグループの公平性を向上させることを示す。
さらに,この軽量なアダプタトレーニング手法と,対角訓練,再重み付け,データ強化,アクティブラーニングなどの従来のフルモデル学習バイアス軽減手法を比較し,本手法が計算コストのごく一部で競争力あるいは優れたバイアス低減を提供することを示した。
論文 参考訳(メタデータ) (2025-10-12T22:20:08Z) - Using Backbone Foundation Model for Evaluating Fairness in Chest Radiography Without Demographic Data [2.7436483977171333]
本研究の目的は,基礎モデルのバックボーンを埋め込み抽出器として用いることの有効性を検討することである。
我々は,これらのグループを,前処理,内処理,評価など,様々な段階のバイアス軽減に活用することを提案する。
論文 参考訳(メタデータ) (2024-08-28T20:35:38Z) - (Predictable) Performance Bias in Unsupervised Anomaly Detection [3.826262429926079]
教師なし異常検出(UAD)モデルは、疾患検出の重要な第1ステップを支援することを約束する。
本研究は, ある集団群に対して, UADモデルの異なる性能を定量的に評価した。
論文 参考訳(メタデータ) (2023-09-25T14:57:43Z) - The Role of Subgroup Separability in Group-Fair Medical Image
Classification [18.29079361470428]
診断などの系統的バイアスを伴うデータを用いて, サブグループ分離性, サブグループ分離性, 性能劣化の関係について検討した。
私たちの発見は、モデルがどのように偏見を抱くかという問題に新たな光を当て、公正な医療画像AIの開発に重要な洞察を与えました。
論文 参考訳(メタデータ) (2023-07-06T06:06:47Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Chest x-ray automated triage: a semiologic approach designed for
clinical implementation, exploiting different types of labels through a
combination of four Deep Learning architectures [83.48996461770017]
本研究では,異なる畳み込みアーキテクチャの後期融合に基づく深層学習手法を提案する。
公開胸部x線画像と機関アーカイブを組み合わせたトレーニングデータセットを4つ構築した。
4つの異なるディープラーニングアーキテクチャをトレーニングし、それらのアウトプットとレイトフュージョン戦略を組み合わせることで、統一されたツールを得ました。
論文 参考訳(メタデータ) (2020-12-23T14:38:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。