論文の概要: FAIR_XAI: Improving Multimodal Foundation Model Fairness via Explainability for Wellbeing Assessment
- arxiv url: http://arxiv.org/abs/2604.23786v1
- Date: Sun, 26 Apr 2026 16:22:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.548381
- Title: FAIR_XAI: Improving Multimodal Foundation Model Fairness via Explainability for Wellbeing Assessment
- Title(参考訳): FAIR_XAI: ウェルビーイング評価のための説明可能性によるマルチモーダルファンデーションモデルフェアネスの改善
- Authors: Sophie Chiang, Tom Brennan, Fethiye Irmak Dogan, Jiaee Cheong, Hatice Gunes,
- Abstract要約: 本研究では、幸福度評価と抑うつ予測のための視覚言語モデル(VLM)について検討する。
我々のXAI介入の枠組みは,Qwen2-VLと同等の機会を得た。
結果は、手続き的透明性と公平な結果の間に持続的なギャップを浮き彫りにする。
- 参考スコア(独自算出の注目度): 8.394205333688165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the integration of multimodal machine learning in wellbeing assessment has offered transformative potential for monitoring mental health. However, with the rapid advancement of Vision-Language Models (VLMs), their deployment in clinical settings has raised concerns due to their lack of transparency and potential for bias. While previous research has explored the intersection of fairness and Explainable AI (XAI), its application to VLMs for wellbeing assessment and depression prediction remains under-explored. This work investigates VLM performance across laboratory (AFAR-BSFT) and naturalistic (E-DAIC) datasets, focusing on diagnostic reliability and demographic fairness. Performance varied substantially across environments and architectures; Phi3.5-Vision achieved 80.4% accuracy on E-DAIC, while Qwen2-VL struggled at 33.9%. Additionally, both models demonstrated a tendency to over-predict depression on AFAR-BSFT. Although bias existed across both architectures, Qwen2-VL showed higher gender disparities, while Phi-3.5-Vision exhibited more racial bias. Our XAI intervention framework yielded mixed results; fairness prompting achieved perfect equal opportunity for Qwen2-VL at a severe accuracy cost on E-DAIC. On AFAR-BSFT, explainability-based interventions improved procedural consistency but did not guarantee outcome fairness, sometimes amplifying racial bias. These results highlight a persistent gap between procedural transparency and equitable outcomes. We analyse these findings and consolidate concrete recommendations for addressing them, emphasising that future fairness interventions must jointly optimise predictive accuracy, demographic parity, and cross-domain generalisation.
- Abstract(参考訳): 近年、マルチモーダル機械学習の健康評価への統合は、メンタルヘルスのモニタリングに変革をもたらす可能性がある。
しかし、VLM(Vision-Language Models)の急速な進歩に伴い、それらの臨床環境への展開は透明性の欠如とバイアスの可能性が懸念されている。
これまでの研究では、フェアネスと説明可能なAI(XAI)の交差点を探索してきたが、ウェルビーイング評価やうつ病予測のためのVLMへの応用はまだ検討されていない。
本研究では,実験室間(AFAR-BSFT)と自然主義的(E-DAIC)データセット間のVLM性能について検討し,診断信頼性と人口統計学的公正性に着目した。
Phi3.5-VisionはE-DAICで80.4%、Qwen2-VLは33.9%の精度で性能が向上した。
さらに、両モデルともAFAR-BSFTではうつ病を過度に予測する傾向を示した。
Qwen2-VLは男女差が高く、Phi-3.5-Visionはより人種バイアスを示した。
我々のXAI介入の枠組みは,E-DAICの高精度な精度でQwen2-VLと同等の機会を得ることができた。
AFAR-BSFTでは、説明可能性に基づく介入は手続き的一貫性を改善したが、結果の公平性を保証せず、時には人種的偏見を増幅した。
これらの結果は、手続き的透明性と公平な結果の間に持続的なギャップを浮き彫りにする。
これらの知見を分析し,今後の公正な介入は予測精度,人口比率,ドメイン間の一般化を共同で最適化する必要があることを強調して,具体的な推奨事項を整理する。
関連論文リスト
- Can Vision Language Models Judge Action Quality? An Empirical Evaluation [5.688409551177917]
アクション・クオリティ・アセスメント(AQA)は、理学療法、スポーツコーチング、競争力判定に広く応用されている。
Vision Language Models (VLM) は AQA に対してかなりの保証を持っているが、この領域における実際のパフォーマンスは、ほとんど役に立たないままである。
本稿では,活動領域(例えば,フィットネス,フィギュアスケート,ダイビング,タスク,表現,促進戦略)における最先端VLMの総合評価について述べる。
論文 参考訳(メタデータ) (2026-04-09T14:29:19Z) - Medical Imaging AI Competitions Lack Fairness [50.895929923643905]
課題データセットが現実の臨床的多様性を代表するものなのか、FAIR原則に従ってアクセス可能で法的に再利用可能なものなのか、という2つの相補的な側面に沿って公正性を評価する。
本研究の結果は, 地理的位置, モダリティ, 問題型関連バイアスなどのデータセット構成に有意な偏りがみられ, 現在のベンチマークは実世界の臨床多様性を十分に反映していないことが示唆された。
これらの欠点は、ベンチマークエコシステムの基本的な制限を明らかにし、リーダボードの成功と臨床関連性との間の断絶を浮き彫りにします。
論文 参考訳(メタデータ) (2025-12-19T13:48:10Z) - Reliable and Reproducible Demographic Inference for Fairness in Face Analysis [63.46525489354455]
本稿では、従来のエンドツーエンドトレーニングをモジュラートランスファー学習アプローチで置き換える、完全に再現可能なDAIパイプラインを提案する。
このパイプラインは、正確性、公正性、そしてアイデンティティ内整合性によって定義される、新たに導入された堅牢性の概念の3つの次元にわたって監査する。
以上の結果から,提案手法は特に民族性において,強い基準線を上回り,その特性はより困難であることが示唆された。
論文 参考訳(メタデータ) (2025-10-23T12:22:02Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Toward Fair Federated Learning under Demographic Disparities and Data Imbalance [8.444310568786408]
フェデレートラーニング(Federated Learning, FL)は、機関間のプライバシー保護コラボレーションを可能にする。
フェアネスを意識した正規化とグループ条件オーバサンプリングを組み合わせたフレームワークに依存しないFedIDAを提案する。
FedIDAは、競争力のある予測性能を維持しながら、常に公正性を向上することを示す。
論文 参考訳(メタデータ) (2025-05-14T11:22:54Z) - Balancing Fairness and Performance in Healthcare AI: A Gradient Reconciliation Approach [3.997371369137763]
明示的な公平性を考慮せずにデプロイされたAIシステムは、既存の医療格差を悪化させるリスクを負う。
予測性能とマルチ属性フェアネス最適化のバランスをとる新しい勾配調整フレームワークであるFairGradを提案する。
論文 参考訳(メタデータ) (2025-04-19T19:24:34Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Equal Opportunity of Coverage in Fair Regression [50.76908018786335]
我々は、予測の不確実性の下で公正な機械学習(ML)を研究し、信頼性と信頼性のある意思決定を可能にする。
本研究は,(1)類似した結果の異なる集団に対するカバー率が近いこと,(2)人口全体のカバー率が一定水準にあること,の2つの特性を達成することを目的としたカバーの平等機会(EOC)を提案する。
論文 参考訳(メタデータ) (2023-11-03T21:19:59Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - FERI: A Multitask-based Fairness Achieving Algorithm with Applications to Fair Organ Transplantation [15.481475313958219]
本研究は, 肝移植患者の移植失敗リスクの公平な予測のために, Equitable Rate of Improvement in Multitask Learning (FERI) アルゴリズムを用いてフェアネスを紹介する。
FERIは、学習率のバランスとトレーニングプロセスにおけるサブグループ支配の防止により、サブグループ損失を抑える。
論文 参考訳(メタデータ) (2023-10-20T21:14:07Z) - Fairness-enhancing mixed effects deep learning improves fairness on in- and out-of-distribution clustered (non-iid) data [6.596656267996196]
フェア・ミックスド・エフェクト・ディープ・ラーニング(Fair MEDL)フレームワークを提案する。
本フレームワークは,1)不変なFEを学習するためのクラスタ逆効果,2)REのためのベイズニューラルネットワーク,3)最終的な予測のためにFEとREを組み合わせた混合関数,を通じて,クラスタ不変な固定効果(FE)とクラスタ固有ランダムエフェクト(RE)を定量化する。
公正なMEDLフレームワークは、年齢で86.4%、人種で64.9%、性で57.8%、結婚で36.2%の公正性を向上し、堅牢な予測性能を維持している。
論文 参考訳(メタデータ) (2023-10-04T20:18:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。