論文の概要: Addressing Bias in VLMs for Glaucoma Detection Without Protected Attribute Supervision
- arxiv url: http://arxiv.org/abs/2508.09087v1
- Date: Tue, 12 Aug 2025 17:07:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.517057
- Title: Addressing Bias in VLMs for Glaucoma Detection Without Protected Attribute Supervision
- Title(参考訳): 緑内障検診におけるVLMのアドレスバイアスの検討
- Authors: Ahsan Habib Akash, Greg Murray, Annahita Amireskandari, Joel Palko, Carol Laxson, Binod Bhattarai, Prashnna Gyawali,
- Abstract要約: 本研究は網膜基底画像からの緑内障の自動スクリーニングに焦点を当てた。
画像-画像埋め込みの教師なしクラスタリングを通じてプロキシサブグループを推論する属性非依存型デバイアス手法を提案する。
EOD (Equalized Odds Distance)、ES AUC (Equalized Subgroup AUC)、グループワイズAUC (Groupwise AUC) を報告し, 以下の結果を得た。
- 参考スコア(独自算出の注目度): 6.381985108365988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-Language Models (VLMs) have achieved remarkable success on multimodal tasks such as image-text retrieval and zero-shot classification, yet they can exhibit demographic biases even when explicit protected attributes are absent during training. In this work, we focus on automated glaucoma screening from retinal fundus images, a critical application given that glaucoma is a leading cause of irreversible blindness and disproportionately affects underserved populations. Building on a reweighting-based contrastive learning framework, we introduce an attribute-agnostic debiasing method that (i) infers proxy subgroups via unsupervised clustering of image-image embeddings, (ii) computes gradient-similarity weights between the CLIP-style multimodal loss and a SimCLR-style image-pair contrastive loss, and (iii) applies these weights in a joint, top-$k$ weighted objective to upweight underperforming clusters. This label-free approach adaptively targets the hardest examples, thereby reducing subgroup disparities. We evaluate our method on the Harvard FairVLMed glaucoma subset, reporting Equalized Odds Distance (EOD), Equalized Subgroup AUC (ES AUC), and Groupwise AUC to demonstrate equitable performance across inferred demographic subgroups.
- Abstract(参考訳): VLM(Vision-Language Models)は、画像テキスト検索やゼロショット分類などのマルチモーダルタスクにおいて顕著な成功を収めている。
本研究は,緑内障が非可逆性失明の原因であり,不均等に人口に影響を及ぼすことを考えると,網膜基底像からの自動緑内障検診に焦点をあてる。
重み付けに基づくコントラスト学習フレームワーク上に構築し,属性に依存しないデバイアス法を導入する。
(i)イメージイメージ埋め込みの教師なしクラスタリングを通じてプロキシサブグループを推論する。
(II)CLIP型マルチモーダル損失とSimCLR型イメージペアコントラスト損失との勾配類似度重みを計算し、
(iii) これらの重みは、重み付けされた高額な重み付け目標を、重み付けの低いクラスターに当てはめる。
このラベルなしのアプローチは、最も難しい例を適応的に対象とし、したがって部分群格差を減少させる。
EOD (Equalized Odds Distance)、ES AUC (Equalized Subgroup AUC)、グループワイズAUC (Groupwise AUC) を報告し, 以下の結果を得た。
関連論文リスト
- ScoreAdv: Score-based Targeted Generation of Natural Adversarial Examples via Diffusion Models [7.250878248686215]
本稿では,ScoreAdvという拡散モデルに基づく逆例を生成する新しい手法を提案する。
本手法は, 無限個の自然逆例を生成でき, 分類モデルだけでなく, 検索モデルも攻撃できる。
以上の結果から,ScoreAdvは最先端の攻撃成功率と画像品質を達成できることが示された。
論文 参考訳(メタデータ) (2025-07-08T15:17:24Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - Cluster-aware Contrastive Learning for Unsupervised Out-of-distribution
Detection [0.0]
教師なしアウト・オブ・ディストリビューション(OOD)検出は、ラベル情報なしでトレーニングデータの分布外に落下するサンプルを分離することを目的としている。
本稿では,インスタンスレベルの情報と意味レベルの情報の両方を考慮した,教師なしOOD検出のためのクラスタ対応コントラスト学習(CCL)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-06T07:21:03Z) - GraVIS: Grouping Augmented Views from Independent Sources for
Dermatology Analysis [52.04899592688968]
皮膚科画像から自己教師付き特徴を学習するために特に最適化されたGraVISを提案する。
GraVISは、病変のセグメンテーションと疾患分類のタスクにおいて、転送学習と自己教師型学習を著しく上回っている。
論文 参考訳(メタデータ) (2023-01-11T11:38:37Z) - Unsupervised Visual Representation Learning by Synchronous Momentum
Grouping [47.48803765951601]
ImageNet上のグループレベルのコントラスト型視覚表現学習法は,バニラ教師あり学習を超越している。
我々は、SMoGが現在のSOTA教師なし表現学習法を超越したことを示すために、徹底的な実験を行う。
論文 参考訳(メタデータ) (2022-07-13T13:04:15Z) - CLAWS: Contrastive Learning with hard Attention and Weak Supervision [1.1619569706231647]
本稿では,大規模農業データセットを手動でラベル付けする問題に対処する,アノテーション効率のよい学習フレームワークであるCLAWSを提案する。
CLAWSは、SimCLRにインスパイアされたネットワークバックボーンを使用して、クラスクラスタ内のコントラスト学習の影響を調べる。
本研究は,11種類の作物群からなる227,060検体を用いて,教師付きSimCLRとCLAWSの比較を行った。
論文 参考訳(メタデータ) (2021-12-01T21:45:58Z) - Ortho-Shot: Low Displacement Rank Regularization with Data Augmentation
for Few-Shot Learning [23.465747123791772]
少数の分類において、第一の目的は、新しいクラスをうまく一般化する表現を学ぶことである。
オルソショット(Ortho-Shot)と呼ばれる効率的な低変位ランク(LDR)正規化戦略を提案する。
論文 参考訳(メタデータ) (2021-10-18T14:58:36Z) - Solving Inefficiency of Self-supervised Representation Learning [87.30876679780532]
既存のコントラスト学習法は、非常に低い学習効率に苦しむ。
アンダークラスタリングとオーバークラスタリングの問題は、学習効率の大きな障害である。
中央三重項損失を用いた新しい自己監督学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-18T07:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。