Fugu-MT 論文翻訳(概要): BiasICL: In-Context Learning and Demographic Biases of Vision Language Models

論文の概要: BiasICL: In-Context Learning and Demographic Biases of Vision Language Models

arxiv url: http://arxiv.org/abs/2503.02334v1
Date: Tue, 04 Mar 2025 06:45:54 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-05 18:50:39.203792
Title: BiasICL: In-Context Learning and Demographic Biases of Vision Language Models
Title（参考訳）: BiasICL:視覚言語モデルのインコンテキスト学習とデモグラフィックバイアス
Authors: Sonnet Xu, Joseph Janizek, Yixing Jiang, Roxana Daneshjou,
Abstract要約: 視覚言語モデル (VLM) は, 診断において有望であるが, テキスト内学習 (ICL) を用いた場合の集団間パフォーマンスはいまだによく分かっていない。胸部X線写真からの皮膚病変の悪性度予測と気胸検出の2つの医療画像課題において, 実演例の人口構成がVLMパフォーマンスに与える影響について検討した。
参考スコア（独自算出の注目度）: 0.7499722271664147
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Vision language models (VLMs) show promise in medical diagnosis, but their performance across demographic subgroups when using in-context learning (ICL) remains poorly understood. We examine how the demographic composition of demonstration examples affects VLM performance in two medical imaging tasks: skin lesion malignancy prediction and pneumothorax detection from chest radiographs. Our analysis reveals that ICL influences model predictions through multiple mechanisms: (1) ICL allows VLMs to learn subgroup-specific disease base rates from prompts and (2) ICL leads VLMs to make predictions that perform differently across demographic groups, even after controlling for subgroup-specific disease base rates. Our empirical results inform best-practices for prompting current VLMs (specifically examining demographic subgroup performance, and matching base rates of labels to target distribution at a bulk level and within subgroups), while also suggesting next steps for improving our theoretical understanding of these models.
Abstract（参考訳）: 視覚言語モデル (VLM) は, 診断において有望であるが, テキスト内学習 (ICL) を用いた場合の集団間パフォーマンスはいまだによく分かっていない。胸部X線写真からの皮膚病変の悪性度予測と気胸検出の2つの医療画像課題において, 実演例の人口構成がVLMパフォーマンスに与える影響について検討した。 ICLはサブグループ固有の疾患ベースレートをプロンプトから学習し,(2)ICLはサブグループ固有の疾患ベースレートを制御した後でも,人口集団間で異なるパフォーマンスの予測を行う。実験結果から,現在のVLM(特に人口動態的サブグループのパフォーマンス,およびラベルのベースレートを,バルクレベルで,サブグループ内での分布に合わせること)の促進のためのベストプラクティスを示唆するとともに,これらのモデルの理論的理解を改善するための次のステップを提案する。

関連論文リスト

An MLI-Guided Framework for Subgroup-Aware Modeling in Electronic Health Records (AdaptHetero) [0.18416014644193068]
AdaptHeteroは、解釈可能性の洞察を実行可能なガイダンスに変換する、新しいMLI駆動のフレームワークである。 AdaptHeteroは、ICU死亡率、院内死亡率、隠された低酸素症を予測するための不均一なモデル挙動を一貫して明らかにしている。
論文参考訳（メタデータ） (2025-07-28T04:37:03Z)
One Size Fits None: Rethinking Fairness in Medical AI [7.163867603298375]
現実の医療データセットは、しばしばうるさい、不完全、不均衡である。差異はフェアネスの懸念を生じさせ、特にマージン化グループに対する既存の不利を補強する場合に顕著である。
論文参考訳（メタデータ） (2025-06-17T10:59:02Z)
Investigating LLMs in Clinical Triage: Promising Capabilities, Persistent Intersectional Biases [6.135648377533492]
大規模言語モデル (LLM) は, 臨床診断支援において有望であるが, トライアージへの応用は未定である。救急部門トリアージにおけるLCMの能力について,2つの重要な側面を通して体系的に検討した。我々は、継続した事前学習からテキスト内学習、機械学習アプローチまで、複数のLCMベースのアプローチを評価した。
論文参考訳（メタデータ） (2025-04-22T21:11:47Z)
Estimating Commonsense Plausibility through Semantic Shifts [66.06254418551737]
セマンティックシフトを測定することでコモンセンスの妥当性を定量化する新しい識別フレームワークであるComPaSSを提案する。 2種類の細粒度コモンセンス可視性評価タスクの評価は,ComPaSSが一貫してベースラインを上回っていることを示している。
論文参考訳（メタデータ） (2025-02-19T06:31:06Z)
DiversityMedQA: Assessing Demographic Biases in Medical Diagnosis using Large Language Models [2.750784330885499]
DiversityMedQAは,多彩な患者集団にわたる医療クエリに対する大規模言語モデル(LLM)応答を評価するために設計された,新しいベンチマークである。以上の結果から,これらの変動に比較して,モデル性能に顕著な差が認められた。
論文参考訳（メタデータ） (2024-09-02T23:37:20Z)
Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。 VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-29T23:19:28Z)
Cross-Care: Assessing the Healthcare Implications of Pre-training Data on Language Model Bias [3.455189439319919]
大規模な言語モデル(LLM)におけるバイアスと実世界の知識を評価するための最初のベンチマークフレームワークであるCross-Careを紹介する。 ThePile$のような事前学習コーパスに埋め込まれた人口統計バイアスがLLMの出力にどのように影響するかを評価する。以上の結果から, LLMの病状有病率と, 集団間での実際の病状有病率との相違が明らかとなった。
論文参考訳（メタデータ） (2024-05-09T02:33:14Z)
SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models [54.32264601568605]
SkinGENは、VLMが提供する診断結果から参照デモを生成する、診断から生成までのフレームワークである。システム性能と説明可能性の両方を評価するために,32人の参加者によるユーザスタディを実施している。その結果、SkinGENはVLM予測に対するユーザの理解を著しく改善し、診断プロセスへの信頼を高めることが示されている。
論文参考訳（メタデータ） (2024-04-23T05:36:33Z)
FairCLIP: Harnessing Fairness in Vision-Language Learning [20.743027598445796]
本稿では, 詳細な統計属性, 基盤ラベル, 臨床ノートを提供する, 視覚言語医学データセットについて紹介する。この種の医療データセットとしては初めての公正なビジョン言語として、HarvardFairMedは、意識的かつ臨床的に有効な機械学習モデルの開発を触媒する可能性を秘めている。
論文参考訳（メタデータ） (2024-03-29T03:15:31Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Auditing Algorithmic Fairness in Machine Learning for Health with Severity-Based LOGAN [70.76142503046782]
臨床予測タスクにおいて,局所バイアスを自動検出するSLOGANを用いて,機械学習ベースの医療ツールを補足することを提案する。 LOGANは、患者の重症度と過去の医療史における集団バイアス検出を文脈化することにより、既存のツールであるLOcal Group biAs detectioNに適応する。 SLOGANは, クラスタリング品質を維持しながら, 患者群の75%以上において, SLOGANよりも高い公平性を示す。
論文参考訳（メタデータ） (2022-11-16T08:04:12Z)
Assessing Social Determinants-Related Performance Bias of Machine Learning Models: A case of Hyperchloremia Prediction in ICU Population [6.8473641147443995]
高塩素血症を予測するために構築された4つの分類器について検討した。実験室をベースとした機能に加え, 社会的決定因子の付加は, 全患者のモデル性能を向上することがわかった。我々は将来の研究者に、潜在的なバイアスを積極的に調整し、サブグループレポートを含むモデルを設計するよう促す。
論文参考訳（メタデータ） (2021-11-18T03:58:50Z)
Adversarial Sample Enhanced Domain Adaptation: A Case Study on Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。逆生成したサンプルはドメイン適応時に使用される。その結果,本手法の有効性とタスクの一般性が確認された。
論文参考訳（メタデータ） (2021-01-13T03:20:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。