Fugu-MT 論文翻訳(概要): Elucidating Mechanisms of Demographic Bias in LLMs for Healthcare

論文の概要: Elucidating Mechanisms of Demographic Bias in LLMs for Healthcare

arxiv url: http://arxiv.org/abs/2502.13319v1
Date: Tue, 18 Feb 2025 22:40:40 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-20 20:12:09.800151
Title: Elucidating Mechanisms of Demographic Bias in LLMs for Healthcare
Title（参考訳）: 医療用LDMにおけるデモグラフィックバイアスの解明メカニズム
Authors: Hiba Ahsan, Arnab Sen Sharma, Silvio Amir, David Bau, Byron C. Wallace,
Abstract要約: 性別情報は中層に高度に局所化されており、パッチを当てることで推論時に確実に操作できることがわかった。患者人種の表現は多少分散しているが、ある程度は介入することもできる。
参考スコア（独自算出の注目度）: 38.0169924254127
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We know from prior work that LLMs encode social biases, and that this manifests in clinical tasks. In this work we adopt tools from mechanistic interpretability to unveil sociodemographic representations and biases within LLMs in the context of healthcare. Specifically, we ask: Can we identify activations within LLMs that encode sociodemographic information (e.g., gender, race)? We find that gender information is highly localized in middle MLP layers and can be reliably manipulated at inference time via patching. Such interventions can surgically alter generated clinical vignettes for specific conditions, and also influence downstream clinical predictions which correlate with gender, e.g., patient risk of depression. We find that representation of patient race is somewhat more distributed, but can also be intervened upon, to a degree. To our knowledge, this is the first application of mechanistic interpretability methods to LLMs for healthcare.
Abstract（参考訳）: これまでの研究から、LSMが社会的偏見を符号化し、これが臨床タスクに現れることは分かっています。本研究では, 医療の文脈において, LLM内の社会デマグラフィー表現とバイアスを明らかにするために, 機械的解釈可能性のツールを採用する。社会デマログラフ情報(例えば、性別、人種)を符号化するLSM内のアクティベーションを特定できますか? 性別情報は中程度のMLP層で高度に局所化されており、パッチを当てることで推論時に確実に操作できることがわかった。このような介入は、特定の条件で生成された臨床ヴィグネットを外科的に変更することができ、また、うつ病患者のリスクなど、性別と相関する下流臨床予測に影響を及ぼす。患者人種の表現は多少分散しているが、ある程度は介入することもできる。我々の知る限り、これは医療用LLMへの機械的解釈可能性法の最初の応用である。

関連論文リスト

The MedPerturb Dataset: What Non-Content Perturbations Reveal About Human and Clinical LLM Decision Making [13.734312822024947]
臨床入力の制御摂動下での医療用大言語モデル(LLM)の評価を目的としたデータセットであるMedPerturbを紹介する。 MedPerturbでは、リアルな入力の可変性に基づく800の臨床的コンテキストのデータセットをリリースする。我々は、MedPerturbを2つのケーススタディに用いて、ジェンダーアイデンティティの手がかり、言語スタイル、フォーマットの変化が、人間とLLM間の治療選択のばらつきを反映しているかを明らかにする。
論文参考訳（メタデータ） (2025-06-20T17:09:27Z)
Investigating LLMs in Clinical Triage: Promising Capabilities, Persistent Intersectional Biases [6.135648377533492]
大規模言語モデル (LLM) は, 臨床診断支援において有望であるが, トライアージへの応用は未定である。救急部門トリアージにおけるLCMの能力について,2つの重要な側面を通して体系的に検討した。我々は、継続した事前学習からテキスト内学習、機械学習アプローチまで、複数のLCMベースのアプローチを評価した。
論文参考訳（メタデータ） (2025-04-22T21:11:47Z)
Explainable Depression Detection in Clinical Interviews with Personalized Retrieval-Augmented Generation [32.163466666512996]
うつ病は広範な精神疾患であり、臨床面接は評価のための金の基準である。現在のシステムは主にブラックボックスニューラルネットワークを使用し、解釈性に欠ける。本稿では,説明可能な抑うつ検出のための検索拡張フレームワークREDを提案する。
論文参考訳（メタデータ） (2025-03-03T08:59:34Z)
Fact or Guesswork? Evaluating Large Language Model's Medical Knowledge with Structured One-Hop Judgment [108.55277188617035]
大規模言語モデル(LLM)は、様々な下流タスクドメインで広く採用されているが、実際の医学的知識を直接呼び起こし適用する能力はいまだ探索されていない。既存の医療QAベンチマークの多くは、複雑な推論やマルチホップ推論を評価しており、LSM固有の医療知識を推論能力から切り離すことが困難である。 LLMの1ホップの医療知識を測定するために特別に設計されたデータセットであるMedical Knowledge Judgmentを紹介する。
論文参考訳（メタデータ） (2025-02-20T05:27:51Z)
Enhancing Patient-Centric Communication: Leveraging LLMs to Simulate Patient Perspectives [19.462374723301792]
大きな言語モデル(LLM)はロールプレイングのシナリオにおいて印象的な機能を示している。人間の行動を模倣することで、LLMは具体的な人口統計や専門的なプロファイルに基づいて反応を予測できる。多様な背景を持つ個人をシミュレーションする上でのLLMの有効性を評価し,これらのシミュレーション行動の一貫性を解析した。
論文参考訳（メタデータ） (2025-01-12T22:49:32Z)
How Can We Diagnose and Treat Bias in Large Language Models for Clinical Decision-Making? [2.7476176772825904]
本研究では,大規模言語モデル(LLM)におけるバイアスの評価と緩和について検討する。本稿では,JAMAクリニカルチャレンジから得られた新しいCPVデータセットについて紹介する。このデータセットを用いて、複数の選択質問(MCQ)とそれに対応する説明を併用し、バイアス評価のためのフレームワークを構築した。
論文参考訳（メタデータ） (2024-10-21T23:14:10Z)
Mitigating Hallucinations of Large Language Models in Medical Information Extraction via Contrastive Decoding [92.32881381717594]
医療情報抽出タスクにおける幻覚の問題を解決するために,ALCD(ALternate Contrastive Decoding)を導入する。 ALCDは, 従来の復号法に比べて幻覚の解消に有意な改善が見られた。
論文参考訳（メタデータ） (2024-10-21T07:19:19Z)
Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。 VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-29T23:19:28Z)
Can AI Relate: Testing Large Language Model Response for Mental Health Support [23.97212082563385]
大型言語モデル(LLM)はすでにニューヨーク・ラングーン、ダナ・ファーバー、NHSなどの病院システムで臨床使用のために試験されている。精神医療の自動化に向けて, LLM 反応が有効かつ倫理的な道筋であるか否かを評価するための評価枠組みを開発する。
論文参考訳（メタデータ） (2024-05-20T13:42:27Z)
Tokenization Matters: Navigating Data-Scarce Tokenization for Gender Inclusive Language Technologies [75.85462924188076]
ジェンダー非包括的NLP研究は、ジェンダーバイナリ中心大言語モデル(LLM)の有害な制限を文書化している。誤認識はByte-Pair(BPE)トークン化によって大きく影響されている。本研究では,(1)代名詞の代名詞化パリティ,(2)代名詞間の一貫した代名詞化を強制する手法,および(2)既存のLLM代名詞の知識を活用して新代名詞の習熟度を向上させる手法を提案する。
論文参考訳（メタデータ） (2023-12-19T01:28:46Z)
Redefining Digital Health Interfaces with Large Language Models [69.02059202720073]
大規模言語モデル(LLM)は、複雑な情報を処理できる汎用モデルとして登場した。 LLMが臨床医とデジタル技術との新たなインターフェースを提供する方法を示す。自動機械学習を用いた新しい予後ツールを開発した。
論文参考訳（メタデータ） (2023-10-05T14:18:40Z)
Don't Ignore Dual Logic Ability of LLMs while Privatizing: A Data-Intensive Analysis in Medical Domain [19.46334739319516]
本研究では, LLMの二重論理能力が, 医療領域の民営化過程における影響について検討した。以上の結果から,LLMに汎用ドメイン二重論理データを組み込むことによって,LLMの二重論理能力が向上するだけでなく,精度も向上することが示唆された。
論文参考訳（メタデータ） (2023-09-08T08:20:46Z)
Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文参考訳（メタデータ） (2023-05-30T22:05:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。