論文の概要: Q-Pain: A Question Answering Dataset to Measure Social Bias in Pain
Management
- arxiv url: http://arxiv.org/abs/2108.01764v1
- Date: Tue, 3 Aug 2021 21:55:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-06 00:22:40.970184
- Title: Q-Pain: A Question Answering Dataset to Measure Social Bias in Pain
Management
- Title(参考訳): Q-Pain: 痛み管理における社会的バイアス測定データセット
- Authors: C\'ecile Log\'e, Emily Ross, David Yaw Amoah Dadey, Saahil Jain,
Adriel Saporta, Andrew Y. Ng, Pranav Rajpurkar
- Abstract要約: 痛み管理の文脈におけるQAのバイアスを評価するためのデータセットであるQ-Painを紹介する。
本稿では, 治療決定の際に生じる潜在的なバイアスを測定するための, 実験設計のサンプルを含む, 厳密な新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.044336341666555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in Natural Language Processing (NLP), and specifically
automated Question Answering (QA) systems, have demonstrated both impressive
linguistic fluency and a pernicious tendency to reflect social biases. In this
study, we introduce Q-Pain, a dataset for assessing bias in medical QA in the
context of pain management, one of the most challenging forms of clinical
decision-making. Along with the dataset, we propose a new, rigorous framework,
including a sample experimental design, to measure the potential biases present
when making treatment decisions. We demonstrate its use by assessing two
reference Question-Answering systems, GPT-2 and GPT-3, and find statistically
significant differences in treatment between intersectional race-gender
subgroups, thus reaffirming the risks posed by AI in medical settings, and the
need for datasets like ours to ensure safety before medical AI applications are
deployed.
- Abstract(参考訳): 近年の自然言語処理(NLP)や,特に自動質問応答システム(QA)の進歩は,印象的な言語拡散と社会的偏見を反映する悪習の両方を示している。
そこで本研究では,Q-Painについて紹介する。Q-PainはQAのバイアスを評価するためのデータセットであり,Q-Painは臨床意思決定において最も困難である。
データセットとともに、治療決定を行う際の潜在的なバイアスを測定するために、サンプル実験設計を含む新しい厳格なフレームワークを提案する。
2つの基準質問応答システムであるGPT-2とGPT-3を評価し、交差するレースジェンダーサブグループ間の治療における統計的に有意な差異を見出した結果、医療環境におけるAIによるリスクを再確認し、医療用AIアプリケーションがデプロイされる前に、我々のようなデータセットが安全であることを確認した。
関連論文リスト
- RealMedQA: A pilot biomedical question answering dataset containing realistic clinical questions [3.182594503527438]
本稿では,人間とLLMが生み出す現実的な臨床質問のデータセットであるRealMedQAを紹介する。
LLMは「理想的な」QAペアを生成するのに、よりコスト効率が高いことを示す。
論文 参考訳(メタデータ) (2024-08-16T09:32:43Z) - Word-Sequence Entropy: Towards Uncertainty Estimation in Free-Form Medical Question Answering Applications and Beyond [52.246494389096654]
本稿ではワードシーケンスエントロピー(WSE)を紹介し,単語レベルとシーケンスレベルの不確実性を校正する手法を提案する。
We compare WSE with six baseline method on five free-form medical QA datasets, using 7 popular large language model (LLMs)。
論文 参考訳(メタデータ) (2024-02-22T03:46:08Z) - XAIQA: Explainer-Based Data Augmentation for Extractive Question
Answering [1.1867812760085572]
我々は,電子カルテで自然に利用可能なデータから,合成QAペアを大規模に生成するための新しいアプローチであるXAIQAを紹介する。
本手法は、分類モデル説明器の考え方を用いて、医療規範に対応する医療概念に関する質問や回答を生成する。
論文 参考訳(メタデータ) (2023-12-06T15:59:06Z) - An AI-Guided Data Centric Strategy to Detect and Mitigate Biases in
Healthcare Datasets [32.25265709333831]
我々は、小さなサンプルサイズ(AEquity)で異なるグループをいかに容易に学習するかを調査することによって、データセットバイアスを評価するために、データ中心、モデルに依存しないタスク非依存のアプローチを生成する。
次に、サブポピュレーション全体にわたるAEq値の体系的分析を適用し、医療における2つの既知の事例において、人種的偏見の特定と顕在化を図った。
AEqは、医療データセットのバイアスを診断し、修正することで、エクイティの前進に適用できる、新しく広く適用可能なメトリクスである。
論文 参考訳(メタデータ) (2023-11-06T17:08:41Z) - Adaptive questionnaires for facilitating patient data entry in clinical
decision support systems: Methods and application to STOPP/START v2 [1.8374319565577155]
本稿では,適応型アンケートを用いて患者データ入力を簡略化する独自のソリューションを提案する。
ルールに基づく意思決定支援システムを考えると,臨床ルールを表示規則に翻訳する手法を考案した。
アンケート調査の結果, 臨床症状の約3分の2減らすことができることがわかった。
論文 参考訳(メタデータ) (2023-09-19T07:59:13Z) - Informing clinical assessment by contextualizing post-hoc explanations
of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。
我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。
本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文 参考訳(メタデータ) (2023-02-11T18:07:11Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Interpretable Multi-Step Reasoning with Knowledge Extraction on Complex
Healthcare Question Answering [89.76059961309453]
HeadQAデータセットには、公衆医療専門試験で認可された複数の選択質問が含まれている。
これらの質問は、現在のQAシステムにとって最も難しいものです。
知識抽出フレームワーク(MurKe)を用いた多段階推論を提案する。
市販の事前訓練モデルを完全に活用しようと努力しています。
論文 参考訳(メタデータ) (2020-08-06T02:47:46Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Towards Causality-Aware Inferring: A Sequential Discriminative Approach
for Medical Diagnosis [142.90770786804507]
医学診断アシスタント(MDA)は、疾患を識別するための症状を逐次調査する対話型診断エージェントを構築することを目的としている。
この研究は、因果図を利用して、MDAにおけるこれらの重要な問題に対処しようとする。
本稿では,他の記録から知識を引き出すことにより,非記録的調査に効果的に答える確率に基づく患者シミュレータを提案する。
論文 参考訳(メタデータ) (2020-03-14T02:05:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。