論文の概要: Decide less, communicate more: On the construct validity of end-to-end fact-checking in medicine
- arxiv url: http://arxiv.org/abs/2506.20876v1
- Date: Wed, 25 Jun 2025 22:58:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.910301
- Title: Decide less, communicate more: On the construct validity of end-to-end fact-checking in medicine
- Title(参考訳): 医療におけるエンド・ツー・エンドファクト・チェックの構成妥当性について
- Authors: Sebastian Joseph, Lily Chen, Barry Wei, Michael Mackert, Iain J. Marshall, Paul Pu Liang, Ramez Kouzy, Byron C. Wallace, Junyi Jessy Li,
- Abstract要約: 我々は、専門家が医療証拠を合成することによって、ソーシャルメディアからの真の主張を検証する方法を示す。
臨床試験の形で、野生の主張と科学的証拠を結びつける困難さ。
我々は,ファクトチェックは対話型コミュニケーション問題としてアプローチし,評価すべきであると主張している。
- 参考スコア(独自算出の注目度): 59.604255567812714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Technological progress has led to concrete advancements in tasks that were regarded as challenging, such as automatic fact-checking. Interest in adopting these systems for public health and medicine has grown due to the high-stakes nature of medical decisions and challenges in critically appraising a vast and diverse medical literature. Evidence-based medicine connects to every individual, and yet the nature of it is highly technical, rendering the medical literacy of majority users inadequate to sufficiently navigate the domain. Such problems with medical communication ripens the ground for end-to-end fact-checking agents: check a claim against current medical literature and return with an evidence-backed verdict. And yet, such systems remain largely unused. To understand this, we present the first study examining how clinical experts verify real claims from social media by synthesizing medical evidence. In searching for this upper-bound, we reveal fundamental challenges in end-to-end fact-checking when applied to medicine: Difficulties connecting claims in the wild to scientific evidence in the form of clinical trials; ambiguities in underspecified claims mixed with mismatched intentions; and inherently subjective veracity labels. We argue that fact-checking should be approached and evaluated as an interactive communication problem, rather than an end-to-end process.
- Abstract(参考訳): 技術進歩は、自動ファクトチェックなど、困難なタスクの具体的な進歩につながっている。
これらの制度を公衆衛生・医療に採用することへの関心は、医学的決定の高度の性質と、多様かつ多様な医学文献を批判的に評価することの難しさから成長してきた。
証拠に基づく医療はすべての個人に結びついているが、その性質は非常に技術的であり、大多数のユーザーの医療リテラシーが十分にドメインをナビゲートするには不十分である。
医療コミュニケーションのこのような問題は、エンドツーエンドのファクトチェックエージェントの基盤を削り、現在の医学文献に対する主張を確認し、証拠に裏付けられた評決で返却する。
しかし、そのようなシステムはほとんど使われていない。
これを理解するために,臨床専門家が医学的証拠を合成することによって,ソーシャルメディアからの真の主張をどう検証するかを初めて検討する。
この上層部を探索する際、医学的応用におけるエンドツーエンドのファクトチェックの基本的な課題として、野生の主張と臨床試験の形で科学的証拠を結びつける困難さ、不一致の意図と混ざった不特定な主張の曖昧さ、本質的な主観的妥当性ラベルを挙げる。
ファクトチェックはエンドツーエンドのプロセスではなく,対話的なコミュニケーション問題としてアプローチし,評価すべきである,と我々は主張する。
関連論文リスト
- MedScore: Factuality Evaluation of Free-Form Medical Answers [54.722181966548895]
我々は,医学的回答を条件対応の有効な事実に分解する新しい手法であるMedScoreを提案する。
本手法は,既存手法の最大3倍の有効事実を抽出する。
論文 参考訳(メタデータ) (2025-05-24T01:23:09Z) - Medical Hallucinations in Foundation Models and Their Impact on Healthcare [53.97060824532454]
マルチモーダルデータの処理と生成が可能なファンデーションモデルは、医療におけるAIの役割を変革した。
医療幻覚を、モデルが誤解を招く医療内容を生成する場合の例と定義する。
以上の結果から,Chain-of-Thought (CoT) や Search Augmented Generation などの推論手法は,幻覚率を効果的に低減できることがわかった。
これらの知見は、ロバストな検出と緩和戦略のための倫理的かつ実践的な衝動を浮き彫りにした。
論文 参考訳(メタデータ) (2025-02-26T02:30:44Z) - Fact or Guesswork? Evaluating Large Language Model's Medical Knowledge with Structured One-Hop Judgment [108.55277188617035]
大規模言語モデル(LLM)は、様々な下流タスクドメインで広く採用されているが、実際の医学的知識を直接呼び起こし適用する能力はいまだ探索されていない。
既存の医療QAベンチマークの多くは、複雑な推論やマルチホップ推論を評価しており、LSM固有の医療知識を推論能力から切り離すことが困難である。
LLMの1ホップの医療知識を測定するために特別に設計されたデータセットであるMedical Knowledge Judgmentを紹介する。
論文 参考訳(メタデータ) (2025-02-20T05:27:51Z) - Iterative Tree Analysis for Medical Critics [5.617649111108429]
反復木解析(ITA)は、長い医学的テキストから暗黙の主張を抽出し、反復的で適応的な木のような推論プロセスを通じて各主張を検証するように設計されている。
以上の結果から,ITAは複雑な医療用テキスト検証タスクにおける事実不正確さを10%精度で検出する上で,従来手法よりも大幅に優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-01-18T03:13:26Z) - Identifying and Aligning Medical Claims Made on Social Media with Medical Evidence [0.12277343096128711]
医療クレームの特定、これらのクレームからの医療語彙の抽出、特定された医療クレームに関連する証拠の検索という3つの中核課題について検討する。
本稿では,これらの中核的タスクをそれぞれ支援するために,合成医療クレームを生成できる新しいシステムを提案する。
論文 参考訳(メタデータ) (2024-05-18T07:50:43Z) - Comparing Knowledge Sources for Open-Domain Scientific Claim
Verification [6.726255259929497]
PubMedは特殊なバイオメディカルクレームとうまく連携するが、Wikipediaは日常的な健康問題に向いている。
結果について議論し、頻繁な検索パターンと課題を概説し、将来有望な方向性を提供する。
論文 参考訳(メタデータ) (2024-02-05T09:57:15Z) - HealthFC: Verifying Health Claims with Evidence-Based Medical Fact-Checking [5.065947993017158]
HealthFCは、ドイツ語と英語で750件の健康関連クレームのデータセットで、医療専門家による正確さをラベル付けしている。
データセットの分析を行い、その特性と課題を強調します。
データセットは、将来の使用の可能性が高い、挑戦的なテストベッドであることを示す。
論文 参考訳(メタデータ) (2023-09-15T16:05:48Z) - Don't Ignore Dual Logic Ability of LLMs while Privatizing: A
Data-Intensive Analysis in Medical Domain [19.46334739319516]
本研究では, LLMの二重論理能力が, 医療領域の民営化過程における影響について検討した。
以上の結果から,LLMに汎用ドメイン二重論理データを組み込むことによって,LLMの二重論理能力が向上するだけでなく,精度も向上することが示唆された。
論文 参考訳(メタデータ) (2023-09-08T08:20:46Z) - Semi-Supervised Variational Reasoning for Medical Dialogue Generation [70.838542865384]
医療対話生成には,患者の状態と医師の行動の2つの重要な特徴がある。
医療対話生成のためのエンドツーエンドの変分推論手法を提案する。
行動分類器と2つの推論検出器から構成される医師政策ネットワークは、拡張推論能力のために提案される。
論文 参考訳(メタデータ) (2021-05-13T04:14:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。