論文の概要: When Correct Beliefs Collapse: Epistemic Resilience of LLMs under Clinical Pressure
- arxiv url: http://arxiv.org/abs/2605.23932v1
- Date: Thu, 23 Apr 2026 12:03:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 02:55:42.944359
- Title: When Correct Beliefs Collapse: Epistemic Resilience of LLMs under Clinical Pressure
- Title(参考訳): 正しい信念の崩壊:臨床圧力下でのLCMの疫学抵抗性
- Authors: Boyu Xiao, Xiuqi Tian, Xuwen Song, Haochun Wang, Guanchun Song, Sendong Zhao, Bing Qin,
- Abstract要約: エスカレート圧力下での信条安定性を評価するためのストレステストフレームワークであるtextbftextscMed-Stressを提案する。
9つのフロンティア大言語モデル (LLM) にまたがって, 医療知識とロバスト性の間に明確な解離が生じる。
実験の結果,textbftextttR-FTは信念の変化をほぼ排除し,堅牢性を大幅に向上させることがわかった。
- 参考スコア(独自算出の注目度): 30.2346772002755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite strong medical benchmark accuracy, LLMs can exhibit severe multi-turn sycophancy in clinical dialogue, abandoning initial correct diagnosis under escalating pressure. We propose \textbf{\textsc{Med-Stress}}, a targeted stress test framework that evaluates belief stability under escalating pressure. Across nine frontier large language models (LLMs), we find a clear dissociation between medical knowledge and robustness: high initial diagnostic capability does not imply high belief stability, yielding large knowledge-robustness gaps for several LLMs. To mitigate this failure mode, we propose a lightweight inference-time defense, \textbf{\texttt{RBED}} (\textbf{R}ole-\textbf{B}ased \textbf{E}pistemic \textbf{D}efense), and \textbf{\texttt{R-FT}} (\textbf{R}esilience-oriented \textbf{F}ine-\textbf{T}uning), a training-time approach that internalizes evidence-based resistance to pressure. Experiments show that \textbf{\texttt{R-FT}} nearly eliminates belief change and substantially improves robustness.
- Abstract(参考訳): 医用ベンチマークの精度は高いが、LSMは臨床対話において重度の多回性梅毒を呈し、エスカレート圧力下での最初の正しい診断を放棄する。
本研究では, エスカレート圧力下での信念安定性を評価するストレステストフレームワークである, textbf{\textsc{Med-Stress}}を提案する。
9つのフロンティア大言語モデル(LLM)において、医療知識とロバスト性の間に明確な解離が生じている。
この障害を緩和するために、軽量な推論時防御法である \textbf{\textt{RBED}} (\textbf{R}ole-\textbf{B}ased \textbf{E}pistemic \textbf{D}efense) と \textbf{\textt{R-FT}} (\textbf{R}esilience-oriented \textbf{F}ine-\textbf{T}uning) を提案する。
実験によると、 \textbf{\texttt{R-FT}} は信念の変化をほとんど排除し、ロバスト性を大幅に改善する。
関連論文リスト
- Towards Trustworthy Depression Estimation via Disentangled Evidential Learning [50.22167852149165]
EviDepはうつ病の重症度を共同で定量化する明らかな学習フレームワークである。
EviDepは、堅牢な証拠合成を保証するために厳密な情報整合性を強制する。
最先端の予測精度と優れた不確実性校正を実現し、信頼できる臨床スクリーニングのための堅牢なフェールセーフメカニズムを提供する。
論文 参考訳(メタデータ) (2026-04-17T13:27:11Z) - Beyond Social Pressure: Benchmarking Epistemic Attack in Large Language Models [0.07812854697536452]
テクテテプステミック・アタックの評価のための診断ベンチマークを開発した。
知識、価値、アイデンティティの正当性に対して、単に前の答えに反対するのではなく、挑戦する。
論文 参考訳(メタデータ) (2026-04-09T03:14:30Z) - INFACT: A Diagnostic Benchmark for Induced Faithfulness and Factuality Hallucinations in Video-LLMs [69.11382230669491]
ビデオ証拠(忠実さ)または検証可能な世界知識(事実性)のどちらかに矛盾する結果である幻覚
textscINFACTは、4つのモードでモデルを評価する。
14の代表的なビデオ-LLMの実験では、高ベースモード精度が誘導モードの信頼性に確実に変換されないことが明らかになった。
論文 参考訳(メタデータ) (2026-03-12T03:03:16Z) - Towards Reliable Medical LLMs: Benchmarking and Enhancing Confidence Estimation of Large Language Models in Medical Consultation [97.36081721024728]
本稿では,現実的な医療相談におけるマルチターンインタラクションの信頼性を評価するための最初のベンチマークを提案する。
本ベンチマークでは,3種類の医療データを統合し,診断を行う。
本稿では,エビデンスを基盤とした言語自己評価フレームワークであるMedConfを紹介する。
論文 参考訳(メタデータ) (2026-01-22T04:51:39Z) - Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency [78.91846841708586]
完全な自己整合性で答えられた事実でさえ、軽微な文脈干渉の下で急速に崩壊することを示します。
本研究では,概念的近傍における応答コヒーレンスを評価する信念の構造尺度であるNighbor-Consistency Belief(NCB)を提案する。
また、文脈不変の信念構造を最適化し、長い知識の脆さを約30%低減する構造意識訓練(SAT)を提案する。
論文 参考訳(メタデータ) (2026-01-09T16:23:21Z) - Towards Robust and Fair Next Visit Diagnosis Prediction under Noisy Clinical Notes with Large Language Models [4.56877715768796]
本稿では,多種多様なテキスト破損シナリオ下での最先端の大規模言語モデル(LLM)の体系的研究について述べる。
臨床に根ざしたラベル推論手法と,臨床医の推論をエミュレートする階層的チェーン・オブ・シント(CoT)戦略を導入する。
論文 参考訳(メタデータ) (2025-11-23T10:40:36Z) - FT-ARM: Fine-Tuned Agentic Reflection Multimodal Language Model for Pressure Ulcer Severity Classification with Reasoning [2.4095540924689405]
圧力潰瘍(PUs)は重篤かつ一般的な医療上の問題である。
PU重症度(Stages I-IV)の正確な分類は適切な治療に不可欠である。
PU重度分類のためのエージェント自己回帰機構を備えた細調整多モード大言語モデル(MLLM)であるFT-ARMを提案する。
論文 参考訳(メタデータ) (2025-10-28T21:23:32Z) - Shallow Robustness, Deep Vulnerabilities: Multi-Turn Evaluation of Medical LLMs [9.291589998223696]
MedQA-Followupは,医療質問応答におけるマルチターンロバスト性を評価するためのフレームワークである。
MedQAデータセットの制御介入を用いて、5つの最先端LCMを評価する。
モデルは浅瀬の摂動下では合理的に良好に機能するが、マルチターン設定では深刻な脆弱性が現れる。
論文 参考訳(メタデータ) (2025-10-14T08:04:18Z) - MaP: A Unified Framework for Reliable Evaluation of Pre-training Dynamics [72.00014675808228]
大規模言語モデルの不安定性評価プロセスは、真の学習力学を曖昧にする。
textbfMaPは、アンダーラインMergingアンダーラインとアンダーラインPass@kメトリックを統合するフレームワークです。
実験により、MaPはよりスムーズな性能曲線を示し、ラン間分散を低減し、より一貫性のあるランキングを保証する。
論文 参考訳(メタデータ) (2025-10-10T11:40:27Z) - Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models [87.66870367661342]
大規模言語モデル(LLM)は、医療におけるAIアプリケーションで使用される。
LLMを継続的にストレステストするレッドチームフレームワークは、4つのセーフティクリティカルなドメインで重大な弱点を明らかにすることができる。
敵エージェントのスイートは、自律的に変化するテストケースに適用され、安全でないトリガー戦略を特定し、評価する。
私たちのフレームワークは、進化可能でスケーラブルで信頼性の高い、次世代の医療AIのセーフガードを提供します。
論文 参考訳(メタデータ) (2025-07-30T08:44:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。