論文の概要: Eliciting associations between clinical variables from LLMs via comparison questions across populations
- arxiv url: http://arxiv.org/abs/2605.06335v1
- Date: Thu, 07 May 2026 14:26:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.897064
- Title: Eliciting associations between clinical variables from LLMs via comparison questions across populations
- Title(参考訳): LLMにおける臨床変数の集団間比較による関連性の検討
- Authors: Fabian Kabus, Kian Kordtomeikel, Thomas Brox, Heinz Wiendl, Daiana Stolz, Harald Binder,
- Abstract要約: 患者の特徴間の相関関係や因果関係を回復する方法について検討した。
本稿では,構造化された比較質問,特に患者比較三重項質問に基づくアプローチを提案する。
慢性閉塞性肺疾患(COPD)と多発性硬化症(MS)の2つの臨床領域で本法を実証した。
- 参考スコア(独自算出の注目度): 15.876460640820858
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The training data of large language models (LLMs) comprises a wide range of biomedical literature, reflecting data from many different patient populations. We investigate how it might be possible to recover information on correlation and causal links between patient characteristics, as a key building block for medical decision making. To avoid the pitfalls of direct elicitation, we propose an approach based on structured comparison questions, specifically patient comparison triplet questions. This is combined with a statistical model for the LLM representation that provides estimates of correlations without access to activations or model internals. Intuitively, we consider how similarity decisions of LLMs based on a first variable are affected by providing information on a second variable for one of the patients being assessed. We then induce prompt-level environment shifts to obtain correlation estimates for different subpopulations, which enables an invariant causal prediction (ICP) approach to obtain conservative candidate parent links. We demonstrate the method in two clinical domains, chronic obstructive pulmonary disease (COPD) and multiple sclerosis (MS). Across prompted environments, the elicited correlations are smooth, stable, and clinically interpretable, yet vary in a statistically significant way that supports downstream invariance testing, such that ICP provides a small set of candidate invariant parent links. These results show that indirect elicitation via triplet comparisons can recover meaningful association structure from LLMs and offer a cautious route from implicit correlations to causal statements that are congruent with LLM answering patterns.
- Abstract(参考訳): 大規模言語モデル(LLMs)のトレーニングデータは、多くの異なる患者集団のデータを反映して、幅広い生物医学文献から構成される。
医療的意思決定の鍵となるビルディングブロックとして,患者の特徴間の相関や因果関係に関する情報の回収が可能かを検討する。
そこで本研究では, 患者比較三重項質問に対する構造化された比較質問に基づくアプローチを提案する。
これはLLM表現の統計モデルと組み合わせられ、アクティベーションやモデル内部へのアクセスなしに相関を推定する。
直感的には、第1変数に基づくLCMの類似性決定が、評価されている患者の1人に第2変数に関する情報を提供することによって、どのように影響を受けるかを考える。
次に、異なるサブポピュレーションの相関推定を得るために、プロンプトレベルの環境シフトを誘導し、保守的な親リンクを得るために、不変因果予測(ICP)アプローチを可能にする。
本手法は慢性閉塞性肺疾患 (COPD) と多発性硬化症 (MS) の2つの臨床領域で実証された。
引き起こされた環境全体において、引き起こされた相関関係は滑らかで安定しており、臨床的に解釈可能であるが、ICPは少数の候補不変な親リンクを提供するなど、下流の不変性テストをサポートする統計的に重要な方法で異なる。
これらの結果から, 3重項比較による間接的推論は, LLMから有意な関連構造を復元し, LLM応答パターンと矛盾する因果関係から因果関係への慎重な経路を示唆した。
関連論文リスト
- PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation [51.96735866702332]
PreBAはPCA重み付き検索とベイズ平均アグリゲーションを統合した検索拡張フレームワークである。
例えば、PreBAはパフォーマンスを大幅に改善し、MAEを最大40%削減し、ゼロショット推論でR2を-0.13から0.62に引き上げる。
論文 参考訳(メタデータ) (2026-02-27T07:19:23Z) - On the Credibility of Evaluating LLMs using Survey Questions [0.42061757959666934]
近年,大規模言語モデル(LLM)の価値指向を適応型社会調査を用いて評価している。
本稿では, 正確な設定に依存して, 値配向の類似性を過小評価し, 過度に見積もることの限界を明らかにする。
5か国3ヶ国における世界価値調査(World Value Survey)を用いて、直接対思考の連鎖(direct vs. chain-of-thinkt)と復号戦略(greedy vs. sample)が結果に有意な影響を及ぼすことを示した。
論文 参考訳(メタデータ) (2026-02-03T21:45:43Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Mind the Gap: Benchmarking LLM Uncertainty, Discrimination, and Calibration in Specialty-Aware Clinical QA [4.501692468580528]
臨床質問応答(QA)に焦点を当てた不確実性評価手法の評価を行った。
本稿では,推論指向モデルに基づく行動特徴に基づく,新しい軽量な手法を提案する。
以上の結果から,不確実性はモノリシックな性質ではなく,臨床専門性や質問タイプに依存していることが明らかとなった。
論文 参考訳(メタデータ) (2025-06-12T14:48:25Z) - Uncovering Population PK Covariates from VAE-Generated Latent Spaces [0.24578723416255746]
本稿では,変分オートエンコーダ(VAE)深層学習モデルとLASSOレグレッションを統合したデータ駆動型モデルフリーフレームワークを提案する。
VAEは高次元のPK信号を構造化潜在空間に圧縮し、平均絶対パーセンテージ誤差(MAPE)を2.26%で正確に再構成する。
論文 参考訳(メタデータ) (2025-05-05T09:47:39Z) - Preference Leakage: A Contamination Problem in LLM-as-a-judge [69.96778498636071]
審査員としてのLLM(Large Language Models)とLLMに基づくデータ合成は、2つの基本的なLLM駆動型データアノテーション法として登場した。
本研究では, 合成データ生成器とLCMに基づく評価器の関連性に起因するLCM-as-a-judgeの汚染問題である選好リークを明らかにする。
論文 参考訳(メタデータ) (2025-02-03T17:13:03Z) - A data-driven approach to discover and quantify systemic lupus erythematosus etiological heterogeneity from electronic health records [4.167173990365707]
全身性エリテマトーデス(Systemic lupus erythematosus, SLE)は、多くの症状を呈する複雑な疾患である。
マルチモーダル不完全なEHRデータから確率的独立情報源を発見するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2025-01-13T11:00:31Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Uncertainty Estimation of Large Language Models in Medical Question Answering [60.72223137560633]
大規模言語モデル(LLM)は、医療における自然言語生成の約束を示すが、事実的に誤った情報を幻覚させるリスクがある。
医学的問合せデータセットのモデルサイズが異なる人気不確実性推定(UE)手法をベンチマークする。
以上の結果から,本領域における現在のアプローチは,医療応用におけるUEの課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-07-11T16:51:33Z) - Conditional canonical correlation estimation based on covariates with
random forests [0.0]
本研究では,2つの変数間の条件付き正準相関を推定するRFCCAを用いたランダムフォレスト(Random Forest)を提案する。
提案手法と大域的意義試験は,精度の高い正準相関推定とよく制御されたType-1誤差を提供するシミュレーション研究によって評価される。
論文 参考訳(メタデータ) (2020-11-23T17:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。