論文の概要: DeepImagine: Learning Biomedical Reasoning via Successive Counterfactual Imagining
- arxiv url: http://arxiv.org/abs/2604.23054v1
- Date: Fri, 24 Apr 2026 22:48:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.12357
- Title: DeepImagine: Learning Biomedical Reasoning via Successive Counterfactual Imagining
- Title(参考訳): DeepImagine: 連続的なカウンターファクトイマジネーションによるバイオメディカル推論の学習
- Authors: Youze Zheng, Jianyou Wang, Yuhan Chen, Matthew Feng, Longtian Bao, Hanyuan Zhang, Maxim Khan, Aditya K. Sehgal, Christopher D. Rosin, Umber Dube, Ramamohan Paturi,
- Abstract要約: 本稿では,LLMの生物医学的推論を連続的対実的想像を通して教える枠組みを提案する。
実際の臨床試験から自然対と近似対を構築し,その結果を報告する。
DeepImagineは、未修正言語モデルと従来の相関ベースラインよりも一貫して改善されていることを示す。
- 参考スコア(独自算出の注目度): 6.221068729338845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the outcomes of prospective clinical trials remains a major challenge for large language models. Prior work has shown that both traditional correlational predictors, such as random forests and logistic regression, and strong commercial LLMs achieve limited performance on this task. In this paper, we propose DeepImagine, a framework for teaching LLMs biomedical reasoning through successive counterfactual imagining. The central idea is to approximate hidden causal mechanisms of clinical trials by training models to infer how observed trial results would change under controlled perturbations of experimental conditions, such as dosage, outcome measures, study arms, geography, and other trial attributes. To support this objective, we construct both natural and approximate counterfactual pairs from real clinical trials with reported outcomes. For settings where strict counterfactual supervision is available, such as paired outcome measures or dose-ranging study arms within the same trial, we train models with supervised fine-tuning. For broader settings where only approximate counterfactual pairs can be retrieved, we optimize models with reinforcement learning using verifiable rewards based on downstream benchmark correctness. We further augment training with synthetic reasoning traces that provide causally plausible explanations for local counterfactual transitions. Using this pipeline, we train language models under 10B parameters, including Qwen3.5-9B, and evaluate them on clinical trial outcome prediction. We aim to show that DeepImagine consistently improves over untuned language models and traditional correlational baselines. Finally, we aim to show that the learned reasoning trajectories provide interpretable signals about how models represent trial-level mechanisms, suggesting a practical path toward more mechanistic and scientifically useful biomedical language models.
- Abstract(参考訳): 将来的な臨床試験の結果を予測することは、大きな言語モデルにとって大きな課題である。
従来の研究は、ランダム森林やロジスティック回帰のような従来の相関予測器と、強力な商業LLMの両方が、このタスクにおいて限られた性能を達成することを示した。
本稿では,LLMのバイオメディカル推論の枠組みであるDeepImagineを提案する。
中心となる考え方は、実験結果が服用、結果測定、研究用武器、地理、その他の試験属性などの実験条件の制御された摂動の下でどのように変化するかを予測するためのトレーニングモデルによる臨床試験の隠れ因果メカニズムを近似することである。
この目的を達成するために,本研究は実際の臨床試験から自然対と近似対のペアを構築し,その結果を報告する。
同じ試験において、対効果測定や線量測定などの厳格な対物監督が可能となるような環境では、教師付き微調整を施したモデルを訓練する。
近似反事実ペアのみを検索可能なより広範な設定では、下流ベンチマークの正確性に基づいた検証可能な報酬を用いた強化学習によるモデル最適化を行う。
我々はさらに、局所的な反事実遷移の因果的説明を提供する合成推論トレースによるトレーニングを強化する。
このパイプラインを用いて、Qwen3.5-9Bを含む10Bパラメータの言語モデルを訓練し、臨床試験結果予測に基づいて評価する。
DeepImagineは、未修正言語モデルや従来の相関ベースラインよりも一貫して改善されていることを示すことを目的としている。
最後に、学習された推論軌跡が、モデルがどのように試行レベルのメカニズムを表現しているかを解釈可能な信号として示し、より機械的かつ科学的に有用なバイオメディカル言語モデルへの実践的な道のりを示唆することを目的とする。
関連論文リスト
- Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。
我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。
乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文 参考訳(メタデータ) (2026-01-29T14:06:50Z) - OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてる
まず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。
次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Counterfactual Generative Modeling with Variational Causal Inference [1.9287470458589586]
本稿では, 逆ファクト生成モデリングタスクを扱うための変分ベイズ因果推論フレームワークを提案する。
実験では, 反ファクト生成モデルにおける最先端モデルと比較して, フレームワークの利点を実証する。
論文 参考訳(メタデータ) (2024-10-16T16:44:12Z) - Clinical outcome prediction under hypothetical interventions -- a
representation learning framework for counterfactual reasoning [31.97813934144506]
本稿では,リスクモデルの組込み特性として,対実的説明の提供を考慮した新しい表現学習フレームワークを提案する。
提案する枠組みは, 研究者や臨床医がパーソナライズされたケアを改善するのに役立つ可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-15T09:41:16Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。