論文の概要: Plausibility Is Not Prediction: Contrastive Evidence for LLM-Based Cellular Perturbation Reasoning
- arxiv url: http://arxiv.org/abs/2606.01042v1
- Date: Sun, 31 May 2026 06:13:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.16174
- Title: Plausibility Is Not Prediction: Contrastive Evidence for LLM-Based Cellular Perturbation Reasoning
- Title(参考訳): 可塑性は予測できない:LLMに基づく細胞摂動推論の対照的な証拠
- Authors: Xinyu Yuan, Xixian Liu, Jianan Zhao, Yashi Zhang, Hongyu Guo, Jian Tang,
- Abstract要約: 摂動実験は細胞機構の理解の中心である。
それらは高価で疎いままであり、保存されていない状態に対する遺伝子発現応答の予測を動機付けている。
証拠を関連摂動から肯定的・否定的な結果に整理することで,予測を比較課題として再編成するCOREを導入する。
- 参考スコア(独自算出の注目度): 27.902219493068824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Perturbation experiments are central to understanding cellular mechanisms, but remain costly and sparse, motivating prediction of gene expression responses for unobserved conditions. A promising recent direction leverages large language models (LLMs) as "virtual cell" simulators-using stepwise, knowledge-grounded mechanistic reasoning to infer differential expression-pointing toward an interpretable, knowledge-driven paradigm that transcends purely data-driven approaches. However, we find that plausibility is not prediction: despite producing biologically plausible explanations, these methods fail to capture perturbation-specific effects: systematically overestimating differential expression, often underperforming a simple gene-frequency baseline in aggregate evaluations, and collapsing to chance-level performance at the per-gene level. This reveals a reliance on intrinsic gene response tendencies rather than true perturbation reasoning. We trace this failure to how evidence is presented: existing methods evaluate perturbation-gene pairs in isolation, without exposing how related perturbations differ in their effects on the same gene. To address this limitation, we introduce CORE (Contrastive Organization of Relational Evidence), which reframes prediction as a comparison task by organizing evidence into positive and negative outcomes from related perturbations. Using a biomedical knowledge graph for evidence retrieval, CORE improves calibration and substantially boosts perturbation-specific prediction in both LLM-based and non-LLM settings: for example, on drug-perturbation data, CORE-Reasoning improves Qwen3.5-9B aggregate metrics by up to 28.6%, while on generic perturbation data, CORE-Voting raises macro-per-gene AUROC from chance to 0.703 in average across four cell lines. This highlights contrastive evidence organization as essential to reliable LLM-based perturbation reasoning
- Abstract(参考訳): 摂動実験は細胞機構の理解の中心であるが、高価で疎外であり、保存されていない条件下での遺伝子発現応答の予測を動機付けている。
最近の有望な方向は、大きな言語モデル(LLM)を「仮想セル」シミュレータとして利用し、純粋にデータ駆動アプローチを超越した解釈可能な知識駆動パラダイムに向けて、微分表現ポイントを推論する、段階的に知識基盤の機械的推論を行う。
しかし, 生物学的に妥当な説明が得られても, これらの手法は摂動特異的な効果を捉えることができず, 系統的過度な差分表現, 集約評価における単純な遺伝子頻度ベースラインの過小評価, 遺伝子レベルでの確率レベルのパフォーマンスの低下などである。
このことは、真の摂動推論よりも本質的な遺伝子応答の傾向に依存していることを明らかにする。
既存の方法では、同じ遺伝子に対して、関連する摂動がどのように異なるかを明らかにすることなく、単独で摂動遺伝子対を評価する。
この制限に対処するため、我々はCORE(Contrastive Organization of Relational Evidence)を導入し、これは証拠を関連する摂動から肯定的および否定的な結果に整理することで、比較課題として予測を再編成する。
例えば、薬物摂動データでは、CORE-ReasoningはQwen3.5-9Bの集計値を最大28.6%改善し、一般的な摂動データでは、CORE-Votingは4つの細胞ラインで平均0.703までマクロ遺伝子AUROCを上昇させる。
このことはLLMに基づく摂動推論に不可欠な対照的なエビデンス組織を強調している
関連論文リスト
- Latent Causal Diffusions for Single-Cell Perturbation Modeling [83.47931153555321]
測定ノイズ下で観察された定常拡散過程として単細胞遺伝子発現をフレーム化する生成モデルを提案する。
LCDはシングルセルRNAシークエンシングスクリーンにおいて、目に見えない摂動の組み合わせの分布変化を予測するために確立されたアプローチより優れていた。
我々は、摂動応答(CLIPR)を介して因果線形化と呼ばれるアプローチを開発し、全ての遺伝子間の直接的な因果効果を近似する。
論文 参考訳(メタデータ) (2026-01-20T16:15:38Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - TxPert: Leveraging Biochemical Relationships for Out-of-Distribution Transcriptomic Perturbation Prediction [11.083533122552396]
我々は、複数の生物学的知識ネットワークを活用してOODシナリオ下での応答を予測する新しい最先端手法であるTxPertを提案する。
特に,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>。
論文 参考訳(メタデータ) (2025-05-20T21:13:23Z) - Predicting gene essentiality and drug response from perturbation screens in preclinical cancer models with LEAP: Layered Ensemble of Autoencoders and Predictors [4.882734501598445]
既存の予測モデルは限定的、一般化可能性、解釈可能性に悩まされている。
自動エンコーダと予測器の階層化フレームワーク(LEAP)について紹介する。
LEAPは、モデリング戦略を越えて、未スクリーンのセルラインでの予測性能を一貫して改善する。
論文 参考訳(メタデータ) (2025-02-21T18:12:36Z) - Generative Intervention Models for Causal Perturbation Modeling [80.72074987374141]
多くの応用において、システムのメカニズムが外部の摂動によって変更されるかは未定である。
本稿では、これらの摂動特徴を原子間干渉による分布にマッピングする方法を学習する生成的介入モデル(GIM)を提案する。
論文 参考訳(メタデータ) (2024-11-21T10:37:57Z) - Nonlinear Permuted Granger Causality [0.6526824510982799]
グランガー因果推論(Granger causal inference)は、経済学から神経科学まで幅広い分野において用いられる、論争的だが広範な手法である。
サンプル外比較を可能にするために、共変集合の置換を用いて関数接続の尺度を明示的に定義する。
変分法の性能を, シミュレーションによる変分選択, ナイーブ置換, 省略技術と比較した。
論文 参考訳(メタデータ) (2023-08-11T16:44:16Z) - CausalBench: A Large-scale Benchmark for Network Inference from
Single-cell Perturbation Data [61.088705993848606]
本稿では,実世界の介入データに対する因果推論手法を評価するベンチマークスイートCausalBenchを紹介する。
CaulBenchには、新しい分散ベースの介入メトリクスを含む、生物学的に動機付けられたパフォーマンスメトリクスが含まれている。
論文 参考訳(メタデータ) (2022-10-31T13:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。