論文の概要: Predicting Causal Effects from Natural Language Queries using Structured Representations
- arxiv url: http://arxiv.org/abs/2605.29631v1
- Date: Thu, 28 May 2026 09:04:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.093159
- Title: Predicting Causal Effects from Natural Language Queries using Structured Representations
- Title(参考訳): 構造化表現を用いた自然言語クエリによる因果関係の予測
- Authors: Giuliano Martinelli, Piriyakorn Piriyatamwong, Abelardo Carlos Martinez Lorenzo, Jasmin Baier, Riccardo Orlando, Satvik Garg, Sharif Kazemi, Linxi Wang, Arianna Legovini, Samuel Fraiberger,
- Abstract要約: 実験記述に合わせた72,000以上の自然言語質問からなる,新たな大規模ベンチマークを導入する。
次に、まず、教師付きエンコーダモデルを用いて効果サイズを予測する前に、クエリの合成構造化表現を生成する2段階のフレームワークを提案する。
実験により, 絶対誤差を27%から71%まで削減し, 予測性能を向上させる上で, ファインタニングが重要な役割を担っていることが示された。
- 参考スコア(独自算出の注目度): 7.749911374727115
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Randomized controlled trials are a cornerstone of medicine and the social sciences as they enable reliable estimates of causal effects. However, they are costly and time-consuming to conduct, motivating interest in predicting causal effects from existing experimental evidence. Recent advances in large language models (LLMs) have demonstrated strong performance on knowledge-intensive tasks, raising the question of whether these models can be used for forecasting causal effect sizes. To investigate this, we introduce Query2Effect, a new large-scale benchmark consisting of more than 72,000 natural language questions aligned with experiment descriptions, created to simulate realistic information-seeking scenarios by varying query specificity along dimensions of implicitness, abstraction, and ambiguity. We then propose a two-step framework that first generates a synthetic structured representation of a query before predicting effect size using a supervised encoder model. Experiments show that finetuning plays a crucial role in improving prediction performance, with absolute error reducing by -27% up to -71% compared to prompted out-of-the-box LLMs, and that our two-step framework is beneficial for out-of-domain generalization, highlighting the benefits of separating semantic interpretation from numerical effect estimation.
- Abstract(参考訳): ランダム化制御試験は、因果効果の信頼できる推定を可能にするため、医学と社会科学の基盤となっている。
しかし、それらは実行に時間と費用がかかり、既存の実験的な証拠から因果効果を予測することへの関心を動機付けている。
大規模言語モデル(LLM)の最近の進歩は、知識集約的なタスクにおいて強力なパフォーマンスを示しており、これらのモデルが因果効果の予測に利用できるかどうかという疑問が提起されている。
そこで本研究では,暗黙性,抽象性,曖昧性の次元に沿ってクエリ特異性を変化させることで,現実的な情報検索シナリオをシミュレートするために構築された,72,000以上の自然言語質問からなる新しい大規模ベンチマークであるQuery2Effectを紹介する。
次に、まず、教師付きエンコーダモデルを用いて効果サイズを予測する前に、クエリの合成構造化表現を生成する2段階のフレームワークを提案する。
実験により, 絶対誤差を最大27%から71%削減し, 予測性能を向上させる上で, ファインタニングが重要な役割を担っていることが明らかとなった。
関連論文リスト
- ARISE: An Adaptive Resolution-Aware Metric for Test-Time Scaling Evaluation in Large Reasoning Models [102.4511331368587]
ARISE(Adaptive Resolution-Aware Scaling Evaluation)は、大規模推論モデルの試験時間スケーリングの有効性を評価するために設計された新しい尺度である。
我々は、様々な領域にわたる最先端の推論モデルを評価する包括的な実験を行う。
論文 参考訳(メタデータ) (2025-10-07T15:10:51Z) - Do-PFN: In-Context Learning for Causal Effect Estimation [75.62771416172109]
予備データ適合ネットワーク(PFN)は, 合成データに基づいて事前学習を行い, 結果を予測する。
提案手法により,基礎となる因果グラフの知識を必要とせず,因果効果の正確な推定が可能となる。
論文 参考訳(メタデータ) (2025-06-06T12:43:57Z) - Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Kernel-based estimators for functional causal effects [1.6749379740049928]
実験的なFr'echet平均と演算子評価カーネルに基づく因果効果推定器を提案する。
これらの手法は、処理ミス特異性に対する堅牢性を維持しながら、高次元性、逐次順序付け、モデル複雑性の課題に対処する。
論文 参考訳(メタデータ) (2025-03-06T22:48:55Z) - Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてる
まず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。
次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Causal Post-Processing of Predictive Models [0.7349727826230863]
本稿では,限られた実験データを用いて予測モデルの出力を改良する手法である因果後処理を提案する。
我々は,特に予測モデルが有用だが不完全な因果シグナルを捉えた場合,CPPは介入決定を改善することができることを示した。
論文 参考訳(メタデータ) (2024-06-13T20:18:16Z) - Estimating the Causal Effects of Natural Logic Features in Transformer-Based NLI Models [16.328341121232484]
文脈介入の効果を測定するために因果効果推定手法を適用した。
本研究はトランスフォーマーの無関係な変化に対する堅牢性と影響の高い変化に対する感受性について検討する。
論文 参考訳(メタデータ) (2024-04-03T10:22:35Z) - A Second Look at the Impact of Passive Voice Requirements on Domain
Modeling: Bayesian Reanalysis of an Experiment [4.649794383775257]
我々は、受動音声がその後のドメイン・モデリング活動に与える影響について、唯一知られている制御実験を再分析する。
その結果, 原作者の観察した影響は, 以前考えられていたよりも遥かに少ないことがわかった。
論文 参考訳(メタデータ) (2024-02-16T16:24:00Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。