論文の概要: InferenceEvolve: Towards Automated Causal Effect Estimators through Self-Evolving AI
- arxiv url: http://arxiv.org/abs/2604.04274v1
- Date: Sun, 05 Apr 2026 21:27:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.020216
- Title: InferenceEvolve: Towards Automated Causal Effect Estimators through Self-Evolving AI
- Title(参考訳): InferenceEvolve: 自己進化型AIによる因果推定の自動化を目指して
- Authors: Can Wang, Hongyu Zhao, Yiqun Chen,
- Abstract要約: InferenceEvolveは、大きな言語モデルを使用して因果的方法を発見する進化的フレームワークである。
広く使用されているベンチマーク全体において、InferenceEvolveは確立されたベースラインを一貫して上回る推定値を得る。
- 参考スコア(独自算出の注目度): 5.175703335985426
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Causal inference is central to scientific discovery, yet choosing appropriate methods remains challenging because of the complexity of both statistical methodology and real-world data. Inspired by the success of artificial intelligence in accelerating scientific discovery, we introduce InferenceEvolve, an evolutionary framework that uses large language models to discover and iteratively refine causal methods. Across widely used benchmarks, InferenceEvolve yields estimators that consistently outperform established baselines: against 58 human submissions in a recent community competition, our best evolved estimator lay on the Pareto frontier across two evaluation metrics. We also developed robust proxy objectives for settings without semi-synthetic outcomes, with competitive results. Analysis of the evolutionary trajectories shows that agents progressively discover sophisticated strategies tailored to unrevealed data-generating mechanisms. These findings suggest that language-model-guided evolution can optimize structured scientific programs such as causal inference, even when outcomes are only partially observed.
- Abstract(参考訳): 因果推論は科学的発見の中心であるが、統計的方法論と実世界のデータの複雑さのため、適切な方法を選択することは依然として困難である。
科学的な発見を加速する人工知能の成功に触発されて、我々はInferenceEvolveを紹介した。
InferenceEvolveは、広く使用されているベンチマークで、確立されたベースラインを一貫して上回り、最近のコミュニティコンペで58件の人間による提出に対して、最も進化した推定者は、2つの評価指標でParetoフロンティアに配置しました。
また、半合成結果のない設定のための堅牢なプロキシ目的も開発し、競争結果を得た。
進化軌道の分析は、エージェントが未発見のデータ生成機構に合わせた洗練された戦略を徐々に発見していることを示している。
これらの結果から, 言語モデル誘導進化は, 結果が部分的にしか観察されていない場合でも, 因果推論などの構造化された科学プログラムを最適化できることが示唆された。
関連論文リスト
- Deciphering Scientific Reasoning Steps from Outcome Data for Molecule Optimization [22.850204283344524]
結果から科学的推論を解読するフレームワークであるDESROを提案する。
グループ化されたデータ内の共有パターンと重要な違いを分析することで、大きな言語モデル(LLM)が基盤となるロジックを復元することができる。
我々はこの枠組みを分子最適化において、薬物発見の重要な段階としてインスタンス化する。
論文 参考訳(メタデータ) (2026-03-13T06:25:27Z) - CoT-Evo: Evolutionary Distillation of Chain-of-Thought for Scientific Reasoning [63.44477226386808]
先進的な大規模言語モデル(LLM)からのCoT蒸留は、一般的な推論タスクにおいて有効であることが証明されている。
しかし、先進的なモデルでさえ、誤った、あるいは表面的な推論をしばしば生み出す科学領域では苦戦している。
この問題を解決するために, 進化的CoT蒸留フレームワークであるCoT-Evoを提案する。
論文 参考訳(メタデータ) (2025-10-15T05:29:56Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Contextual Online Uncertainty-Aware Preference Learning for Human Feedback [13.478503755314344]
RLHF(Reinforcement Learning from Human Feedback)は人工知能において重要なパラダイムとなっている。
最適モデルに基づくオンライン意思決定と統計的推測を同時に行うための新しい統計的枠組みを提案する。
本稿では,大規模マルチタスク言語理解データセット上での大規模言語モデルのランク付けのための人間の嗜好データ分析に,提案手法を適用した。
論文 参考訳(メタデータ) (2025-04-27T19:59:11Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。