論文の概要: Doubly Robust Estimation of Causal Effects in Strategic Equilibrium Systems
- arxiv url: http://arxiv.org/abs/2510.15555v3
- Date: Fri, 24 Oct 2025 13:11:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 11:00:52.411802
- Title: Doubly Robust Estimation of Causal Effects in Strategic Equilibrium Systems
- Title(参考訳): 戦略的平衡系における因果効果の二重ロバスト推定
- Authors: Sibo Xiao,
- Abstract要約: 本稿では,戦略的環境における因果推論の新しいフレームワークであるSDR (Strategic Doubly Robust) 推定手法を紹介する。
このフレームワークは、エージェントが介入に対して戦略的に応答するとき、信頼できる因果推論に原則化されたアプローチを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the Strategic Doubly Robust (SDR) estimator, a novel framework that integrates strategic equilibrium modeling with doubly robust estimation for causal inference in strategic environments. SDR addresses endogenous treatment assignment arising from strategic agent behavior, maintaining double robustness while incorporating strategic considerations. Theoretical analysis confirms SDR's consistency and asymptotic normality under strategic unconfoundedness. Empirical evaluations demonstrate SDR's superior performance over baseline methods, achieving 7.6\%-29.3\% bias reduction across varying strategic strengths and maintaining robust scalability with agent populations. The framework provides a principled approach for reliable causal inference when agents respond strategically to interventions.
- Abstract(参考訳): 本稿では、戦略的平衡モデルと戦略的環境における因果推論のための二重頑健な推定を統合する新しいフレームワークであるSDR(Strategic Doubly Robust)について紹介する。
SDRは、戦略的エージェントの振る舞いから生じる内因性治療の課題に対処し、戦略的考察を取り入れながら二重堅牢性を維持する。
理論的解析により、SDRの整合性と漸近正規性は戦略的不整合性の下で確認される。
実証的な評価は、SDRがベースライン法よりも優れた性能を示し、様々な戦略的強みにまたがって7.6\%-29.3\%のバイアス低減を実現し、エージェント集団との堅牢なスケーラビリティを維持していることを示している。
このフレームワークは、エージェントが介入に対して戦略的に応答するとき、信頼できる因果推論に原則化されたアプローチを提供する。
関連論文リスト
- Plan before Solving: Problem-Aware Strategy Routing for Mathematical Reasoning with LLMs [49.995906301946]
既存の手法は通常、数学的推論を行うためにLLM(Large Language Models)をガイドするための固定戦略を利用する。
分析の結果,単一戦略は問題固有の要件に適応できず,有効性と効率性のトレードオフを見落としていることが明らかとなった。
本稿では,PRISM(Planning and Routing through Instance-Specific Modeling)を提案する。
論文 参考訳(メタデータ) (2025-09-29T07:22:41Z) - Distributional Adversarial Attacks and Training in Deep Hedging [4.900139144574163]
分布シフト下での古典的深層湿潤戦略の堅牢性について検討する。
本研究では, 深層湿潤戦略の堅牢性を高めるために, 対戦型トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-20T14:59:32Z) - Information-Seeking Decision Strategies Mitigate Risk in Dynamic, Uncertain Environments [0.0]
採餌作業における規範的報酬・情報探索戦略の性能を比較した。
彼らの行動には微妙な相違があり、結果として意味のあるパフォーマンスの違いが生じます。
本研究は,報酬損失を最小限に抑えつつリスクを軽減できる情報探索行動の適応的価値を支持する。
論文 参考訳(メタデータ) (2025-03-24T19:55:41Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - Steganography and Probabilistic Risk Analysis: A Game Theoretical Framework for Quantifying Adversary Advantage and Impact [1.2937020918620652]
本研究では, 防衛企業と敵との戦略的相互作用を分析するための, 新たなステガノグラフィーゲーム理論モデルを提案する。
非協力的なゲームとしてシナリオをフレーミングすることにより、双方にとって最適な戦略を体系的に評価する。
論文 参考訳(メタデータ) (2024-12-23T20:02:52Z) - Strategic Conformal Prediction [0.66567375919026]
機械学習モデルがデプロイされると、その予測はその環境を変えることができる。
本稿では,このような環境下での確実な定量化が可能な新たなフレームワークであるストラテジック・コンフォーマル予測を提案する。
論文 参考訳(メタデータ) (2024-11-03T15:06:05Z) - LLM as a Mastermind: A Survey of Strategic Reasoning with Large Language Models [75.89014602596673]
戦略推論は、戦略を調整しながら、マルチエージェント設定における敵の行動を理解し、予測する必要がある。
大規模言語モデルを用いた戦略的推論に関連するスコープ,アプリケーション,方法論,評価指標について検討する。
戦略的推論を重要な認知能力として重要視し、将来の研究の方向性や潜在的な改善に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-04-01T16:50:54Z) - On strategies for risk management and decision making under uncertainty shared across multiple fields [55.2480439325792]
本稿では、このような戦略の110以上の例を見つけ、リスクに対するこのアプローチをRDOT: Risk-reducing Design and Operations Toolkitと呼ぶ。
RDOT戦略は、構造的、反応性、形式的、敵対的、多段階、ポジティブの6つの幅広いカテゴリに分類される。
全体的なRDOTは、不確実性に対する多目的応答の見過ごされたクラスを表している。
論文 参考訳(メタデータ) (2023-09-06T16:14:32Z) - Strategic Decision-Making in the Presence of Information Asymmetry:
Provably Efficient RL with Algorithmic Instruments [55.41685740015095]
我々は,戦略MDPと呼ばれる新しいモデルの下で,オフライン強化学習について検討する。
アルゴリズムiNstruments(PLAN)を用いたペシミスティックポリシー学習法を提案する。
論文 参考訳(メタデータ) (2022-08-23T15:32:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。