論文の概要: Game-Theoretic Algorithms for Conditional Moment Matching
- arxiv url: http://arxiv.org/abs/2208.09551v1
- Date: Fri, 19 Aug 2022 21:24:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:23:59.365612
- Title: Game-Theoretic Algorithms for Conditional Moment Matching
- Title(参考訳): 条件付きモーメントマッチングのためのゲーム理論アルゴリズム
- Authors: Gokul Swamy and Sanjiban Choudhury and J. Andrew Bagnell and Zhiwei
Steven Wu
- Abstract要約: 条件付きモーメント制限(CMR)を満たすための一般的なゲーム理論戦略を導出する。
我々は,CMRで定義されたゲームを効率的に解く方法について,様々な拡張について詳述する。
- 参考スコア(独自算出の注目度): 39.4969161422156
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: A variety of problems in econometrics and machine learning, including
instrumental variable regression and Bellman residual minimization, can be
formulated as satisfying a set of conditional moment restrictions (CMR). We
derive a general, game-theoretic strategy for satisfying CMR that scales to
nonlinear problems, is amenable to gradient-based optimization, and is able to
account for finite sample uncertainty. We recover the approaches of Dikkala et
al. and Dai et al. as special cases of our general framework before detailing
various extensions and how to efficiently solve the game defined by CMR.
- Abstract(参考訳): エコノメトリや機械学習における様々な問題、例えば器楽変数回帰やベルマン残差最小化は、一連の条件モーメント制限(CMR)を満たすものとして定式化することができる。
非線形問題にスケールし、勾配に基づく最適化に適しており、有限サンプルの不確かさを考慮できるcmrを満たす一般的なゲーム理論戦略を導出する。
我々は、様々な拡張の詳細とCMRで定義されたゲームの効率的な解法を述べる前に、Dikkala et al.とDai et al.のアプローチを、我々の一般的なフレームワークの特別な事例として回収する。
関連論文リスト
- ALMA: a mathematics-driven approach for determining tuning parameters in generalized LASSO problems, with applications to MRI [0.3518504468878697]
ALMA(Algorithm for Lagrange Multipliers Approximation)は、MRI再構成中の一般化LASSO問題のチューニングパラメータを算出する。
ALMAはより一般化されたLASSO問題に適応するが、総変分を超えた他の形式の正規化に対応するためにも堅牢である。
論文 参考訳(メタデータ) (2024-06-27T15:02:04Z) - Functional Generalized Empirical Likelihood Estimation for Conditional
Moment Restrictions [19.39005034948997]
一般化経験的可能性(GEL)に基づく新しい推定法を提案する。
GELはより一般的なフレームワークを提供しており、GMMベースの推定器と比較して、より好ましい小さなサンプル特性を享受していることが示されている。
本研究では,2つの条件付きモーメント制約問題に対して,最先端の実証性能を実現するための,カーネルとニューラルネットワークによる推定器の実装を提案する。
論文 参考訳(メタデータ) (2022-07-11T11:02:52Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - Faster One-Sample Stochastic Conditional Gradient Method for Composite
Convex Minimization [61.26619639722804]
滑らかで非滑らかな項の和として形成される凸有限サム目標を最小化するための条件勾配法(CGM)を提案する。
提案手法は, 平均勾配 (SAG) 推定器を備え, 1回に1回のサンプルしか必要としないが, より高度な分散低減技術と同等の高速収束速度を保証できる。
論文 参考訳(メタデータ) (2022-02-26T19:10:48Z) - The Geometry of Memoryless Stochastic Policy Optimization in
Infinite-Horizon POMDPs [0.0]
我々は、無限水平部分観測可能な決定プロセスにおいて、最高のメモリレスポリシーを見つけるという問題を考察する。
本研究では, 減算された状態-作用周波数と予測累積報酬が政策の関数であり, その度合いは部分観測可能性の度合いによって決定されることを示す。
論文 参考訳(メタデータ) (2021-10-14T14:42:09Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - The Variational Method of Moments [65.91730154730905]
条件モーメント問題は、観測可能量の観点から構造因果パラメータを記述するための強力な定式化である。
OWGMMの変動最小値再構成により、条件モーメント問題に対する非常に一般的な推定器のクラスを定義する。
同じ種類の変分変換に基づく統計的推測のためのアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-12-17T07:21:06Z) - Conditional gradient methods for stochastically constrained convex
minimization [54.53786593679331]
構造凸最適化問題に対する条件勾配に基づく2つの新しい解法を提案する。
私たちのフレームワークの最も重要な特徴は、各イテレーションで制約のサブセットだけが処理されることです。
提案アルゴリズムは, 条件勾配のステップとともに, 分散の低減と平滑化に頼り, 厳密な収束保証を伴っている。
論文 参考訳(メタデータ) (2020-07-07T21:26:35Z) - Sparse recovery by reduced variance stochastic approximation [5.672132510411465]
雑音観測によるスパース信号回復問題に対する反復2次最適化ルーチンの適用について論じる。
本稿では,Median-of-Meansのような手法を用いて,対応するソリューションの信頼性を向上する方法について述べる。
論文 参考訳(メタデータ) (2020-06-11T12:31:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。