論文の概要: Provable Sample Complexity Guarantees for Learning of Continuous-Action
Graphical Games with Nonparametric Utilities
- arxiv url: http://arxiv.org/abs/2004.01022v1
- Date: Wed, 1 Apr 2020 17:32:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 18:27:09.107987
- Title: Provable Sample Complexity Guarantees for Learning of Continuous-Action
Graphical Games with Nonparametric Utilities
- Title(参考訳): 非パラメトリックユーティリティを用いた連続アクショングラフィカルゲーム学習のための確率的サンプル複雑度保証
- Authors: Adarsh Barik, Jean Honorio
- Abstract要約: 非パラメトリックなユーティリティ関数を持つ連続アクションゲームの正確な構造を学習する問題について検討する。
我々の手法は、ごくわずかな平衡とノイズの多いユーティリティにアクセスすることで機能する。
- 参考スコア(独自算出の注目度): 31.061339148448006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the problem of learning the exact structure of
continuous-action games with non-parametric utility functions. We propose an
$\ell_1$ regularized method which encourages sparsity of the coefficients of
the Fourier transform of the recovered utilities. Our method works by accessing
very few Nash equilibria and their noisy utilities. Under certain technical
conditions, our method also recovers the exact structure of these utility
functions, and thus, the exact structure of the game. Furthermore, our method
only needs a logarithmic number of samples in terms of the number of players
and runs in polynomial time. We follow the primal-dual witness framework to
provide provable theoretical guarantees.
- Abstract(参考訳): 本稿では,非パラメトリック効用関数を用いた連続アクションゲームの厳密な構造を学習する問題について検討する。
我々は,回収されたユーティリティのフーリエ変換係数のスパース性を促進する$\ell_1$正規化手法を提案する。
提案手法は非常に少数のnash平衡とノイズの多いユーティリティにアクセスすることで機能する。
特定の技術的条件下では、この手法はこれらの効用関数の正確な構造、つまりゲームの正確な構造を回復する。
さらに,本手法では,選手数と多項式時間で実行されるサンプルの対数しか必要としない。
我々は、証明可能な理論的保証を提供するための原始二重証人枠組みに従う。
関連論文リスト
- Learning to sample fibers for goodness-of-fit testing [0.0]
離散指数族モデルに対する完全適合性テストを構築することの問題点を考察する。
この問題をマルコフ決定プロセスに変換し、サンプリングのための「よい動きを学ぶための強化学習アプローチ」を示す。
提案アルゴリズムは,評価可能な収束性を持つアクタ・クリティカル・サンプリング方式に基づいている。
論文 参考訳(メタデータ) (2024-05-22T19:33:58Z) - Verification-Aided Learning of Neural Network Barrier Functions with
Termination Guarantees [6.9060054915724]
バリア関数は、システムの安全性を保証するための一般的なフレームワークである。
これらの関数を見つける一般的な方法は存在しない。
近年のアプローチでは、自己教師付き学習技術を用いてこれらの機能を学習している。
論文 参考訳(メタデータ) (2024-03-12T04:29:43Z) - Equivariance with Learned Canonicalization Functions [77.32483958400282]
正規化を行うために小さなニューラルネットワークを学習することは、事前定義を使用することよりも優れていることを示す。
実験の結果,正準化関数の学習は多くのタスクで同変関数を学習する既存の手法と競合することがわかった。
論文 参考訳(メタデータ) (2022-11-11T21:58:15Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - Multiway Non-rigid Point Cloud Registration via Learned Functional Map
Synchronization [105.14877281665011]
我々は、点雲上に定義された学習関数に関する地図を同期させることにより、複数の非剛体形状を登録する新しい方法であるSyNoRiMを提案する。
提案手法は,登録精度において最先端の性能を達成できることを実証する。
論文 参考訳(メタデータ) (2021-11-25T02:37:59Z) - The Nonconvex Geometry of Linear Inverse Problems [26.049281826055797]
ゲージ関数は統計モデルの複雑性を測定する。
我々は、ゲージ関数の限界を克服する統計的複雑性、ゲージ$_p$関数の新しい概念を紹介します。
我々はゲージ$_p$関数の構成要素を持つ新しい学習マシンを提案し、このマシンを多くの統計保証付きでアームする。
論文 参考訳(メタデータ) (2021-01-07T21:55:08Z) - Learning Set Functions that are Sparse in Non-Orthogonal Fourier Bases [73.53227696624306]
フーリエスパース集合関数を学習するための新しいアルゴリズム群を提案する。
Walsh-Hadamard変換に焦点をあてた他の研究とは対照的に、我々の新しいアルゴリズムは最近導入された非直交フーリエ変換で機能する。
いくつかの実世界のアプリケーションで有効性を示す。
論文 参考訳(メタデータ) (2020-10-01T14:31:59Z) - Provably Efficient Reward-Agnostic Navigation with Linear Value
Iteration [143.43658264904863]
我々は、最小二乗値スタイルのアルゴリズムで一般的に使用される、より標準的なベルマン誤差の概念の下での反復が、ほぼ最適値関数の学習において強力なPAC保証を提供することを示す。
そこで本稿では,任意の(線形な)報酬関数に対して,最適に近いポリシーを学習するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2020-08-18T04:34:21Z) - Batch Value-function Approximation with Only Realizability [17.692408242465763]
バッチ強化学習(RL):探索データセットからQstar$を学習する。
我々のアルゴリズムであるBVFTは、トーナメントの手順を通じて硬さ予想(探索データというより強い概念の下では)を破る。
また、BVFTが他の拡張と開問題の間のモデル選択にどのように適用できるかについても論じる。
論文 参考訳(メタデータ) (2020-08-11T20:09:37Z) - Laplacian Regularized Few-Shot Learning [35.381119443377195]
少数ショットタスクに対するラプラシアン正規化推論を提案する。
私たちの推論はベースモデルを再トレーニングするものではなく、クエリセットのグラフクラスタリングとして見ることができます。
我々のLaplacianShotは、異なるモデル間で大きなマージンで最先端の手法を一貫して上回ります。
論文 参考訳(メタデータ) (2020-06-28T02:17:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。