論文の概要: A Variational Inequality Approach to Bayesian Regression Games
- arxiv url: http://arxiv.org/abs/2103.13509v1
- Date: Wed, 24 Mar 2021 22:33:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 13:23:45.566193
- Title: A Variational Inequality Approach to Bayesian Regression Games
- Title(参考訳): ベイズ回帰ゲームに対する変分不等式アプローチ
- Authors: Wenshuo Guo, Michael I. Jordan, Tianyi Lin
- Abstract要約: 我々は凸類の一意性の存在を証明し、それを滑らかなコスト関数に一般化する。
必然的に強い収束で解くための2つの簡単なアルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 90.79402153164587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian regression games are a special class of two-player general-sum
Bayesian games in which the learner is partially informed about the adversary's
objective through a Bayesian prior. This formulation captures the uncertainty
in regard to the adversary, and is useful in problems where the learner and
adversary may have conflicting, but not necessarily perfectly antagonistic
objectives. Although the Bayesian approach is a more general alternative to the
standard minimax formulation, the applications of Bayesian regression games
have been limited due to computational difficulties, and the existence and
uniqueness of a Bayesian equilibrium are only known for quadratic cost
functions. First, we prove the existence and uniqueness of a Bayesian
equilibrium for a class of convex and smooth Bayesian games by regarding it as
a solution of an infinite-dimensional variational inequality (VI) in Hilbert
space. We consider two special cases in which the infinite-dimensional VI
reduces to a high-dimensional VI or a nonconvex stochastic optimization, and
provide two simple algorithms of solving them with strong convergence
guarantees. Numerical results on real datasets demonstrate the promise of this
approach.
- Abstract(参考訳): ベイズ回帰ゲーム(英: bayesian regression games)は、2人プレイの一般サムベイズゲーム(英語版)の特殊クラスであり、学習者がベイズ前駆者を通じて敵の目的を部分的に知らされる。
この定式化は、敵意に関する不確実性を捉え、学習者と敵意が相反するかもしれない問題において有用であるが、必ずしも完全に敵対的な目的ではない。
ベイジアン・アプローチは標準的なミニマックスの定式化の代替となるが、ベイジアン回帰ゲームの適用は計算困難のために制限されており、ベイジアン均衡の存在と特異性は二次コスト関数でのみ知られている。
まず、ヒルベルト空間における無限次元変分不等式 (VI) の解として、凸と滑らかなベイズゲームのクラスに対するベイズ均衡の存在と特異性を証明する。
無限次元 VI が高次元 VI あるいは非凸確率最適化に還元される2つの特別な場合を考え、強い収束を保証する2つの簡単なアルゴリズムを提供する。
実データセットの数値結果は、このアプローチの可能性を実証している。
関連論文リスト
- Variational empirical Bayes variable selection in high-dimensional logistic regression [2.4032899110671955]
我々は,その新しい,計算効率の良い変分近似を開発した。
そのようなノベルティの1つは、回帰係数自身ではなく、モデル空間上の辺分布に対してこの近似を直接発展させることである。
シミュレーションにおいて,本手法の強い性能を実証し,我々の変分近似が近似している後部分布で満たされる強い選択整合性を引き継ぐことを証明した。
論文 参考訳(メタデータ) (2025-02-14T19:57:13Z) - Convex Markov Games: A Framework for Creativity, Imitation, Fairness, and Safety in Multiagent Learning [31.958202912400925]
コンベックス・マルコフゲーム(英語版)のクラスを導入し、占有度よりも一般的なコンベックス・プレイスを可能にする。
無限の時間的地平線とマルコフゲームよりも厳密な一般性にもかかわらず、純粋な戦略ナッシュ平衡が存在する。
実験により,従来の常連型ゲームに対する新しい解法,不斉協調ゲームにおける公正な解法,ロボット倉庫環境における安全な長期行動の優先順位が明らかにされた。
論文 参考訳(メタデータ) (2024-10-22T00:55:04Z) - Offline Learning in Markov Games with General Function Approximation [22.2472618685325]
マルコフゲームにおけるオフラインマルチエージェント強化学習(RL)について検討する。
マルコフゲームにおけるサンプル効率のよいオフライン学習のための最初のフレームワークを提供する。
論文 参考訳(メタデータ) (2023-02-06T05:22:27Z) - Global Nash Equilibrium in Non-convex Multi-player Game: Theory and
Algorithms [66.8634598612777]
ナッシュ均衡(NE)はマルチプレイヤーゲームにおいて全てのプレイヤーに受け入れられることを示す。
また、一般理論から一歩ずつ一方的に利益を得ることはできないことも示している。
論文 参考訳(メタデータ) (2023-01-19T11:36:50Z) - Preference learning along multiple criteria: A game-theoretic
perspective [97.94912276610002]
我々は、ブラックウェルの接近性からインスピレーションを得て、フォン・ノイマンの勝者の概念をマルチ基準設定に一般化する。
本フレームワークは,基準間の選好の非線形集約を可能にし,多目的最適化から線形化に基づくアプローチを一般化する。
凸最適化問題の解法として,マルチ基準問題インスタンスのブラックウェルの勝者が計算可能であることを示す。
論文 参考訳(メタデータ) (2021-05-05T03:23:11Z) - VIB is Half Bayes [80.3767111908235]
変分情報ボトルネックは, 完全経験的目標と完全ベイズ的目標との妥協と見なすことができる。
このアプローチはベイズの利点のいくつかを提供する一方で、一部の作業しか必要としない、と私たちは主張する。
論文 参考訳(メタデータ) (2020-11-17T15:36:35Z) - Online and Distribution-Free Robustness: Regression and Contextual
Bandits with Huber Contamination [29.85468294601847]
線形回帰と文脈的帯域幅という2つの古典的高次元オンライン学習問題を再考する。
従来の手法が失敗した場合にアルゴリズムが成功することを示す。
論文 参考訳(メタデータ) (2020-10-08T17:59:05Z) - Stochastic Hamiltonian Gradient Methods for Smooth Games [51.47367707388402]
ハミルトンの手法のクラスに焦点をあて、滑らかなゲームのあるクラスに対する最初の収束保証を提供する。
最適化文献からのツールを用いて、SHGDは勾配の近傍に直線的に収束することを示す。
この結果から,一般ゲームのクラスに対して,非漸近的でない最後の収束保証を初めて提供する。
論文 参考訳(メタデータ) (2020-07-08T15:42:13Z) - Naive Feature Selection: a Nearly Tight Convex Relaxation for Sparse Naive Bayes [51.55826927508311]
そこで本稿では,特徴選択に使用可能なnaive Bayesのスパースバージョンを提案する。
余剰特徴の余剰寄与が減少するにつれて凸緩和境界が厳密になることを示す。
二項スパースモデルと多項スパースモデルの両方は、問題サイズにおいてほぼ線形な時間で解決可能である。
論文 参考訳(メタデータ) (2019-05-23T19:30:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。