論文の概要: Leveraging Noisy Observations in Zero-Sum Games
- arxiv url: http://arxiv.org/abs/2402.02861v1
- Date: Mon, 5 Feb 2024 10:20:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 16:59:25.356533
- Title: Leveraging Noisy Observations in Zero-Sum Games
- Title(参考訳): ゼロサムゲームにおけるノイズ観測の活用
- Authors: Emmanouil M Athanasakos (NEO), Samir M Perlaza (NEO, ECE, GAATI)
- Abstract要約: 本稿では,1人のプレイヤーが所定の確率測度(戦略)をサンプリングして相手に行動の選択を依頼するゼロサムゲームの事例について検討する。
リーダーの動作は、フォロワーによって任意のチャネルの出力として観察される。
それに応じて、フォロワーは現在の情報、すなわちリーダーのコミットメントとそれに対応するノイズ観測に基づいて行動を選択する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies an instance of zero-sum games in which one player (the
leader) commits to its opponent (the follower) to choose its actions by
sampling a given probability measure (strategy). The actions of the leader are
observed by the follower as the output of an arbitrary channel. In response to
that, the follower chooses its action based on its current information, that
is, the leader's commitment and the corresponding noisy observation of its
action. Within this context, the equilibrium of the game with noisy action
observability is shown to always exist and the necessary conditions for its
uniqueness are identified. Interestingly, the noisy observations have important
impact on the cardinality of the follower's set of best responses. Under
particular conditions, such a set of best responses is proved to be a singleton
almost surely. The proposed model captures any channel noise with a density
with respect to the Lebesgue measure. As an example, the case in which the
channel is described by a Gaussian probability measure is investigated.
- Abstract(参考訳): 本稿では,1人のプレイヤー(リーダー)が相手(フォロワー)に対して所定の確率測度(ストラテジー)をサンプリングして行動を選択するゼロサムゲームの事例について検討する。
リーダーの行動は、従者によって任意のチャンネルの出力として観察される。
これに反応して、従者は現在の情報、すなわちリーダーのコミットメントとそれに対応する騒がしい行動観察に基づいて行動を選択する。
この文脈において、騒がしい動作の可観測性を持つゲームの平衡が常に存在し、その一意性に必要な条件が特定される。
興味深いことに、ノイズの多い観測は、フォロワーの最高の反応の集合の濃度に重要な影響を及ぼす。
特定の条件下では、そのような最良の応答の集合は、ほぼ確実にシングルトンであることが証明される。
提案モデルでは,Lebesgue測度に対して密度のある任意のチャネルノイズを捕捉する。
例として、チャネルがガウス確率測定によって記述される場合について検討する。
関連論文リスト
- Robust Online Classification: From Estimation to Denoising [14.535583931446807]
一般仮説クラスを用いて,特徴のオンライン分類をラベルに分類する。
観測されたノイズラベルとノイズレス特徴を用いて予測を行う。
性能は、真のラベルと比較する場合、ミニマックスリスクによって測定される。
論文 参考訳(メタデータ) (2023-09-04T16:17:39Z) - An Ordinal Latent Variable Model of Conflict Intensity [59.49424978353101]
ゴールドスタインスケール(Goldstein scale)は、紛争・協力的なスケールでイベントをスコアする、広く使われている専門家ベースの尺度である。
本稿では、競合強度を測定するために、潜伏変数に基づくアプローチをとる。
論文 参考訳(メタデータ) (2022-10-08T08:59:17Z) - Preservation of entanglement in local noisy channels [0.0]
共有量子状態に対する局所雑音の影響を考察し,劣化から保存できる絡み合いの量を評価する。
この研究の主な動機は、保存された絡み合いの依存関係の背後にある理由を分析することである。
論文 参考訳(メタデータ) (2022-09-09T17:37:59Z) - Centrality and Consistency: Two-Stage Clean Samples Identification for
Learning with Instance-Dependent Noisy Labels [87.48541631675889]
本稿では,2段階のクリーンサンプル識別手法を提案する。
まず,クリーンサンプルの早期同定にクラスレベルの特徴クラスタリング手法を用いる。
次に, 基底真理クラス境界に近い残余のクリーンサンプルについて, 一貫性に基づく新しい分類法を提案する。
論文 参考訳(メタデータ) (2022-07-29T04:54:57Z) - Joint-Modal Label Denoising for Weakly-Supervised Audio-Visual Video
Parsing [52.2231419645482]
本稿では,弱教師付き音声・視覚ビデオ解析タスクについて述べる。
それぞれのモードに属する全ての事象を認識し、時間的境界をローカライズすることを目的としている。
論文 参考訳(メタデータ) (2022-04-25T11:41:17Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Statistical Hypothesis Testing for Class-Conditional Label Noise [3.6895394817068357]
この作業は、機械学習の実践者に質問に答えるためのツールを提供することを目的としています。
特に,あるインスタンスラベル対のデータセットが,クラス条件ラベルノイズによって破損したかどうかを確認するための仮説テストを提案する。
論文 参考訳(メタデータ) (2021-03-03T19:03:06Z) - On safe post-selection for Bell tests with ideal detectors: Causal
diagram approach [0.0]
複数の空間分布結果に対するポストセレクションによる幅広いシナリオのクラスについて論じる。
単純な基準はオール・ブット・ワン原理(英語版)と呼ばれ、非局所性に関する結論がベルの不等式とポスト・セレクトされたデータとを破ることによる結論が有効であることを示す。
論文 参考訳(メタデータ) (2020-12-14T06:38:57Z) - Predictive Bandits [68.8204255655161]
我々は,予測的盗賊と呼ばれる,新たな盗賊問題を紹介し,研究する。
各ラウンドで、意思決定者はまず、特定の武器の報酬に関する情報を集めるかどうかを決定する。
意思決定者は、ラウンドで実際にプレイされる腕を選択する。
論文 参考訳(メタデータ) (2020-04-02T17:12:33Z) - On conditional versus marginal bias in multi-armed bandits [105.07190334523304]
多腕バンディットにおける腕のサンプル平均のバイアスは、適応データ解析において重要な問題である。
サンプル平均を含む報酬の単調関数の条件バイアスの兆候を特徴付ける。
我々の結果は任意の条件付けイベントを保ち、データ収集ポリシーの自然な単調性特性を活用する。
論文 参考訳(メタデータ) (2020-02-19T20:16:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。