論文の概要: Game of Coding With an Unknown Adversary
- arxiv url: http://arxiv.org/abs/2502.07109v1
- Date: Mon, 10 Feb 2025 23:06:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:05:49.210411
- Title: Game of Coding With an Unknown Adversary
- Title(参考訳): Game of Coding with a Unknown Adversary (英語)
- Authors: Hanzaleh Akbarinodehi, Parsa Moradi, Mohammad Ali Maddah-Ali,
- Abstract要約: 新興の分散型アプリケーションによって動機づけられたコーディングフレームワークは、符号化されたシンボルに対する敵の制御が従来の符号化理論の基本的な限界を超えるシナリオに対処するために導入された。
デコーダは、データコレクタ(DC)として、受け入れと拒絶のメカニズムを持ち、次に推定モジュールが続くが、敵は、その実用性を最大化することを目指している。
我々は,直流が相手の効用関数を知らずに平衡付近で達成できる戦略にコミットできるアルゴリズムを開発する。
- 参考スコア(独自算出の注目度): 15.839621757142597
- License:
- Abstract: Motivated by emerging decentralized applications, the \emph{game of coding} framework has been recently introduced to address scenarios where the adversary's control over coded symbols surpasses the fundamental limits of traditional coding theory. Still, the reward mechanism available in decentralized systems, motivates the adversary to act rationally. While the decoder, as the data collector (DC), has an acceptance and rejection mechanism, followed by an estimation module, the adversary aims to maximize its utility, as an increasing function of (1) the chance of acceptance (to increase the reward), and (2) estimation error. On the other hand, the decoder also adjusts its acceptance rule to maximize its own utility, as (1) an increasing function of the chance of acceptance (to keep the system functional), (2) decreasing function of the estimation error. Prior works within this framework rely on the assumption that the game is complete, that is, both the DC and the adversary are fully aware of each other's utility functions. However, in practice, the decoder is often unaware of the utility of the adversary. To address this limitation, we develop an algorithm enabling the DC to commit to a strategy that achieves within the vicinity of the equilibrium, without knowledge of the adversary's utility function. Our approach builds on an observation that at the equilibrium, the relationship between the probability of acceptance and the mean squared error (MSE) follows a predetermined curve independent of the specific utility functions of the players. By exploiting this invariant relationship, the DC can iteratively refine its strategy based on observable parameters, converging to a near-optimal solution. We provide theoretical guarantees on sample complexity and accuracy of the proposed scheme.
- Abstract(参考訳): 新たな分散化アプリケーションによって動機づけられた 'emph{game of coding} フレームワークは、符号化されたシンボルに対する敵の制御が従来の符号化理論の基本的な限界を超えるシナリオに対処するために、最近導入された。
それでも、分散システムで利用可能な報酬メカニズムは、敵が合理的に行動するように動機付けている。
データコレクタ(DC)として、デコーダは、受け入れ拒否機構を持ち、次に推定モジュールが続くが、敵は、(1)受容可能性(報酬を増やす)と(2)推定誤差の増大機能として、その実用性を最大化することを目的としている。
一方、デコーダは、(1)受理可能性の増大機能(システム機能を維持するために)、(2)推定誤差の減少機能として、自己効用を最大化するために、受理ルールも調整する。
このフレームワーク内での以前の作業は、ゲームが完成しているという仮定、すなわちDCと敵の両方が互いのユーティリティ機能を完全に認識しているという仮定に依存していた。
しかし、実際にはデコーダは敵の効用を知らないことが多い。
この制限に対処するため,直流が相手の効用関数を知らずに平衡付近で達成できる戦略にコミットできるアルゴリズムを開発した。
提案手法は, 平衡において, 平均二乗誤差(MSE)と平均二乗誤差(MSE)の関係が, プレイヤーの特定の効用関数に依存しない所定の曲線に従っていることを示す。
この不変性を利用して、DCは観測可能なパラメータに基づいた戦略を反復的に洗練し、ほぼ最適解に収束させることができる。
提案手法の複雑さと精度を理論的に保証する。
関連論文リスト
- Deceptive Sequential Decision-Making via Regularized Policy Optimization [54.38738815697299]
システムの基本的報酬に対する敵意を積極的に欺く政策合成問題に対する2つの正則化戦略を提示する。
政策最適化問題において,各形態の騙しをいかに実装できるかを示す。
ディバータリーの詐欺は、最も重要なエージェントが最重要であると敵に信じさせ、同時に、その最適で非知覚的な価値の980.83%の合計的な報酬を得ることを示せる。
論文 参考訳(メタデータ) (2025-01-30T23:41:40Z) - Learning a Factorized Orthogonal Latent Space using Encoder-only Architecture for Fault Detection; An Alarm management perspective [0.2455468619225742]
本稿では,プロセス変数の誤同定および決定論的成分を効果的に分離する,エンコーダに基づく残差設計を提案する。
提案モデルは2つの異なるエンコーダを用いて、潜在空間を2つの空間に分解する。
提案モデルでは、ほぼゼロの誤報と誤検出を達成しつつ予測品質を著しく向上させる。
論文 参考訳(メタデータ) (2024-08-24T09:00:45Z) - Exploiting hidden structures in non-convex games for convergence to Nash
equilibrium [62.88214569402201]
現代の機械学習アプリケーションは、非協調的なナッシュリリアとして定式化することができる。
決定論的環境と決定論的環境の両方に明確な収束保証を提供する。
論文 参考訳(メタデータ) (2023-12-27T15:21:25Z) - Distributional Shift-Aware Off-Policy Interval Estimation: A Unified
Error Quantification Framework [8.572441599469597]
本研究では、無限水平マルコフ決定過程の文脈における高信頼オフ政治評価について検討する。
目的は、未知の行動ポリシーから事前に収集されたオフラインデータのみを用いて、対象の政策値に対する信頼区間(CI)を確立することである。
提案アルゴリズムは, 非線形関数近似設定においても, サンプル効率, 誤差ローバスト, 既知収束性を示す。
論文 参考訳(メタデータ) (2023-09-23T06:35:44Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Interpreting Primal-Dual Algorithms for Constrained Multiagent
Reinforcement Learning [4.67306371596399]
ほとんどのC-MARLアルゴリズムは、報酬に付加されるペナルティ関数を通じて制約を強制するために、プリマル・デュアルアプローチを使用する。
制約関数をペナルティとして使用する標準的な慣行が安全性の弱い概念に繋がることを示す。
本稿では,制約付きマルチエージェント・アドバンスト・アクター・アトラクション (C-MAA2C) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-29T10:23:26Z) - Beyond the Return: Off-policy Function Estimation under User-specified
Error-measuring Distributions [8.881195152638986]
オフ・ポリティィ・アセスメント(英語: Off-policy Evaluation)は、政策の期待された回帰を推定し、その価値関数を推定する2つの関連するタスクを指す。
疎外化重要度サンプリングの目的に対して適切な正則化を課すことにより、実現可能性のみの下での非政治機能推定の保証を提供する。
論文 参考訳(メタデータ) (2022-10-27T15:34:17Z) - Linear Stochastic Bandits over a Bit-Constrained Channel [37.01818450308119]
我々は,ビット制約チャネル上に線形バンドレットの新たな定式化を導入する。
サーバの目標は、未知のモデルパラメータの推定値に基づいてアクションを取ることで、累積的後悔を最小限に抑えることである。
未知のモデルが$d$-dimensionalである場合、チャネル容量は$O(d)$ bits suffices で順序最適後悔を実現する。
論文 参考訳(メタデータ) (2022-03-02T15:54:03Z) - Robustness and Accuracy Could Be Reconcilable by (Proper) Definition [109.62614226793833]
強靭性と精度のトレードオフは、敵文学において広く研究されている。
局所的不変性の帰納的バイアスを課す不適切に定義された頑健な誤差に由来する可能性がある。
定義上、SCOREは、最悪のケースの不確実性に対処しながら、堅牢性と正確性の間の和解を促進する。
論文 参考訳(メタデータ) (2022-02-21T10:36:09Z) - Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth
Games: Convergence Analysis under Expected Co-coercivity [49.66890309455787]
本稿では,SGDA と SCO の最終的な収束保証として,期待されるコヒーレンシティ条件を導入し,その利点を説明する。
定常的なステップサイズを用いた場合、両手法の線形収束性を解の近傍に証明する。
我々の収束保証は任意のサンプリングパラダイムの下で保たれ、ミニバッチの複雑さに関する洞察を与える。
論文 参考訳(メタデータ) (2021-06-30T18:32:46Z) - Trust but Verify: Assigning Prediction Credibility by Counterfactual
Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。
これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。
この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文 参考訳(メタデータ) (2020-11-24T19:52:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。