論文の概要: Design-Based Bandits Under Network Interference: Trade-Off Between Regret and Statistical Inference
- arxiv url: http://arxiv.org/abs/2510.07646v1
- Date: Thu, 09 Oct 2025 00:38:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.792001
- Title: Design-Based Bandits Under Network Interference: Trade-Off Between Regret and Statistical Inference
- Title(参考訳): ネットワーク干渉によるデザインベース帯域:レグレットと統計的推論のトレードオフ
- Authors: Zichen Wang, Haoyang Hong, Chuanhao Li, Haoxuan Li, Zhiheng Zhang, Huazheng Wang,
- Abstract要約: ネットワーク干渉(MABNI)を持つマルチアームバンディットでは、あるノードによって取られたアクションは他のノードの報酬に影響を与え、複雑な相互依存を生み出す。
我々は,最小化と推論精度のトレードオフをバランスさせるため,任意の正の信頼度シーケンスと対応するアルゴリズムを導入する。
- 参考スコア(独自算出の注目度): 41.49815326663467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In multi-armed bandits with network interference (MABNI), the action taken by one node can influence the rewards of others, creating complex interdependence. While existing research on MABNI largely concentrates on minimizing regret, it often overlooks the crucial concern that an excessive emphasis on the optimal arm can undermine the inference accuracy for sub-optimal arms. Although initial efforts have been made to address this trade-off in single-unit scenarios, these challenges have become more pronounced in the context of MABNI. In this paper, we establish, for the first time, a theoretical Pareto frontier characterizing the trade-off between regret minimization and inference accuracy in adversarial (design-based) MABNI. We further introduce an anytime-valid asymptotic confidence sequence along with a corresponding algorithm, $\texttt{EXP3-N-CS}$, specifically designed to balance the trade-off between regret minimization and inference accuracy in this setting.
- Abstract(参考訳): ネットワーク干渉(MABNI)を持つマルチアームバンディットでは、あるノードによって取られたアクションは他のノードの報酬に影響し、複雑な相互依存を生み出す。
MABNIに関する既存の研究は、後悔を最小限に抑えることに集中しているが、しばしば、最適な腕に過度に重点を置くことが、準最適腕の推測精度を損なうという決定的な懸念を無視する。
単一ユニットシナリオでのこのトレードオフに対処するための最初の取り組みは行われているが、MABNIの文脈ではこれらの課題がより顕著になっている。
本稿では,反逆的(設計ベース)のMABNIにおいて,後悔の最小化と推論精度のトレードオフを特徴付ける理論的パレートフロンティアを初めて確立する。
さらに、この設定において、後悔の最小化と推論精度のトレードオフのバランスをとるために特別に設計された、対応するアルゴリズムである$\texttt{EXP3-N-CS}$とともに、任意の有意な漸近的信頼シーケンスを導入する。
関連論文リスト
- Influential Bandits: Pulling an Arm May Change the Environment [44.71145269686588]
現実世界のアプリケーションは、しばしば非定常環境と武器間の相互依存を含む。
本稿では,未知の,対称な正の半定値相互作用行列による腕間相互作用をモデル化する,影響力のあるバンドイット問題を提案する。
我々は,損失ダイナミクスの構造に合わせて,低信頼境界(LCB)推定器に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-11T02:05:51Z) - Continuous K-Max Bandits [54.21533414838677]
我々は、連続的な結果分布と弱い値-インデックスフィードバックを持つ、$K$-Maxのマルチアームバンディット問題について検討する。
この設定は、レコメンデーションシステム、分散コンピューティング、サーバスケジューリングなどにおいて重要なアプリケーションをキャプチャします。
我々の重要な貢献は、適応的な離散化とバイアス補正された信頼境界を組み合わせた計算効率の良いアルゴリズムDCK-UCBである。
論文 参考訳(メタデータ) (2025-02-19T06:37:37Z) - Best Arm Identification with Minimal Regret [55.831935724659175]
最高の腕識別問題 優雅にアマルガメートは、最小化とBAIを後悔している。
エージェントの目標は、所定の信頼度で最高の腕を特定することである。
二重KL-UCBアルゴリズムは、信頼度がゼロになる傾向があるため、最適性を達成する。
論文 参考訳(メタデータ) (2024-09-27T16:46:02Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Linear Stochastic Bandits over a Bit-Constrained Channel [37.01818450308119]
我々は,ビット制約チャネル上に線形バンドレットの新たな定式化を導入する。
サーバの目標は、未知のモデルパラメータの推定値に基づいてアクションを取ることで、累積的後悔を最小限に抑えることである。
未知のモデルが$d$-dimensionalである場合、チャネル容量は$O(d)$ bits suffices で順序最適後悔を実現する。
論文 参考訳(メタデータ) (2022-03-02T15:54:03Z) - Achieving the Pareto Frontier of Regret Minimization and Best Arm
Identification in Multi-Armed Bandits [91.8283876874947]
本稿では,BoBW-lil'UCB$(gamma)$アルゴリズムの設計と解析を行う。
i) RMとBAIの両方の目的に対して最適なアルゴリズムを同時に実行できないことを示す。
また、BoBW-lil'UCB$(gamma)$は、時間複雑性と後悔の点で競合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-16T17:52:32Z) - Constrained regret minimization for multi-criterion multi-armed bandits [5.349852254138086]
リスク制約を条件として,所与の時間的地平線上での後悔の最小化の問題について検討する。
本稿では,対数的後悔を保証するリスク制約付き低信頼境界アルゴリズムを提案する。
我々は,リスク制約付き後悔最小化アルゴリズムの性能に低い限界を証明した。
論文 参考訳(メタデータ) (2020-06-17T04:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。