論文の概要: Linear Contextual Bandits with Interference
- arxiv url: http://arxiv.org/abs/2409.15682v1
- Date: Tue, 24 Sep 2024 02:51:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 11:19:39.653208
- Title: Linear Contextual Bandits with Interference
- Title(参考訳): 干渉を考慮した線形文脈帯域
- Authors: Yang Xu, Wenbin Lu, Rui Song,
- Abstract要約: 線形CB(LinCB)における干渉に対処するための体系的枠組みを導入する。
本稿では、報酬モデリングプロセスにおける干渉効果を明示的に定量化する一連のアルゴリズムを提案する。
提案手法の有効性をシミュレーションおよびMovieLensデータに基づく合成データを用いて実証した。
- 参考スコア(独自算出の注目度): 14.835167982538053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interference, a key concept in causal inference, extends the reward modeling process by accounting for the impact of one unit's actions on the rewards of others. In contextual bandit (CB) settings, where multiple units are present in the same round, potential interference can significantly affect the estimation of expected rewards for different arms, thereby influencing the decision-making process. Although some prior work has explored multi-agent and adversarial bandits in interference-aware settings, the effect of interference in CB, as well as the underlying theory, remains significantly underexplored. In this paper, we introduce a systematic framework to address interference in Linear CB (LinCB), bridging the gap between causal inference and online decision-making. We propose a series of algorithms that explicitly quantify the interference effect in the reward modeling process and provide comprehensive theoretical guarantees, including sublinear regret bounds, finite sample upper bounds, and asymptotic properties. The effectiveness of our approach is demonstrated through simulations and a synthetic data generated based on MovieLens data.
- Abstract(参考訳): 因果推論における重要な概念である干渉は、あるユニットの行動が他ユニットの報酬に与える影響を考慮し、報酬モデリングプロセスを拡張する。
同一ラウンドに複数のユニットが存在するコンテキスト的バンディット(CB)設定では、潜在的な干渉は異なる武器に対する期待される報酬の推定に大きく影響し、それによって意思決定プロセスに影響を与える。
干渉認識設定におけるマルチエージェントおよび逆方向の包帯を探索する以前の研究もあるが、CBにおける干渉の効果は、基礎となる理論と同様に、明らかに過小評価されている。
本稿では,線形CB(LinCB)における干渉に対処する体系的枠組みを導入し,因果推論とオンライン意思決定のギャップを埋める。
本稿では,報酬モデリングプロセスにおける干渉効果を明示的に定量化し,サブ線形後悔境界,有限標本上界,漸近特性などを含む包括的な理論的保証を提供するアルゴリズムを提案する。
提案手法の有効性をシミュレーションおよびMovieLensデータに基づく合成データを用いて実証した。
関連論文リスト
- Can We Validate Counterfactual Estimations in the Presence of General Network Interference? [6.092214762701847]
対実推定のためのクロスバリデーションを実現する新しいフレームワークを提案する。
中心となるのは、分散保存ネットワークブートストラップ方式です。
我々は、不均一な単位レベル特性を取り入れることで、最近の因果メッセージパッシングの発展を拡大する。
論文 参考訳(メタデータ) (2025-02-03T06:51:04Z) - Online Experimental Design With Estimation-Regret Trade-off Under Network Interference [7.080131271060764]
オンライン実験設計のための統合型干渉認識フレームワークを提案する。
既存の研究と比較して、露出マッピングの統計的概念を利用して腕の空間の定義を拡張した。
また、アルゴリズムの実装を提案し、異なる学習環境とネットワークトポロジにまたがる一般化について議論する。
論文 参考訳(メタデータ) (2024-12-04T21:45:35Z) - Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - Causal Message Passing for Experiments with Unknown and General Network Interference [5.294604210205507]
複雑で未知のネットワーク干渉に対応する新しいフレームワークを提案する。
我々のフレームワークは因果的メッセージパッシングと呼ばれ、高次元近似的メッセージパッシング手法に基づいている。
本手法の有効性を5つの数値シナリオで示す。
論文 参考訳(メタデータ) (2023-11-14T17:31:50Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Neighborhood Adaptive Estimators for Causal Inference under Network
Interference [152.4519491244279]
我々は,古典的非干渉仮説の違反を考える。つまり,ある個人に対する治療が他者の結果に影響を及ぼす可能性がある。
干渉をトラクタブルにするために、干渉がどのように進行するかを記述する既知のネットワークを考える。
このような環境下での処理に対する平均的直接的処理効果の予測について検討した。
論文 参考訳(メタデータ) (2022-12-07T14:53:47Z) - Inference and Denoise: Causal Inference-based Neural Speech Enhancement [83.4641575757706]
本研究では、雑音の存在を介入としてモデル化することにより、因果推論パラダイムにおける音声強調(SE)課題に対処する。
提案した因果推論に基づく音声強調(CISE)は,ノイズ検出器を用いて間欠雑音音声中のクリーンフレームとノイズフレームを分離し,両フレームセットを2つのマスクベース拡張モジュール(EM)に割り当て,ノイズ条件SEを実行する。
論文 参考訳(メタデータ) (2022-11-02T15:03:50Z) - Algorithmic Recourse in Partially and Fully Confounded Settings Through
Bounding Counterfactual Effects [0.6299766708197883]
アルゴリズムリコースは、自動意思決定システムからより好ましい結果を得るために、個人に実行可能なレコメンデーションを提供することを目的としている。
既存の手法では,データから学習した因果モデルを用いて,隠れたコンバウンディングや付加雑音などの仮定をモデル化する手法が提案されている。
本稿では、これらの仮定を緩和し、観測不能な共役および任意の構造方程式を可能にする離散確率変数に対する別のアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-22T15:07:49Z) - Causal Inference Q-Network: Toward Resilient Reinforcement Learning [57.96312207429202]
観測干渉を有する弾力性のあるDRLフレームワークを検討する。
本稿では、因果推論Q-network (CIQ) と呼ばれる因果推論に基づくDRLアルゴリズムを提案する。
実験の結果,提案手法は観測干渉に対して高い性能と高反発性を実現することができた。
論文 参考訳(メタデータ) (2021-02-18T23:50:20Z) - Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。
本稿では,理論的観点から,そのような手法の性能について考察する。
交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文 参考訳(メタデータ) (2020-11-03T15:33:10Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。