論文の概要: Linear Contextual Bandits with Interference
- arxiv url: http://arxiv.org/abs/2409.15682v1
- Date: Tue, 24 Sep 2024 02:51:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 11:19:39.653208
- Title: Linear Contextual Bandits with Interference
- Title(参考訳): 干渉を考慮した線形文脈帯域
- Authors: Yang Xu, Wenbin Lu, Rui Song,
- Abstract要約: 線形CB(LinCB)における干渉に対処するための体系的枠組みを導入する。
本稿では、報酬モデリングプロセスにおける干渉効果を明示的に定量化する一連のアルゴリズムを提案する。
提案手法の有効性をシミュレーションおよびMovieLensデータに基づく合成データを用いて実証した。
- 参考スコア(独自算出の注目度): 14.835167982538053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interference, a key concept in causal inference, extends the reward modeling process by accounting for the impact of one unit's actions on the rewards of others. In contextual bandit (CB) settings, where multiple units are present in the same round, potential interference can significantly affect the estimation of expected rewards for different arms, thereby influencing the decision-making process. Although some prior work has explored multi-agent and adversarial bandits in interference-aware settings, the effect of interference in CB, as well as the underlying theory, remains significantly underexplored. In this paper, we introduce a systematic framework to address interference in Linear CB (LinCB), bridging the gap between causal inference and online decision-making. We propose a series of algorithms that explicitly quantify the interference effect in the reward modeling process and provide comprehensive theoretical guarantees, including sublinear regret bounds, finite sample upper bounds, and asymptotic properties. The effectiveness of our approach is demonstrated through simulations and a synthetic data generated based on MovieLens data.
- Abstract(参考訳): 因果推論における重要な概念である干渉は、あるユニットの行動が他ユニットの報酬に与える影響を考慮し、報酬モデリングプロセスを拡張する。
同一ラウンドに複数のユニットが存在するコンテキスト的バンディット(CB)設定では、潜在的な干渉は異なる武器に対する期待される報酬の推定に大きく影響し、それによって意思決定プロセスに影響を与える。
干渉認識設定におけるマルチエージェントおよび逆方向の包帯を探索する以前の研究もあるが、CBにおける干渉の効果は、基礎となる理論と同様に、明らかに過小評価されている。
本稿では,線形CB(LinCB)における干渉に対処する体系的枠組みを導入し,因果推論とオンライン意思決定のギャップを埋める。
本稿では,報酬モデリングプロセスにおける干渉効果を明示的に定量化し,サブ線形後悔境界,有限標本上界,漸近特性などを含む包括的な理論的保証を提供するアルゴリズムを提案する。
提案手法の有効性をシミュレーションおよびMovieLensデータに基づく合成データを用いて実証した。
関連論文リスト
- Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - Causal Message Passing for Experiments with Unknown and General Network Interference [5.294604210205507]
複雑で未知のネットワーク干渉に対応する新しいフレームワークを提案する。
我々のフレームワークは因果的メッセージパッシングと呼ばれ、高次元近似的メッセージパッシング手法に基づいている。
本手法の有効性を5つの数値シナリオで示す。
論文 参考訳(メタデータ) (2023-11-14T17:31:50Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Neighborhood Adaptive Estimators for Causal Inference under Network
Interference [152.4519491244279]
我々は,古典的非干渉仮説の違反を考える。つまり,ある個人に対する治療が他者の結果に影響を及ぼす可能性がある。
干渉をトラクタブルにするために、干渉がどのように進行するかを記述する既知のネットワークを考える。
このような環境下での処理に対する平均的直接的処理効果の予測について検討した。
論文 参考訳(メタデータ) (2022-12-07T14:53:47Z) - Inference and Denoise: Causal Inference-based Neural Speech Enhancement [83.4641575757706]
本研究では、雑音の存在を介入としてモデル化することにより、因果推論パラダイムにおける音声強調(SE)課題に対処する。
提案した因果推論に基づく音声強調(CISE)は,ノイズ検出器を用いて間欠雑音音声中のクリーンフレームとノイズフレームを分離し,両フレームセットを2つのマスクベース拡張モジュール(EM)に割り当て,ノイズ条件SEを実行する。
論文 参考訳(メタデータ) (2022-11-02T15:03:50Z) - Algorithmic Recourse in Partially and Fully Confounded Settings Through
Bounding Counterfactual Effects [0.6299766708197883]
アルゴリズムリコースは、自動意思決定システムからより好ましい結果を得るために、個人に実行可能なレコメンデーションを提供することを目的としている。
既存の手法では,データから学習した因果モデルを用いて,隠れたコンバウンディングや付加雑音などの仮定をモデル化する手法が提案されている。
本稿では、これらの仮定を緩和し、観測不能な共役および任意の構造方程式を可能にする離散確率変数に対する別のアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-22T15:07:49Z) - Provable Guarantees on the Robustness of Decision Rules to Causal
Interventions [20.27500901133189]
データ生成プロセスの変化に対する決定ルールのロバストさは、意思決定システムのデプロイの成功に不可欠である。
我々は因果ベイズネットワークを考察し、介入堅牢性問題を正式に定義する。
干渉確率の保証された上下境界を計算するための効率的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-05-19T13:09:47Z) - Causal Inference Q-Network: Toward Resilient Reinforcement Learning [57.96312207429202]
観測干渉を有する弾力性のあるDRLフレームワークを検討する。
本稿では、因果推論Q-network (CIQ) と呼ばれる因果推論に基づくDRLアルゴリズムを提案する。
実験の結果,提案手法は観測干渉に対して高い性能と高反発性を実現することができた。
論文 参考訳(メタデータ) (2021-02-18T23:50:20Z) - Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。
本稿では,理論的観点から,そのような手法の性能について考察する。
交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文 参考訳(メタデータ) (2020-11-03T15:33:10Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z) - Nonparametric inference for interventional effects with multiple
mediators [0.0]
より柔軟で、おそらく機械学習に基づく推定技術を可能にする理論を提供する。
提案した推定器の複数のロバスト性特性を示す。
本研究は, 介入媒介効果の推定において, 最新の統計的学習手法を活用する手段を提供する。
論文 参考訳(メタデータ) (2020-01-16T19:05:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。