論文の概要: Asymmetric Graph Error Control with Low Complexity in Causal Bandits
- arxiv url: http://arxiv.org/abs/2408.11240v1
- Date: Tue, 20 Aug 2024 23:37:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-22 18:58:50.491624
- Title: Asymmetric Graph Error Control with Low Complexity in Causal Bandits
- Title(参考訳): 因果帯域における低複素度非対称グラフ誤差制御
- Authors: Chen Peng, Di Zhang, Urbashi Mitra,
- Abstract要約: 目的は、因果グラフ内のノードに対する最適な介入シーケンスを選択することである。
信号が報酬に寄与するノード間の因果関係を利用することで、介入を最適化する。
- 参考スコア(独自算出の注目度): 21.812120023339876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the causal bandit problem is investigated, in which the objective is to select an optimal sequence of interventions on nodes in a causal graph. It is assumed that the graph is governed by linear structural equations; it is further assumed that both the causal topology and the distribution of interventions are unknown. By exploiting the causal relationships between the nodes whose signals contribute to the reward, interventions are optimized. First, based on the difference between the two types of graph identification errors (false positives and negatives), a causal graph learning method is proposed, which strongly reduces sample complexity relative to the prior art by learning sub-graphs. Under the assumption of Gaussian exogenous inputs and minimum-mean squared error weight estimation, a new uncertainty bound tailored to the causal bandit problem is derived. This uncertainty bound drives an upper confidence bound based intervention selection to optimize the reward. To cope with non-stationary bandits, a sub-graph change detection mechanism is proposed, with high sample efficiency. Numerical results compare the new methodology to existing schemes and show a substantial performance improvement in both stationary and non-stationary settings. Compared to existing approaches, the proposed scheme takes 67% fewer samples to learn the causal structure and achieves an average reward gain of 85%.
- Abstract(参考訳): 本稿では,因果グラフにおけるノードに対する最適な介入順序を選択することを目的とした因果帯域問題について検討する。
このグラフは線形構造方程式によって支配されていると仮定され、因果トポロジーと介入の分布が不明であると仮定される。
信号が報酬に寄与するノード間の因果関係を利用することで、介入を最適化する。
まず,2種類のグラフ識別誤差(偽陽性と負)の違いに基づいて因果グラフ学習法を提案する。
ガウス的外因性入力と最小平均二乗誤差重み付けの仮定の下で、因果バンディット問題に適した新しい不確実性境界を導出する。
この不確実性境界は、報酬を最適化するために、上位信頼境界に基づく介入選択を駆動する。
非定常帯域に対処するため, 試料効率の高いサブグラフ変化検出機構を提案する。
提案手法を既存手法と比較し,定常条件と非定常条件の両方で大幅な性能向上を示した。
既存の手法と比較して、提案手法は因果構造を学ぶのに67%のサンプルを要し、平均報酬率は85%に達する。
関連論文リスト
- Countering adversarial perturbations in graphs using error correcting codes [7.553245365626645]
逆の摂動は、送信機と受信機の間のグラフの送信中に起こる。
本研究は,送信側が指定した雑音と受信側の多数決による繰り返し符号化方式を探索し,グラフの構造を整理する。
論文 参考訳(メタデータ) (2024-06-20T12:14:01Z) - Adaptive Online Experimental Design for Causal Discovery [9.447864414136905]
因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T13:26:33Z) - False Discovery Rate Control for Gaussian Graphical Models via
Neighborhood Screening [1.7924920920347915]
グラフ学習におけるノードワイズ変数の選択手法を導入し、選択したエッジセットの誤り発見率を自己推定レベルで確実に制御する。
個々の近傍の新たな融合法は、無向グラフ推定を出力する。
論文 参考訳(メタデータ) (2024-01-18T13:46:41Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Efficient Graph Laplacian Estimation by Proximal Newton [12.05527862797306]
グラフ学習問題は、精度行列の最大極大推定(MLE)として定式化することができる。
いくつかのアルゴリズム的特徴を利用した効率的な解法を得るための2次手法を開発した。
論文 参考訳(メタデータ) (2023-02-13T15:13:22Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Optimal Propagation for Graph Neural Networks [51.08426265813481]
最適グラフ構造を学習するための二段階最適化手法を提案する。
また、時間的複雑さをさらに軽減するために、低ランク近似モデルについても検討する。
論文 参考訳(メタデータ) (2022-05-06T03:37:00Z) - Score matching enables causal discovery of nonlinear additive noise
models [63.93669924730725]
次世代のスケーラブル因果発見手法の設計方法について述べる。
本稿では,スコアのヤコビアンを効率的に近似し,因果グラフを復元する手法を提案する。
論文 参考訳(メタデータ) (2022-03-08T21:34:46Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。