論文の概要: Asymmetric Graph Error Control with Low Complexity in Causal Bandits
- arxiv url: http://arxiv.org/abs/2408.11240v2
- Date: Thu, 26 Jun 2025 20:05:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:22.884566
- Title: Asymmetric Graph Error Control with Low Complexity in Causal Bandits
- Title(参考訳): 因果帯域における低複素度非対称グラフ誤差制御
- Authors: Chen Peng, Di Zhang, Urbashi Mitra,
- Abstract要約: 因果トポロジーも介入の分布も不明である。
新しい不確実性境界は、報酬を最適化するために高信頼な境界ベースの介入選択を駆動する。
提案手法は,100以上のランダムに生成した因果包帯を用いて,因果構造の学習に要するサンプルを著しく少なくする。
- 参考スコア(独自算出の注目度): 21.812120023339876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the causal bandit problem is investigated, with the objective of maximizing the long-term reward by selecting an optimal sequence of interventions on nodes in an unknown causal graph. It is assumed that both the causal topology and the distribution of interventions are unknown. First, based on the difference between the two types of graph identification errors (false positives and negatives), a causal graph learning method is proposed. Numerical results suggest that this method has a much lower sample complexity relative to the prior art by learning sub-graphs. However, we note that a sample complexity analysis for the new algorithm has not been undertaken, as of yet. Under the assumption of minimum-mean squared error weight estimation, a new uncertainty bound tailored to the causal bandit problem is derived. This uncertainty bound drives an upper confidence bound-based intervention selection to optimize the reward. Further, we consider a particular instance of non-stationary bandits wherein both the causal topology and interventional distributions can change. Our solution is the design of a sub-graph change detection mechanism that requires a modest number of samples. Numerical results compare the new methodology to existing schemes and show a substantial performance improvement in stationary and non-stationary settings. Averaged over 100 randomly generated causal bandits, the proposed scheme takes significantly fewer samples to learn the causal structure and achieves a reward gain of 85% compared to existing approaches.
- Abstract(参考訳): 本稿では,未知の因果グラフにおけるノードへの最適な介入シーケンスを選択することにより,長期報酬の最大化を目的とした因果バンディット問題について検討する。
因果トポロジーも介入の分布も不明である。
まず,2種類のグラフ識別誤差(偽陽性と負)の違いに基づいて因果グラフ学習法を提案する。
数値的な結果から,本手法はサブグラフの学習により,先行技術と比較して試料の複雑さがはるかに低いことが示唆された。
しかし、新しいアルゴリズムのサンプル複雑性解析はまだ行われていない。
最小平均二乗誤差重み推定の仮定の下で、因果バンディット問題に適した新しい不確実性境界を導出する。
この不確実性境界は、報酬を最適化するために高信頼な境界ベースの介入選択を駆動する。
さらに, 因果的トポロジと介入的分布が変化しうる, 定常的でない包帯の特殊な例についても考察する。
提案手法は, サンプル数が少ないサブグラフ変化検出機構の設計である。
提案手法を既存手法と比較し,定常的および非定常的条件下での大幅な性能向上を示す。
提案手法は,100以上のランダムに生成した因果包帯を用いて,因果構造を学習するサンプルを著しく少なくし,既存手法と比較して85%の報奨ゲインを達成する。
関連論文リスト
- Causal bandits with backdoor adjustment on unknown Gaussian DAGs [5.807183284468881]
グラフ構造が不明な場合の因果帯域問題について検討する。
連続的に生成された実験データと観測データを用いて各アームのバックドア調整セットを同定する。
最適介入を逐次決定するために,修正された上位信頼境界に基づく新しい帯域幅アルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-02-04T05:18:35Z) - Countering adversarial perturbations in graphs using error correcting codes [7.553245365626645]
逆の摂動は、送信機と受信機の間のグラフの送信中に起こる。
本研究は,送信側が指定した雑音と受信側の多数決による繰り返し符号化方式を探索し,グラフの構造を整理する。
論文 参考訳(メタデータ) (2024-06-20T12:14:01Z) - Adaptive Online Experimental Design for Causal Discovery [9.447864414136905]
因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T13:26:33Z) - False Discovery Rate Control for Gaussian Graphical Models via
Neighborhood Screening [1.7924920920347915]
グラフ学習におけるノードワイズ変数の選択手法を導入し、選択したエッジセットの誤り発見率を自己推定レベルで確実に制御する。
個々の近傍の新たな融合法は、無向グラフ推定を出力する。
論文 参考訳(メタデータ) (2024-01-18T13:46:41Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Efficient Graph Laplacian Estimation by Proximal Newton [12.05527862797306]
グラフ学習問題は、精度行列の最大極大推定(MLE)として定式化することができる。
いくつかのアルゴリズム的特徴を利用した効率的な解法を得るための2次手法を開発した。
論文 参考訳(メタデータ) (2023-02-13T15:13:22Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Optimal Propagation for Graph Neural Networks [51.08426265813481]
最適グラフ構造を学習するための二段階最適化手法を提案する。
また、時間的複雑さをさらに軽減するために、低ランク近似モデルについても検討する。
論文 参考訳(メタデータ) (2022-05-06T03:37:00Z) - Score matching enables causal discovery of nonlinear additive noise
models [63.93669924730725]
次世代のスケーラブル因果発見手法の設計方法について述べる。
本稿では,スコアのヤコビアンを効率的に近似し,因果グラフを復元する手法を提案する。
論文 参考訳(メタデータ) (2022-03-08T21:34:46Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。