論文の概要: Additive Causal Bandits with Unknown Graph
- arxiv url: http://arxiv.org/abs/2306.07858v1
- Date: Tue, 13 Jun 2023 15:43:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 13:02:58.031640
- Title: Additive Causal Bandits with Unknown Graph
- Title(参考訳): 未知グラフを用いた加算因果帯域
- Authors: Alan Malek and Virginia Aglietti and Silvia Chiappa
- Abstract要約: 我々は,学習者が因果グラフに関連付けられたランダムな変数の集合に介入することを選択可能な因果帯域設定における行動を選択するアルゴリズムを探索する。
学習者の目標は、観測可能な変数に対するすべての介入の中で、結果変数の期待を最大化する介入を素早く見つけることである。
- 参考スコア(独自算出の注目度): 10.575089475850465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore algorithms to select actions in the causal bandit setting where
the learner can choose to intervene on a set of random variables related by a
causal graph, and the learner sequentially chooses interventions and observes a
sample from the interventional distribution. The learner's goal is to quickly
find the intervention, among all interventions on observable variables, that
maximizes the expectation of an outcome variable. We depart from previous
literature by assuming no knowledge of the causal graph except that latent
confounders between the outcome and its ancestors are not present. We first
show that the unknown graph problem can be exponentially hard in the parents of
the outcome. To remedy this, we adopt an additional additive assumption on the
outcome which allows us to solve the problem by casting it as an additive
combinatorial linear bandit problem with full-bandit feedback. We propose a
novel action-elimination algorithm for this setting, show how to apply this
algorithm to the causal bandit problem, provide sample complexity bounds, and
empirically validate our findings on a suite of randomly generated causal
models, effectively showing that one does not need to explicitly learn the
parents of the outcome to identify the best intervention.
- Abstract(参考訳): そこで,学習者が因果グラフに関連する確率変数の集合に対して介入を選択できる因果バンディット設定における行動選択アルゴリズムを探索し,学習者は介入を順次選択し,介入分布からサンプルを観察する。
学習者の目標は、観測可能な変数に対するすべての介入の中で、結果変数の期待を最大化する介入を素早く見つけることである。
因果グラフの知識を仮定し、結果とその祖先の間の潜在的な共同創設者が存在しないこと以外は、これまでの文献から離れる。
まず, 未知のグラフ問題は, 結果の親に対して指数関数的に困難であることを示す。
これに対処するため,本手法では,全帯域フィードバックによる加算組合せ線形バンディット問題としてそれを解くことで,結果に対する付加的な仮定を適用する。
そこで本研究では,この手法を因果的バンディット問題に適用する方法を示し,サンプルの複雑性境界を与え,ランダムに生成された因果モデルの一群について実験的に検証し,結果の親を明示的に学習する必要がないことを効果的に示し,そのアルゴリズムを因果的バンディット問題に適用する方法を提案する。
関連論文リスト
- Adaptive Online Experimental Design for Causal Discovery [9.447864414136905]
因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T13:26:33Z) - Bayesian causal discovery from unknown general interventions [55.2480439325792]
本稿では,観測データと介入実験データを組み合わせたDAG(Cousal Directed Acyclic Graphs)の学習問題について考察する。
我々は,DAG,介入対象,誘導親集合上の後続分布を近似するマルコフ連鎖モンテカルロスキームを開発した。
論文 参考訳(メタデータ) (2023-12-01T11:30:51Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Subset verification and search algorithms for causal DAGs [13.108039226223793]
エッジのサブセット(ターゲットエッジ)間の因果関係を学習するために必要な最小の介入セットを特定する問題について検討する。
介入因果グラフのいくつかの興味深い構造的特性を証明し、ここで研究されるサブセット検証・探索問題以外の応用があると信じている。
論文 参考訳(メタデータ) (2023-01-09T06:25:44Z) - Pure Exploration of Causal Bandits [9.77519365079468]
因果バンディット問題は多腕バンディットと因果推論を統合する。
オンライン学習課題:未知の因果推論分布を持つ因果グラフを与えられた場合、1つの変数に介入するか、介入しないかを選択できる。
3種類の因果モデルに対して、第一のギャップ依存完全適応純粋探索アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-06-16T02:19:37Z) - Active Bayesian Causal Inference [72.70593653185078]
因果発見と推論を統合するための完全ベイズ能動学習フレームワークであるアクティブベイズ因果推論(ABCI)を提案する。
ABCIは因果関係のモデルと関心のクエリを共同で推論する。
我々のアプローチは、完全な因果グラフの学習のみに焦点を当てた、いくつかのベースラインよりも、よりデータ効率が高いことを示す。
論文 参考訳(メタデータ) (2022-06-04T22:38:57Z) - Deconfounded Score Method: Scoring DAGs with Dense Unobserved
Confounding [101.35070661471124]
本研究では,観測データ分布に特徴的フットプリントが残っており,突発的・因果的影響を解消できることを示す。
汎用ソルバで実装し,高次元問題へのスケールアップが可能なスコアベース因果検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-28T11:07:59Z) - Disentangling Observed Causal Effects from Latent Confounders using
Method of Moments [67.27068846108047]
我々は、軽度の仮定の下で、識別性と学習可能性に関する保証を提供する。
我々は,線形制約付き結合テンソル分解に基づく効率的なアルゴリズムを開発し,スケーラブルで保証可能な解を得る。
論文 参考訳(メタデータ) (2021-01-17T07:48:45Z) - Causal Bandits without prior knowledge using separating sets [3.1000291317725]
カウサル・バンディット(Causal Bandit)は、エージェントがシーケンシャルな意思決定プロセスにおいて最良のアクションを識別しなければならない古典的なバンディット問題の変種である。
これまでの文献で提案されている手法は、完全な因果グラフの正確な事前知識に依存している。
我々は、必ずしも因果知識に依存しない新たな因果バンディットアルゴリズムを定式化する。
論文 参考訳(メタデータ) (2020-09-16T20:08:03Z) - Amnesic Probing: Behavioral Explanation with Amnesic Counterfactuals [53.484562601127195]
調査結果から行動学的結論を推測できない点を指摘する。
我々は、どの情報がエンコードされているかではなく、その情報がどのように使われているかに焦点を当てた代替手段を提供する。
論文 参考訳(メタデータ) (2020-06-01T15:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。