論文の概要: Unifying Causal Inference and Reinforcement Learning using Higher-Order
Category Theory
- arxiv url: http://arxiv.org/abs/2209.06262v1
- Date: Tue, 13 Sep 2022 19:04:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:42:54.016980
- Title: Unifying Causal Inference and Reinforcement Learning using Higher-Order
Category Theory
- Title(参考訳): 高次カテゴリー理論を用いた因果推論と強化学習の統合
- Authors: Sridhar Mahadevan
- Abstract要約: 本稿では、強化学習における因果関係モデルと予測状態表現モデルの構造発見のための統一的な定式化を提案する。
具体的には、単純なオブジェクトを用いて、両方の設定で構造発見をモデル化する。
- 参考スコア(独自算出の注目度): 4.119151469153588
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a unified formalism for structure discovery of causal models and
predictive state representation (PSR) models in reinforcement learning (RL)
using higher-order category theory. Specifically, we model structure discovery
in both settings using simplicial objects, contravariant functors from the
category of ordinal numbers into any category. Fragments of causal models that
are equivalent under conditional independence -- defined as causal horns -- as
well as subsequences of potential tests in a predictive state representation --
defined as predictive horns -- are both special cases of horns of a simplicial
object, subsets resulting from the removal of the interior and the face
opposite a particular vertex. Latent structure discovery in both settings
involve the same fundamental mathematical problem of finding extensions of
horns of simplicial objects through solving lifting problems in commutative
diagrams, and exploiting weak homotopies that define higher-order symmetries.
Solutions to the problem of filling "inner" vs "outer" horns leads to various
notions of higher-order categories, including weak Kan complexes and
quasicategories. We define the abstract problem of structure discovery in both
settings in terms of adjoint functors between the category of universal causal
models or universal decision models and its simplicial object representation.
- Abstract(参考訳): 高次圏論を用いた強化学習(RL)における因果関係モデルと予測状態表現(PSR)モデルの構造発見のための統一的な定式化を提案する。
具体的には、順序数圏から任意の圏への反変関手である単純オブジェクトを用いて、両方の設定で構造発見をモデル化する。
条件付き独立の下で等価な因果モデルの断片(因果角として定義される)と、予測状態表現における潜在的なテストのサブシーケンス(予測角として定義される)は、どちらも単純な対象のホーンの特別なケースであり、内部と特定の頂点の反対の面の除去によって生じる部分集合である。
両方の設定における潜在構造発見は、可換図形の持ち上げ問題を解くことで、単純対象の角の拡張を見つけることや、高階対称性を定義する弱いホモトピーを利用するという、同じ基本的な数学的問題を含む。
インナー」と「アウト」のホーンを満たす問題に対する解は、弱いカン錯体や準カテゴリを含む高次圏の様々な概念をもたらす。
我々は、普遍因果モデルや普遍決定モデルのカテゴリと、その単純対象表現との間の随伴関手の観点から、両方の設定における構造発見の抽象的問題を定義する。
関連論文リスト
- What makes Models Compositional? A Theoretical View: With Supplement [60.284698521569936]
本稿では,構成関数の一般神経-記号的定義とその構成複雑性について述べる。
既存の汎用および特殊目的のシーケンス処理モデルがこの定義にどのように適合しているかを示し、それらを用いて構成複雑性を分析する。
論文 参考訳(メタデータ) (2024-05-02T20:10:27Z) - Algebraic Models for Qualified Aggregation in General Rough Sets, and
Reasoning Bias Discovery [0.0]
この研究は、懐疑的、悲観的、楽観的、あるいは懐疑的な人間の推論の集約をモデル化したいという欲求に動機づけられている。
このモデルは、人間の推論における差別的・有害な行動の研究や、そのような行動を学ぶ機械学習アルゴリズムに適している。
論文 参考訳(メタデータ) (2023-08-30T17:07:54Z) - Causal models in string diagrams [0.0]
因果モデル(英語版)の枠組みは、今日多くの科学的領域で適用されている因果推論に対する原則化されたアプローチを提供する。
本稿では,この枠組みを,圏論を用いて形式的に解釈した文字列図形言語に提示する。
因果モデルフレームワークによる因果推論は、最も自然かつ直感的に図式推論として行われることを議論し、実証する。
論文 参考訳(メタデータ) (2023-04-15T21:54:48Z) - Finding Alignments Between Interpretable Causal Variables and
Distributed Neural Representations [62.65877150123775]
因果抽象化は、説明可能な人工知能のための有望な理論的枠組みである。
既存の因果抽象法では、高レベルモデルと低レベルモデルの間のアライメントをブルートフォースで探索する必要がある。
これらの制約を克服する分散アライメントサーチ(DAS)を提案する。
論文 参考訳(メタデータ) (2023-03-05T00:57:49Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Invertible bimodule categories and generalized Schur orthogonality [0.0]
我々は、与えられた双加群圏が可逆であるかどうかを決定するために、弱ホップ代数の一般化を用いる。
可逆性の条件はMPO-インジェクティビティの概念と等価であることを示す。
論文 参考訳(メタデータ) (2022-11-03T16:34:01Z) - On The Universality of Diagrams for Causal Inference and The Causal
Reproducing Property [4.119151469153588]
本稿では、因果推論の根底にある普遍性を定義する圏論に基づく枠組みを提案する。
普遍因果推論における2つの基礎的結果を示す。
論文 参考訳(メタデータ) (2022-07-06T18:54:15Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z) - Models of zero-range interaction for the bosonic trimer at unitarity [91.3755431537592]
ゼロ範囲の2体相互作用によって相互に結合された同一ボソンからなる3体系に対する量子ハミルトニアンの構成について述べる。
プレゼンテーションの大部分では、無限の散乱長が考慮される。
論文 参考訳(メタデータ) (2020-06-03T17:54:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。