Fugu-MT 論文翻訳(概要): Causal Explanation for Reinforcement Learning: Quantifying State and Temporal Importance

論文の概要: Causal Explanation for Reinforcement Learning: Quantifying State and Temporal Importance

arxiv url: http://arxiv.org/abs/2210.13507v1
Date: Mon, 24 Oct 2022 18:03:27 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-26 13:36:53.192612
Title: Causal Explanation for Reinforcement Learning: Quantifying State and Temporal Importance
Title（参考訳）: 強化学習のための因果説明:状態と時間的重要性の定量化
Authors: Xiaoxiao Wang, Fanyu Meng, Zhaodan Kong, Xin Chen, Xin Liu
Abstract要約: 人間は因果レンズから世界を見るので、関連性のあるものよりも因果説明を好む。我々は、行動における状態の因果的重要性と時間的重要性を定量化する因果的説明機構を開発する。我々は、RL政策の説明の観点から、最先端のアソシエーション手法に対する我々のメカニズムの利点を実証する。
参考スコア（独自算出の注目度）: 7.763943187090315
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Explainability plays an increasingly important role in machine learning. Because reinforcement learning (RL) involves interactions between states and actions over time, explaining an RL policy is more challenging than that of supervised learning. Furthermore, humans view the world from causal lens and thus prefer causal explanations over associational ones. Therefore, in this paper, we develop a causal explanation mechanism that quantifies the causal importance of states on actions and such importance over time. Moreover, via a series of simulation studies including crop irrigation, Blackjack, collision avoidance, and lunar lander, we demonstrate the advantages of our mechanism over state-of-the-art associational methods in terms of RL policy explanation.
Abstract（参考訳）: 説明責任は機械学習においてますます重要な役割を果たす。強化学習(RL)は、時間とともに状態と行動の間の相互作用を伴うため、RLポリシーを説明することは教師付き学習よりも難しい。さらに、人間は因果レンズから世界を見るため、関連レンズよりも因果説明を好む。そこで本稿では,行動における状態の因果的重要性と時間的重要性を定量化する因果的説明機構を開発する。さらに, 農作物の灌水, ブラックジャック, 衝突回避, 月面着陸などのシミュレーション研究を通じて, RL政策の説明の観点から, 最先端の連成手法に対する我々のメカニズムの利点を実証した。

関連論文リスト

Learning Nonlinear Causal Reductions to Explain Reinforcement Learning Policies [50.30741668990102]
我々は、強化学習政策の行動を説明するための因果的視点を採っている。我々はこれらの関係を説明する単純化された高レベルの因果関係モデルを学ぶ。非線形因果モデルのクラスに対して、一意の解が存在することを証明する。
論文参考訳（メタデータ） (2025-07-20T10:25:24Z)
Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers [76.42159902257677]
我々は、両方の行動は、アウト・オブ・コンテクスト推論(OCR)として知られる単一のメカニズムに由来すると論じる。 OCRは、関連する概念が因果関係であるかによって、一般化と幻覚の両方を駆動する。我々の研究は、OCR現象を理解するための理論的基盤を提供し、知識注入から望ましくない行動を分析し緩和するための新しいレンズを提供する。
論文参考訳（メタデータ） (2025-06-12T16:50:45Z)
Failure Modes of LLMs for Causal Reasoning on Narratives [51.19592551510628]
世界の知識と論理的推論の相互作用について検討する。最先端の大規模言語モデル(LLM)は、しばしば表面的な一般化に依存している。タスクの単純な再構成により、より堅牢な推論行動が引き起こされることを示す。
論文参考訳（メタデータ） (2024-10-31T12:48:58Z)
The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning [70.16523526957162]
常識の因果関係を理解することは、人々が現実世界の原理をよりよく理解するのに役立ちます。その重要性にもかかわらず、このトピックの体系的な探索は特に欠落している。本研究の目的は、体系的な概要の提供、最近の進歩に関する学者の更新、初心者のための実践的なガイドを提供することである。
論文参考訳（メタデータ） (2024-06-27T16:30:50Z)
Fundamental Properties of Causal Entropy and Information Gain [0.22252684361733285]
最近の進歩は、構造因果モデル(SCM)による因果制御の定量化を可能にする因果的エントロピーと因果的情報ゲインと名付けられた尺度は、因果性が重要な役割を果たす機械学習タスクに対する既存の情報理論的アプローチの限界に対処することを目的としている。
論文参考訳（メタデータ） (2024-02-02T11:55:57Z)
Emergence and Causality in Complex Systems: A Survey on Causal Emergence and Related Quantitative Studies [12.78006421209864]
因果発生理論は出現を定量化するために因果関係の尺度を用いる。因果の出現を定量化し、データを識別する。因果表現学習,因果モデル抽象化,世界モデルに基づく強化学習によって,因果表現の出現を識別するアーキテクチャが共有されることを強調した。
論文参考訳（メタデータ） (2023-12-28T04:20:46Z)
Targeted Reduction of Causal Models [55.11778726095353]
因果表現学習(Causal Representation Learning)は、シミュレーションで解釈可能な因果パターンを明らかにするための有望な道を提供する。本稿では、複雑な相互作用可能なモデルを因果因子の簡潔な集合に凝縮する方法であるTCR(Targeted Causal Reduction)を紹介する。複雑なモデルから解釈可能な高レベルな説明を生成する能力は、玩具や機械システムで実証されている。
論文参考訳（メタデータ） (2023-11-30T15:46:22Z)
Learning Causally Disentangled Representations via the Principle of Independent Causal Mechanisms [17.074858228123706]
本稿では、因果関係の観測ラベルによって教師される因果関係の非絡み合い表現を学習するための枠組みを提案する。この枠組みは, 極めて不整合な因果関係を生じさせ, 介入の堅牢性を向上し, 反事実発生と相容れないことを示す。
論文参考訳（メタデータ） (2023-06-02T00:28:48Z)
Guiding Visual Question Answering with Attention Priors [76.21671164766073]
本稿では,言語・視覚的接地による注意機構の導出について述べる。この基礎は、クエリ内の構造化言語概念を視覚オブジェクト間の参照物に接続することで導かれる。このアルゴリズムは、注意に基づく推論モデルを調べ、関連する連想的知識を注入し、コア推論プロセスを制御する。
論文参考訳（メタデータ） (2022-05-25T09:53:47Z)
Causality in Neural Networks -- An Extended Abstract [0.0]
因果推論は、人間が使用する主要な学習および説明ツールである。因果性の概念を機械学習に導入することは、より良い学習と説明可能なモデルを提供するのに役立つ。
論文参考訳（メタデータ） (2021-06-03T09:52:36Z)
Towards Causal Representation Learning [96.110881654479]
機械学習とグラフィカル因果関係の2つの分野が生まれ、別々に発展した。現在、他分野の進歩の恩恵を受けるために、クロスポリン化と両方の分野への関心が高まっている。
論文参考訳（メタデータ） (2021-02-22T15:26:57Z)
Thinking About Causation: A Causal Language with Epistemic Operators [58.720142291102135]
我々はエージェントの状態を表すことで因果モデルの概念を拡張した。対象言語の側面には、知識を表現する演算子や、新しい情報を観察する行為が追加されます。我々は、論理の健全かつ完全な公理化を提供し、このフレームワークと因果的チーム意味論との関係について論じる。
論文参考訳（メタデータ） (2020-10-30T12:16:45Z)
Explain and Improve: LRP-Inference Fine-Tuning for Image Captioning Models [82.3793660091354]
本稿では,注意を可視化する以外に,注意機構を付加した画像キャプションモデルの予測について分析する。我々は,注意機構を備えた画像キャプションモデルに適したレイヤワイド関連伝搬(LRP)と勾配に基づく説明法を開発した。
論文参考訳（メタデータ） (2020-01-04T05:15:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。