Fugu-MT 論文翻訳(概要): A Closer Look at Reward Decomposition for High-Level Robotic Explanations

論文の概要: A Closer Look at Reward Decomposition for High-Level Robotic Explanations

arxiv url: http://arxiv.org/abs/2304.12958v2
Date: Sat, 4 Nov 2023 00:42:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-07 23:09:01.312019
Title: A Closer Look at Reward Decomposition for High-Level Robotic Explanations
Title（参考訳）: 高レベルロボット説明のための逆解法について
Authors: Wenhao Lu, Xufeng Zhao, Sven Magg, Martin Gromniak, Mengdi Li, Stefan Wermter
Abstract要約: 本稿では、報酬分解と抽象的な行動空間を組み合わせたQ-Map学習フレームワークを提案する。本稿では,2つのロボットシナリオの定量的,定性的な分析を通じて,本フレームワークの有効性を実証する。
参考スコア（独自算出の注目度）: 18.019811754800767
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Explaining the behaviour of intelligent agents learned by reinforcement learning (RL) to humans is challenging yet crucial due to their incomprehensible proprioceptive states, variational intermediate goals, and resultant unpredictability. Moreover, one-step explanations for RL agents can be ambiguous as they fail to account for the agent's future behaviour at each transition, adding to the complexity of explaining robot actions. By leveraging abstracted actions that map to task-specific primitives, we avoid explanations on the movement level. To further improve the transparency and explainability of robotic systems, we propose an explainable Q-Map learning framework that combines reward decomposition (RD) with abstracted action spaces, allowing for non-ambiguous and high-level explanations based on object properties in the task. We demonstrate the effectiveness of our framework through quantitative and qualitative analysis of two robotic scenarios, showcasing visual and textual explanations, from output artefacts of RD explanations, that are easy for humans to comprehend. Additionally, we demonstrate the versatility of integrating these artefacts with large language models (LLMs) for reasoning and interactive querying.
Abstract（参考訳）: 強化学習(RL)によって人間に学習された知的エージェントの振る舞いを説明することは、理解不能な先天受容状態、変分中間目標、そして結果として予測不可能であるために、非常に難しい。さらに、RLエージェントの1段階の説明は、各遷移におけるエージェントの将来の振る舞いを説明できないため曖昧になり、ロボットアクションを説明する複雑さが増す。タスク固有のプリミティブにマップする抽象的なアクションを活用することで、動作レベルの説明を避けることができる。ロボットシステムの透明性と説明可能性をさらに向上するために,報酬分解(RD)と抽象的な行動空間を組み合わせたQ-Map学習フレームワークを提案する。本研究では,人間の理解が容易なRD説明の出力成果から視覚的・テキスト的説明を提示する,2つのシナリオの定量的・定性的な分析を通じて,フレームワークの有効性を実証する。さらに,これらのアーティファクトを大規模言語モデル(llm)に統合し,推論と対話的なクエリを行う汎用性を示す。

関連論文リスト

Incentivizing Multimodal Reasoning in Large Models for Direct Robot Manipulation [89.5123417007126]
空間的行動空間をLMM(Large Multimodal Models)に理解させる方法について述べる。また,これらの課題を解決する上で,LMMの推論能力を完全に活用する方法を示す。その結果、ReasonManipという名前の7Bバックボーン上に構築された推論モデルは、3つの顕著な利点を示しています。
論文参考訳（メタデータ） (2025-05-19T06:00:14Z)
VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.59849798539312]
本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文参考訳（メタデータ） (2024-10-30T16:11:05Z)
From Feature Importance to Natural Language Explanations Using LLMs with RAG [4.204990010424084]
大規模言語モデル(LLM)の応答に外部知識リポジトリを活用して,トレーサブルな質問応答を導入する。この知識リポジトリは、高レベルの特徴、特徴の重要性、代替確率を含む、モデルの出力に関するコンテキストの詳細を含む。社会的・因果的・選択的・コントラスト的な4つの重要な特徴を、人間の説明に関する社会科学研究から一発のプロンプトへと統合し、応答生成過程を導く。
論文参考訳（メタデータ） (2024-07-30T17:27:20Z)
Self-Explainable Affordance Learning with Embodied Caption [63.88435741872204]
具体的キャプションを具現化したSelf-Explainable Affordance Learning (SEA)を紹介する。 SEAは、ロボットが意図を明確に表現し、説明可能な視覚言語キャプションと視覚能力学習のギャップを埋めることを可能にする。本稿では, 簡便かつ効率的な方法で, 空き地と自己説明を効果的に組み合わせた新しいモデルを提案する。
論文参考訳（メタデータ） (2024-04-08T15:22:38Z)
Robotic Imitation of Human Actions [16.26334759935617]
本研究では,人間を模倣するロボットの課題に対処する,模倣学習の新しいアプローチを提案する。提案手法では, 実証されたタスクに関する情報を抽象化し, その情報を一般化し, 再現するために利用する。
論文参考訳（メタデータ） (2024-01-16T14:11:54Z)
Explaining Explainability: Towards Deeper Actionable Insights into Deep Learning through Second-order Explainability [70.60433013657693]
2階説明可能なAI(SOXAI)は、最近インスタンスレベルからデータセットレベルまで説明可能なAI(XAI)を拡張するために提案されている。そこで本研究では,SOXAIの動作可能な洞察に基づくトレーニングセットから無関係な概念を除外することで,モデルの性能を向上させることができることを示す。
論文参考訳（メタデータ） (2023-06-14T23:24:01Z)
Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small [68.879023473838]
間接オブジェクト識別 (IOI) と呼ばれる自然言語タスクにおいて, GPT-2 の小型化が果たす役割について解説する。我々の知る限り、この調査は言語モデルにおいて「野生」の自然な振る舞いをリバースエンジニアリングする最大のエンドツーエンドの試みである。
論文参考訳（メタデータ） (2022-11-01T17:08:44Z)
Inherently Explainable Reinforcement Learning in Natural Language [14.117921448623342]
本稿では,本質的に説明可能な強化学習エージェントの開発に焦点をあてる。この階層的説明可能な強化学習エージェントは、インタラクティブフィクション、テキストベースのゲーム環境で動作する。私たちのエージェントは、説明責任を第一級市民として扱うように設計されています。
論文参考訳（メタデータ） (2021-12-16T14:24:35Z)
Tell me why! -- Explanations support learning of relational and causal structure [24.434551113103105]
説明は人間の学習において重要な役割を担い、特にAIにとって大きな課題が残る分野においてである。我々は、強化学習エージェントが説明の恩恵を受ける可能性があることを示す。我々の結果は、説明からの学習が強力な原則であり、より堅牢で一般的な機械学習システムのトレーニングに有望な道筋を提供することを示唆している。
論文参考訳（メタデータ） (2021-12-07T15:09:06Z)
Are We On The Same Page? Hierarchical Explanation Generation for Planning Tasks in Human-Robot Teaming using Reinforcement Learning [0.0]
我々は、エージェント生成の説明は、人間のチームメイトが受信者の認知負荷を維持するために望む詳細のレベルに合わせて抽象化されるべきであると主張します。階層的な説明は, 認知負荷を低減しつつ, 作業性能と行動解釈性を向上することを示した。
論文参考訳（メタデータ） (2020-12-22T02:14:52Z)
Explainability in Deep Reinforcement Learning [68.8204255655161]
説明可能な強化学習(XRL)の実現に向けての最近の成果を概観する。エージェントの振る舞いを正当化し、説明することが不可欠である重要な状況において、RLモデルのより良い説明可能性と解釈性は、まだブラックボックスと見なされているものの内部動作に関する科学的洞察を得るのに役立つ。
論文参考訳（メタデータ） (2020-08-15T10:11:42Z)
A general framework for scientifically inspired explanations in AI [76.48625630211943]
我々は、AIシステムの説明を実装可能な一般的なフレームワークの理論的基盤として、科学的説明の構造の概念をインスタンス化する。このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。
論文参考訳（メタデータ） (2020-03-02T10:32:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。