Fugu-MT 論文翻訳(概要): Interactive Explanations for Reinforcement-Learning Agents

論文の概要: Interactive Explanations for Reinforcement-Learning Agents

arxiv url: http://arxiv.org/abs/2504.05393v1
Date: Mon, 07 Apr 2025 18:00:50 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-17 04:24:28.212868
Title: Interactive Explanations for Reinforcement-Learning Agents
Title（参考訳）: 強化学習エージェントの対話的説明
Authors: Yotam Amitai, Ofra Amir, Guy Avni,
Abstract要約: 本稿では,ユーザの関心行動の時間的特性を記述したクエリに基づいて,その環境に作用するエージェントのビデオクリップを提示する対話型説明システムASQ-ITを提案する。提案手法は,ASQ-ITのユーザインタフェースのクエリを有限トレース(LTLf)上の線形時間論理の断片にマッピングする形式的手法に基づいており,クエリ処理のアルゴリズムはオートマチック理論に基づいている。
参考スコア（独自算出の注目度）: 10.17968794823259
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: As reinforcement learning methods increasingly amass accomplishments, the need for comprehending their solutions becomes more crucial. Most explainable reinforcement learning (XRL) methods generate a static explanation depicting their developers' intuition of what should be explained and how. In contrast, literature from the social sciences proposes that meaningful explanations are structured as a dialog between the explainer and the explainee, suggesting a more active role for the user and her communication with the agent. In this paper, we present ASQ-IT -- an interactive explanation system that presents video clips of the agent acting in its environment based on queries given by the user that describe temporal properties of behaviors of interest. Our approach is based on formal methods: queries in ASQ-IT's user interface map to a fragment of Linear Temporal Logic over finite traces (LTLf), which we developed, and our algorithm for query processing is based on automata theory. User studies show that end-users can understand and formulate queries in ASQ-IT and that using ASQ-IT assists users in identifying faulty agent behaviors.
Abstract（参考訳）: 強化学習手法がますます達成されるにつれて、解法を理解する必要性がより重要になる。最も説明可能な強化学習(XRL)手法は、開発者が説明すべきことや方法に関する直感を記述した静的な説明を生成する。対照的に、社会科学の文献では、意味のある説明は説明者と説明人の対話として構成されており、利用者とエージェントとのコミュニケーションにおいてより活発な役割を示唆している。本稿では,ユーザが興味のある行動の時間的特性を記述したクエリに基づいて,その環境に作用するエージェントのビデオクリップを提示する対話型説明システムASQ-ITを提案する。提案手法は,ASQ-ITのユーザインタフェースのクエリを有限トレース(LTLf)上の線形時間論理の断片にマッピングする形式的手法に基づいており,クエリ処理のアルゴリズムはオートマチック理論に基づいている。ユーザスタディは、エンドユーザがASQ-ITでクエリを理解し、定式化できることを示し、ASQ-ITを使用することで、エラーエージェントの動作を特定するのに役立ちます。

関連論文リスト

CLEAR-KGQA: Clarification-Enhanced Ambiguity Resolution for Knowledge Graph Question Answering [13.624962763072899]
KGQAシステムは通常、ユーザクエリは曖昧であると仮定するが、これは現実世界のアプリケーションではめったに行われない仮定である。本稿では,対話的明確化を通じて,エンティティのあいまいさ(類似した名前を持つエンティティの区別など)と意図のあいまいさ(ユーザクエリの異なる解釈を明確にするなど)を動的に扱う新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-04-13T17:34:35Z)
Understanding Learner-LLM Chatbot Interactions and the Impact of Prompting Guidelines [9.834055425277874]
本研究は,学習者とAIの相互作用を,参加者が効果的なプロンプトの構造化指導を受ける教育実験を通して調査する。ユーザの行動を評価し,有効性を促進するために,107人のユーザから642のインタラクションのデータセットを解析した。我々の研究は、ユーザーが大規模言語モデルとどのように関わり、AI支援コミュニケーションを強化するための構造化された指導の役割についてより深く理解している。
論文参考訳（メタデータ） (2025-04-10T15:20:43Z)
QLASS: Boosting Language Agent Inference via Q-Guided Stepwise Search [89.97082652805904]
提案するQLASS(Q-guided Language Agent Stepwise Search)は,Q-valueを推定してアノテーションを自動的に生成する。ステップワイズガイダンスにより、言語エージェントが長期的価値に適応できるようにQ誘導型生成戦略を提案する。我々はQLASSが質的分析によってより効果的な意思決定につながることを実証的に実証した。
論文参考訳（メタデータ） (2025-02-04T18:58:31Z)
Online inductive learning from answer sets for efficient reinforcement learning exploration [52.03682298194168]
エージェントポリシーの近似を説明可能な近似を表す論理規則の集合を学習するために,帰納的な解集合プログラムの学習を利用する。次に、学習ルールに基づいて回答セット推論を行い、次のバッチで学習エージェントの探索をガイドします。本手法は,初回トレーニングにおいても,エージェントが達成した割引リターンを著しく向上させる。
論文参考訳（メタデータ） (2025-01-13T16:13:22Z)
Understanding Large Language Model Behaviors through Interactive Counterfactual Generation and Analysis [22.755345889167934]
本稿では,大規模言語モデル (LLM) の対実解析による探索を可能にする対話型可視化システムを提案する。本システムは,意味論的に意味のある反事実を生成する新しいアルゴリズムを特徴とする。 LLM実践者とのユーザスタディと専門家とのインタビューは、システムのユーザビリティと有効性を示している。
論文参考訳（メタデータ） (2024-04-23T19:57:03Z)
Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文参考訳（メタデータ） (2023-12-22T17:57:57Z)
FIND: A Function Description Benchmark for Evaluating Interpretability Methods [86.80718559904854]
本稿では,自動解釈可能性評価のためのベンチマークスイートであるFIND(Function Interpretation and Description)を紹介する。 FINDには、トレーニングされたニューラルネットワークのコンポーネントに似た機能と、私たちが生成しようとしている種類の記述が含まれています。本研究では、事前訓練された言語モデルを用いて、自然言語とコードにおける関数の振る舞いの記述を生成する手法を評価する。
論文参考訳（メタデータ） (2023-09-07T17:47:26Z)
AVIS: Autonomous Visual Information Seeking with Large Language Model Agent [123.75169211547149]
本稿では,視覚的質問応答フレームワークAVISを提案する。本手法は,LLM(Large Language Model)を利用して外部ツールの利用を動的に強化する。 AVIS は Infoseek や OK-VQA などの知識集約型視覚質問応答ベンチマークの最先端結果を達成する。
論文参考訳（メタデータ） (2023-06-13T20:50:22Z)
Causal Explanations for Sequential Decision-Making in Multi-Agent Systems [31.674391914683888]
CEMAは、シーケンシャルなマルチエージェントシステムにおけるエージェントの決定を因果自然言語で説明するためのフレームワークである。 CEMAは,他のエージェントが多数存在する場合でも,エージェントの決定の背後にある原因を正しく識別する。我々は,CEMAの説明が参加者の自動運転車への信頼に肯定的な影響を及ぼすことを示す。
論文参考訳（メタデータ） (2023-02-21T16:34:07Z)
ASQ-IT: Interactive Explanations for Reinforcement-Learning Agents [7.9603223299524535]
本稿では,ユーザが興味のある行動の時間的特性を記述したクエリに基づいて,その環境に作用するエージェントのビデオクリップを提示する対話型ツールASQ-ITを提案する。提案手法は,ASQ-ITのユーザインタフェースのクエリを有限トレース(LTLf)上の線形時間論理の断片にマッピングする形式的手法に基づいており,クエリ処理のアルゴリズムはオートマチック理論に基づいている。
論文参考訳（メタデータ） (2023-01-24T11:57:37Z)
Semantic Interactive Learning for Text Classification: A Constructive Approach for Contextual Interactions [0.0]
本稿では,テキスト領域に対するセマンティック対話学習という新しいインタラクションフレームワークを提案する。構築的および文脈的フィードバックを学習者に取り入れることで、人間と機械間のよりセマンティックなアライメントを実現するアーキテクチャを見つけることができる。本研究では,人間の概念的修正を非外挿訓練例に翻訳するのに有効なSemanticPushという手法を提案する。
論文参考訳（メタデータ） (2022-09-07T08:13:45Z)
Generating User-Centred Explanations via Illocutionary Question Answering: From Philosophy to Interfaces [3.04585143845864]
我々は、AIアルゴリズムの洗練されたパイプラインに基づく対話型説明を生成するための新しいアプローチを示す。我々の貢献は、コンピュータフレンドリーな方法でイロカチオンをフレーム化して、統計的質問応答によるユーザ中央集権性を実現するためのアプローチである。 XAIをベースとした2つのシステムにおいて,60名以上の参加者を対象とするユーザスタディを用いて仮説を検証した。
論文参考訳（メタデータ） (2021-10-02T09:06:36Z)
From Philosophy to Interfaces: an Explanatory Method and a Tool Inspired by Achinstein's Theory of Explanation [3.04585143845864]
人工知能(AI)における新しい説明法を提案する。我々は、AIアルゴリズムのパイプラインに基づいた対話型説明を生成するための新しいアプローチを示す。我々はIBMによるよく知られたXAIによる信用承認システムで仮説を検証した。
論文参考訳（メタデータ） (2021-09-09T11:10:03Z)
A general framework for scientifically inspired explanations in AI [76.48625630211943]
我々は、AIシステムの説明を実装可能な一般的なフレームワークの理論的基盤として、科学的説明の構造の概念をインスタンス化する。このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。
論文参考訳（メタデータ） (2020-03-02T10:32:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。