Fugu-MT 論文翻訳(概要): Towards a Research Community in Interpretable Reinforcement Learning: the InterpPol Workshop

論文の概要: Towards a Research Community in Interpretable Reinforcement Learning: the InterpPol Workshop

arxiv url: http://arxiv.org/abs/2404.10906v1
Date: Tue, 16 Apr 2024 20:53:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-18 17:52:27.100222
Title: Towards a Research Community in Interpretable Reinforcement Learning: the InterpPol Workshop
Title（参考訳）: 解釈型強化学習研究コミュニティに向けて:InterpPol Workshop
Authors: Hector Kohler, Quentin Delfosse, Paul Festor, Philippe Preux,
Abstract要約: 本質的に説明可能な強化学習の追求を受け入れることは、重要な疑問を提起する。透明性が不可欠であるドメインの外で、説明可能なエージェントと解釈可能なエージェントを開発するべきか? ユーザスタディなしで、ポリシーの解釈可能性をどのように厳格に定義し、測定するか。
参考スコア（独自算出の注目度）: 7.630967411418269
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Embracing the pursuit of intrinsically explainable reinforcement learning raises crucial questions: what distinguishes explainability from interpretability? Should explainable and interpretable agents be developed outside of domains where transparency is imperative? What advantages do interpretable policies offer over neural networks? How can we rigorously define and measure interpretability in policies, without user studies? What reinforcement learning paradigms,are the most suited to develop interpretable agents? Can Markov Decision Processes integrate interpretable state representations? In addition to motivate an Interpretable RL community centered around the aforementioned questions, we propose the first venue dedicated to Interpretable RL: the InterpPol Workshop.
Abstract（参考訳）: 本質的に説明可能な強化学習の追求は、説明可能性と解釈可能性とを区別する重要な疑問を提起する。透明性が不可欠であるドメインの外で、説明可能なエージェントと解釈可能なエージェントを開発するべきか? ニューラルネットワークよりも解釈可能なポリシは,どのようなメリットがあるのでしょう? ユーザスタディなしで、ポリシーの解釈可能性をどのように厳格に定義し、測定するか。どんな強化学習パラダイムが、解釈可能なエージェントを開発するのに最も適しているのか? マルコフ決定プロセスは解釈可能な状態表現を統合することができるか? 上記の質問を中心にした解釈可能なRLコミュニティのモチベーションに加えて,解釈可能なRLのための最初の会場であるInterpPol Workshopを提案する。

関連論文リスト

The Pragmatic Mind of Machines: Tracing the Emergence of Pragmatic Competence in Large Language Models [6.187227278086245]
大規模言語モデル(LLM)は、不規則な解決や推論の理論を含む社会的知性に新たな能力を示す。本研究では,異なる学習段階におけるLLMが話者意図を正確に推測できるかどうかを評価する。プレトレーニング後, 教師付き微調整(SFT), 選好最適化の3段階にわたる22個のLDMを系統的に評価した。
論文参考訳（メタデータ） (2025-05-24T04:24:59Z)
A Theoretical Framework for Explaining Reinforcement Learning with Shapley Values [0.0]
強化学習エージェントは複雑な意思決定タスクにおいて超人的パフォーマンスを達成することができるが、その振る舞いを理解することはしばしば困難である。我々は、強化学習エージェントの総合的な視点を提供する3つの中核的説明対象を特定した。本研究では,エージェントが環境下で観察する個々の特徴の影響を利用して,これらの強化学習エージェントの3つの要素を説明するための統一的理論的枠組みを開発する。
論文参考訳（メタデータ） (2025-05-12T17:48:28Z)
Understanding Understanding: A Pragmatic Framework Motivated by Large Language Models [13.279760256875127]
チューリングテストの手法では、このフレームワークはエージェントのパフォーマンスのみをベースとしており、特にその答えの正確さに基づいている。ランダムサンプリングによる高い信頼度と確率的信頼境界の適用性を示す。
論文参考訳（メタデータ） (2024-06-16T13:37:08Z)
Crafting Interpretable Embeddings by Asking LLMs Questions [89.49960984640363]
大規模言語モデル(LLM)は、自然言語処理タスクの増大に対して、テキスト埋め込みを急速に改善した。質問応答埋め込み (QA-Emb) を導入し, 各特徴がLLMに対して質問された質問に対する回答を表す。我々はQA-Embを用いて、言語刺激に対するfMRIボクセル応答を予測するための解釈可能なモデルを柔軟に生成する。
論文参考訳（メタデータ） (2024-05-26T22:30:29Z)
Clarify When Necessary: Resolving Ambiguity Through Interaction with LMs [58.620269228776294]
そこで本稿では,ユーザに対して,あいまいさを解消するためのタスク非依存のフレームワークを提案する。我々は3つのNLPアプリケーション(質問応答、機械翻訳、自然言語推論)にまたがるシステムを評価する。インテントシムは堅牢であり、幅広いNLPタスクやLMの改善を実証している。
論文参考訳（メタデータ） (2023-11-16T00:18:50Z)
Understanding Self-Supervised Learning of Speech Representation via Invariance and Redundancy Reduction [0.45060992929802207]
自己教師付き学習(SSL)は、ラベルのないデータから柔軟な音声表現を学習するための有望なパラダイムとして登場した。本研究は,人間の知覚における冗長性低下の理論に触発されたSSL技術であるBarlow Twins(BT)を実証分析した。
論文参考訳（メタデータ） (2023-09-07T10:23:59Z)
Abstracting Concept-Changing Rules for Solving Raven's Progressive Matrix Problems [54.26307134687171]
Raven's Progressive Matrix (RPM) は、候補者の中から選択することで、機械知能においてそのような能力を実現する古典的なテストである。近年の研究では、RPMの解法はルールの深い理解を促進することが示唆されている。本稿では、解釈可能な概念を学習し、潜在空間における概念変更ルールを解析することにより、概念変更ルールABstraction(CRAB)の潜時変数モデルを提案する。
論文参考訳（メタデータ） (2023-07-15T07:16:38Z)
DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文参考訳（メタデータ） (2023-06-15T10:41:23Z)
Interpretable and Explainable Logical Policies via Neurally Guided Symbolic Abstraction [23.552659248243806]
ニューラルgUided Differentiable loGic policiEs (NUDGE)を紹介する。 NUDGEは、トレーニングされたニューラルネットワークベースのエージェントを使用して、候補重み付けされたロジックルールの探索をガイドし、差別化可能なロジックを使用してロジックエージェントをトレーニングする。実験により, NUDGEエージェントは, 純粋に神経性に優れ, 初期状態や問題の大きさの異なる環境に対して良好な柔軟性を示しながら, 解釈可能かつ説明可能なポリシーを誘導できることを示した。
論文参考訳（メタデータ） (2023-06-02T10:59:44Z)
A Survey on Interpretable Reinforcement Learning [28.869513255570077]
本調査は、強化学習(RL)における高い解釈可能性を実現するための様々なアプローチの概要を提供する。我々は、解釈可能性(モデルの特性として)と説明可能性(プロキシの介入によるポストホック操作として)を区別する。我々は、解釈可能なRLは、解釈可能な入力、解釈可能な(遷移/回帰)モデル、解釈可能な意思決定など、異なる側面を受け入れることができると主張している。
論文参考訳（メタデータ） (2021-12-24T17:26:57Z)
i-Algebra: Towards Interactive Interpretability of Deep Neural Networks [41.13047686374529]
i-Algebraはディープニューラルネットワーク(DNN)を解釈するための対話型フレームワークである。その中核は原子、構成可能な演算子のライブラリであり、さまざまな入力粒度、異なる推論段階、および異なる解釈の視点からモデル挙動を説明する。我々は,敵入力の検査,モデル不整合の解消,汚染データのクリーン化など,一連の代表的分析タスクでユーザ研究を行い,その有望なユーザビリティを示す。
論文参考訳（メタデータ） (2021-01-22T19:22:57Z)
Explainability in Deep Reinforcement Learning [68.8204255655161]
説明可能な強化学習(XRL)の実現に向けての最近の成果を概観する。エージェントの振る舞いを正当化し、説明することが不可欠である重要な状況において、RLモデルのより良い説明可能性と解釈性は、まだブラックボックスと見なされているものの内部動作に関する科学的洞察を得るのに役立つ。
論文参考訳（メタデータ） (2020-08-15T10:11:42Z)
Emergence of Pragmatics from Referential Game between Theory of Mind Agents [64.25696237463397]
エージェントが手書きのルールを指定せずに「行間を読む」能力を自発的に学習するアルゴリズムを提案する。協調型マルチエージェント教育状況における心の理論(ToM)を統合し,適応型強化学習(RL)アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-01-21T19:37:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。