論文の概要: Backward explanations via redefinition of predicates
- arxiv url: http://arxiv.org/abs/2408.02606v1
- Date: Mon, 5 Aug 2024 16:31:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 12:46:43.101466
- Title: Backward explanations via redefinition of predicates
- Title(参考訳): 述語の再定義による後方説明
- Authors: Léo Saulières, Martin C. Cooper, Florence Dupin de Saint Cyr,
- Abstract要約: ヒストリーeXplanation(HXP)は、強化学習(RL)エージェントの環境との相互作用のシーケンスにおける挙動を研究する。
アクション重要度スコアは、履歴中の各アクションに対して計算される。
その説明は、ユーザに最も重要なアクションを表示することである。
我々は,これらの履歴について,スコアを近似することなく説明を行うため,backward-HXPと呼ばれる新しいHXP法を提案する。
- 参考スコア(独自算出の注目度): 2.4988368806526684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: History eXplanation based on Predicates (HXP), studies the behavior of a Reinforcement Learning (RL) agent in a sequence of agent's interactions with the environment (a history), through the prism of an arbitrary predicate. To this end, an action importance score is computed for each action in the history. The explanation consists in displaying the most important actions to the user. As the calculation of an action's importance is #W[1]-hard, it is necessary for long histories to approximate the scores, at the expense of their quality. We therefore propose a new HXP method, called Backward-HXP, to provide explanations for these histories without having to approximate scores. Experiments show the ability of B-HXP to summarise long histories.
- Abstract(参考訳): 述語(HXP)に基づく歴史eXplanationは、任意の述語のプリズムを通して、エージェントと環境(歴史)との相互作用のシーケンスにおける強化学習(RL)エージェントの挙動を研究する。
この目的のために、履歴中の各アクションに対してアクション重要度スコアが算出される。
その説明は、ユーザに最も重要なアクションを表示することである。
アクションの重要性の計算は#W[1]-hardであるため、その品質を犠牲にしてスコアを近似するには長い歴史が必要である。
そこで我々は,これらの履歴について,スコアを近似せずに説明するための新しいHXP法であるbackward-HXPを提案する。
実験は、B-HXPが長い歴史を要約する能力を示している。
関連論文リスト
- P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task [94.08478298711789]
Embodied Everyday Taskは、インボディードAIコミュニティで人気のあるタスクである。
自然言語命令は明示的なタスクプランニングを欠くことが多い。
タスク環境に関する知識をモデルに組み込むには、広範囲なトレーニングが必要である。
論文 参考訳(メタデータ) (2024-09-17T15:29:34Z) - Harnessing Temporal Causality for Advanced Temporal Action Detection [53.654457142657236]
本稿では,因果的注意と因果的マンバを組み合わせたCausalTADを提案する。
Ego4D Challenge 2024では,EPIC-Kitchens Challenge 2024では行動認識,行動検出,音声によるインタラクション検出トラックで1位,Ego4D Challenge 2024ではMoment Queriesトラックで1位にランクインした。
論文 参考訳(メタデータ) (2024-07-25T06:03:02Z) - Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data [76.90128359866462]
本稿では,出力確率と事前学習データ頻度の相関を計測する,記憶化,分布記憶化という拡張概念を導入する。
本研究は, より単純で知識集約的なタスクにおいて, 記憶がより大きな役割を担い, 一般化が, より困難で推論に基づくタスクの鍵であることを示す。
論文 参考訳(メタデータ) (2024-07-20T21:24:40Z) - Previously on the Stories: Recap Snippet Identification for Story
Reading [51.641565531840186]
本稿では,手作り評価データセットを用いたRecap Snippet Identificationと呼ばれる,この有用なタスクに関する最初のベンチマークを提案する。
本実験により,提案課題は,提案課題がスニペット間のプロット相関の深い理解を必要とするため,PLM,LSM,および提案手法に難題であることが判明した。
論文 参考訳(メタデータ) (2024-02-11T18:27:14Z) - Exploring the Limits of Historical Information for Temporal Knowledge
Graph Extrapolation [59.417443739208146]
本稿では,歴史的コントラスト学習の新しい学習枠組みに基づくイベント予測モデルを提案する。
CENETは、最も潜在的なエンティティを識別するために、歴史的および非歴史的依存関係の両方を学ぶ。
提案したモデルを5つのベンチマークグラフで評価する。
論文 参考訳(メタデータ) (2023-08-29T03:26:38Z) - Learning to Select the Relevant History Turns in Conversational Question
Answering [27.049444003555234]
関連する履歴の選択と正しい回答予測の依存関係は興味深いが、探索されていない領域である。
本稿では,まず,すべての履歴ターンのコンテキストと質問エンティティを生成するフレームワークであるDHS-ConvQAを提案する。
関連ターンの選択は、元の質問を書き換えるよりも有効であることを示す。
論文 参考訳(メタデータ) (2023-08-04T12:59:39Z) - A Graph-guided Multi-round Retrieval Method for Conversational
Open-domain Question Answering [52.041815783025186]
本稿では,会話のターン間の回答間の関係をモデル化するグラフ誘導検索手法を提案する。
また,検索コンテキストが現在の質問理解に与える影響を検討するために,マルチラウンド関連フィードバック手法を導入することを提案する。
論文 参考訳(メタデータ) (2021-04-17T04:39:41Z) - Document-level Event Extraction with Efficient End-to-end Learning of
Cross-event Dependencies [37.96254956540803]
本稿では,構造化予測アルゴリズムであるDeep Value Networks (DVN) を利用したエンドツーエンドモデルを提案する。
提案手法はACE05上でのCRFモデルに匹敵する性能を達成し,計算効率は極めて高い。
論文 参考訳(メタデータ) (2020-10-24T05:28:16Z) - Document-Level Event Role Filler Extraction using Multi-Granularity
Contextualized Encoding [40.13163091122463]
イベントロールフィラーに対応するテキストの幅を決定するために、より大きなコンテキストのビューを必要とするため、イベント抽出は難しいタスクである。
まず、文書レベルのロールフィラー抽出において、エンドツーエンドのニューラルシーケンスモデルがどのように機能するかを検討する。
私たちの最高のシステムは、以前の作業よりもかなり優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2020-05-13T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。