論文の概要: DiffG-RL: Leveraging Difference between State and Common Sense
- arxiv url: http://arxiv.org/abs/2211.16002v1
- Date: Tue, 29 Nov 2022 07:53:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 14:43:10.704618
- Title: DiffG-RL: Leveraging Difference between State and Common Sense
- Title(参考訳): DiffG-RL: 状態と常識の違いを活用
- Authors: Tsunehiko Tanaka, Daiki Kimura, Michiaki Tatsubori
- Abstract要約: 本稿では,環境状態と常識を整理する差分グラフを構築する新しいエージェントDiffG-RLを提案する。
DiffG-RLは、常識を必要とするテキストベースのゲームの実験で検証し、スコアの17%でベースラインを上回っていることを示す。
- 参考スコア(独自算出の注目度): 6.617487928813374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Taking into account background knowledge as the context has always been an
important part of solving tasks that involve natural language. One
representative example of such tasks is text-based games, where players need to
make decisions based on both description text previously shown in the game, and
their own background knowledge about the language and common sense. In this
work, we investigate not simply giving common sense, as can be seen in prior
research, but also its effective usage. We assume that a part of the
environment states different from common sense should constitute one of the
grounds for action selection. We propose a novel agent, DiffG-RL, which
constructs a Difference Graph that organizes the environment states and common
sense by means of interactive objects with a dedicated graph encoder. DiffG-RL
also contains a framework for extracting the appropriate amount and
representation of common sense from the source to support the construction of
the graph. We validate DiffG-RL in experiments with text-based games that
require common sense and show that it outperforms baselines by 17% of scores.
The code is available at https://github.com/ibm/diffg-rl
- Abstract(参考訳): 背景知識をコンテキストとして考慮することは、自然言語に関わるタスクを解決する上で、常に重要な部分である。
そのようなタスクの代表的な例はテキストベースのゲームであり、プレイヤーは以前ゲームに表示された記述テキストと、言語と常識に関する自身のバックグラウンド知識の両方に基づいて決定を行う必要がある。
本研究では,従来の研究で見られるように,単に常識を与えるだけではなく,その有効利用も検討する。
共通の意味と異なる環境状態の一部が、行動選択の根拠の1つを構成するべきであると仮定する。
本稿では,対話型オブジェクトと専用のグラフエンコーダを用いて,環境状態と常識を整理する差分グラフを構築する新しいエージェントDiffG-RLを提案する。
DiffG-RLはまた、グラフの構築を支援するために、ソースから共通感覚の適切な量と表現を抽出するフレームワークを含んでいる。
DiffG-RLは、常識を必要とするテキストベースのゲームの実験で検証し、ベースラインを17%上回ることを示す。
コードはhttps://github.com/ibm/diffg-rlで入手できる。
関連論文リスト
- EXPLORER: Exploration-guided Reasoning for Textual Reinforcement Learning [23.83162741035859]
テキスト強化学習のための探索誘導推論剤であるEXPLORERについて述べる。
実験の結果,EXPLORERはテキストワールド調理(TW-Cooking)およびテキストワールドコモンセンス(TWC)ゲームにおいて,ベースラインエージェントよりも優れていた。
論文 参考訳(メタデータ) (2024-03-15T21:22:37Z) - SPRING: Studying the Paper and Reasoning to Play Games [102.5587155284795]
我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。
実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。
我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文 参考訳(メタデータ) (2023-05-24T18:14:35Z) - A Minimal Approach for Natural Language Action Space in Text-based Games [103.21433712630953]
本稿では,テキストベースのゲーム(TG)におけるアクション空間の探索という課題を再考する。
我々は,許容行動を利用する最小限のアプローチである$epsilon$-admissible Exploringをトレーニングフェーズに提案する。
本稿では,テキストベースのアクタ・クリティカル(TAC)エージェントを提案する。
論文 参考訳(メタデータ) (2023-05-06T16:05:27Z) - Commonsense Knowledge from Scene Graphs for Textual Environments [6.617487928813374]
シーングラフデータセットなどの視覚的データセットから得られたコモンセンス推論を利用する利点について検討する。
提案手法は既存の最先端手法よりも高い性能と競争性を有する。
論文 参考訳(メタデータ) (2022-10-19T03:09:17Z) - One-shot Scene Graph Generation [130.57405850346836]
ワンショットシーングラフ生成タスクに対して,複数の構造化知識(関係知識知識)を提案する。
提案手法は既存の最先端手法よりも大きなマージンで優れる。
論文 参考訳(メタデータ) (2022-02-22T11:32:59Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - GINet: Graph Interaction Network for Scene Parsing [58.394591509215005]
画像領域に対する文脈推論を促進するために,グラフインタラクションユニット(GIユニット)とセマンティックコンテキストロス(SC-loss)を提案する。
提案されたGINetは、Pascal-ContextやCOCO Stuffなど、一般的なベンチマークにおける最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2020-09-14T02:52:45Z) - Learning Dynamic Belief Graphs to Generalize on Text-Based Games [55.59741414135887]
テキストベースのゲームをプレイするには、自然言語処理とシーケンシャルな意思決定のスキルが必要である。
本研究では,原文からエンドツーエンドに学習したグラフ構造化表現を用いて,エージェントがテキストベースのゲームでどのように計画・一般化できるかを検討する。
論文 参考訳(メタデータ) (2020-02-21T04:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。