論文の概要: Knowledge-enhanced Agents for Interactive Text Games
- arxiv url: http://arxiv.org/abs/2305.05091v1
- Date: Mon, 8 May 2023 23:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 14:24:16.830255
- Title: Knowledge-enhanced Agents for Interactive Text Games
- Title(参考訳): 対話型テキストゲームのための知識強化エージェント
- Authors: Prateek Chhikara, Jiarui Zhang, Filip Ilievski, Jonathan Francis and
Kaixin Ma
- Abstract要約: テキストベースゲームにおける学習エージェントの機能的グラウンド化を改善するためのフレームワークを提案する。
学習に基づくエージェントに注入するドメイン知識の2つの形態について考察する。
我々のフレームワークは、純粋強化学習(RL)エージェント、知識グラフで強化されたRLエージェント、言語モデルを備えたエージェントの3つの代表的なモデルクラスをサポートしている。
- 参考スコア(独自算出の注目度): 8.48785234607963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Communication via natural language is a crucial aspect of intelligence, and
it requires computational models to learn and reason about world concepts, with
varying levels of supervision. While there has been significant progress made
on fully-supervised non-interactive tasks, such as question-answering and
procedural text understanding, much of the community has turned to various
sequential interactive tasks, as in semi-Markov text-based games, which have
revealed limitations of existing approaches in terms of coherence, contextual
awareness, and their ability to learn effectively from the environment. In this
paper, we propose a framework for enabling improved functional grounding of
agents in text-based games. Specifically, we consider two forms of domain
knowledge that we inject into learning-based agents: memory of previous correct
actions and affordances of relevant objects in the environment. Our framework
supports three representative model classes: `pure' reinforcement learning (RL)
agents, RL agents enhanced with knowledge graphs, and agents equipped with
language models. Furthermore, we devise multiple injection strategies for the
above domain knowledge types and agent architectures, including injection via
knowledge graphs and augmentation of the existing input encoding strategies. We
perform all experiments on the ScienceWorld text-based game environment, to
illustrate the performance of various model configurations in challenging
science-related instruction-following tasks. Our findings provide crucial
insights on the development of effective natural language processing systems
for interactive contexts.
- Abstract(参考訳): 自然言語によるコミュニケーションは知能の重要な側面であり、様々なレベルの監督の下で世界の概念を学習し推論するために計算モデルが必要である。
質問回答や手続き的テキスト理解など,完全に教師された非対話的なタスクには大きな進歩があったが,コミュニティの多くは,コヒーレンスや文脈認識,環境から効果的に学習する能力といった,既存のアプローチの限界を明らかにするセミマルコフテキストベースゲームなど,様々な逐次的対話的なタスクに移行している。
本稿では,テキストベースゲームにおけるエージェントの機能的グラウンド化を改善するためのフレームワークを提案する。
具体的には、学習に基づくエージェントに注入するドメイン知識の2つの形態について考察する。
我々のフレームワークは、3つの代表的なモデルクラスをサポートしている: `pure' reinforcement learning (RL)エージェント、知識グラフで強化されたRLエージェント、言語モデルを備えたエージェント。
さらに、上記のドメイン知識型およびエージェントアーキテクチャに対する複数のインジェクション戦略を考案し、知識グラフによるインジェクションや既存の入力エンコーディング戦略の強化を行う。
我々は,ScienceWorldのテキストベースのゲーム環境において,科学関連指導追従課題における各種モデル構成の性能を説明するために,すべての実験を行った。
本研究は,対話型コンテキストのための効果的な自然言語処理システムの開発に関する重要な知見を提供する。
関連論文リスト
- An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Tachikuma: Understading Complex Interactions with Multi-Character and
Novel Objects by Large Language Models [67.20964015591262]
我々は,複数文字と新しいオブジェクトベースインタラクション推定タスクとサポートデータセットからなる,立久間というベンチマークを導入する。
このデータセットは、ゲームプレイ中のリアルタイム通信からログデータをキャプチャし、多様な、接地された複雑なインタラクションを提供して、さらなる探索を行う。
本稿では,対話理解の強化に有効であることを示すため,簡単なプロンプトベースラインを提案し,その性能評価を行う。
論文 参考訳(メタデータ) (2023-07-24T07:40:59Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - ArK: Augmented Reality with Knowledge Interactive Emergent Ability [115.72679420999535]
基礎モデルから新しいドメインへの知識記憶の伝達を学習する無限エージェントを開発する。
私たちのアプローチの核心は、Augmented Reality with Knowledge Inference Interaction (ArK)と呼ばれる新しいメカニズムである。
我々のArKアプローチは,大規模な基礎モデルと組み合わせることで,生成された2D/3Dシーンの品質を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-05-01T17:57:01Z) - Knowledge Engineering in the Long Game of Artificial Intelligence: The
Case of Speech Acts [0.6445605125467572]
本稿では,知識工学の原則と実践について述べる。
我々は,言語学,認知モデル,統計自然言語処理において広く追求されている課題である対話行動モデリングに注目した。
論文 参考訳(メタデータ) (2022-02-02T14:05:12Z) - Learning Knowledge Graph-based World Models of Textual Environments [16.67845396797253]
本研究は,テキストベースのゲーム環境のワールドモデル構築に焦点をあてる。
1)知識グラフとして世界を表現する際のエージェントの行動によって引き起こされる世界の変化を予測し,(2)世界での操作に必要な文脈的に関連する自然言語行動の集合を生成する。
論文 参考訳(メタデータ) (2021-06-17T15:45:54Z) - Neurosymbolic AI for Situated Language Understanding [13.249453757295083]
我々は,これらの学習課題に対する解法として,計算位置定位法が有効であると主張している。
我々のモデルは、古典的なAIの考えをニューロシンボリックインテリジェンス(英語版)の枠組みに再組み入れている。
我々は、さまざまなAI学習課題に対して、位置情報が多様なデータと複数のレベルのモデリングを提供する方法について論じる。
論文 参考訳(メタデータ) (2020-12-05T05:03:28Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。