論文の概要: Exploration Based Language Learning for Text-Based Games
- arxiv url: http://arxiv.org/abs/2001.08868v2
- Date: Mon, 8 Jun 2020 02:27:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 04:49:28.505411
- Title: Exploration Based Language Learning for Text-Based Games
- Title(参考訳): テキストゲームのための探索型言語学習
- Authors: Andrea Madotto, Mahdi Namazifar, Joost Huizinga, Piero Molino, Adrien
Ecoffet, Huaixiu Zheng, Alexandros Papangelis, Dian Yu, Chandra Khatri,
Gokhan Tur
- Abstract要約: 本研究は,テキストベースのコンピュータゲームにおいて,最先端の性能を発揮できる探索・模倣学習型エージェントを提案する。
テキストベースのコンピュータゲームは、自然言語でプレイヤーの世界を記述し、プレイヤーがテキストを使ってゲームと対話することを期待する。
これらのゲームは、言語理解、問題解決、および人工エージェントによる言語生成のためのテストベッドと見なすことができるため、興味がある。
- 参考スコア(独自算出の注目度): 72.30525050367216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents an exploration and imitation-learning-based agent capable
of state-of-the-art performance in playing text-based computer games.
Text-based computer games describe their world to the player through natural
language and expect the player to interact with the game using text. These
games are of interest as they can be seen as a testbed for language
understanding, problem-solving, and language generation by artificial agents.
Moreover, they provide a learning environment in which these skills can be
acquired through interactions with an environment rather than using fixed
corpora. One aspect that makes these games particularly challenging for
learning agents is the combinatorially large action space. Existing methods for
solving text-based games are limited to games that are either very simple or
have an action space restricted to a predetermined set of admissible actions.
In this work, we propose to use the exploration approach of Go-Explore for
solving text-based games. More specifically, in an initial exploration phase,
we first extract trajectories with high rewards, after which we train a policy
to solve the game by imitating these trajectories. Our experiments show that
this approach outperforms existing solutions in solving text-based games, and
it is more sample efficient in terms of the number of interactions with the
environment. Moreover, we show that the learned policy can generalize better
than existing solutions to unseen games without using any restriction on the
action space.
- Abstract(参考訳): 本研究は,テキストベースのコンピュータゲームにおいて,最先端の性能を発揮できる探索・模倣学習型エージェントを提案する。
テキストベースのコンピュータゲームは、自然言語でプレイヤーの世界を記述し、プレイヤーがテキストを使ってゲームと対話することを期待する。
これらのゲームは、言語理解、問題解決、および人工エージェントによる言語生成のためのテストベッドと見なすことができるため、興味がある。
さらに、これらのスキルは固定コーパスではなく、環境とのインタラクションを通じて身につけることができる学習環境を提供する。
これらのゲームが学習エージェントにとって特に困難なのは、組合せ的に大きなアクション空間である。
既存のテキストベースのゲーム解決方法は、非常に単純なゲームか、あるいは所定の許容アクションセットに制限されたアクション空間を持つゲームに限られる。
本研究では,Go-Exploreの探索手法をテキストベースのゲームに応用することを提案する。
より具体的には、最初の探索段階において、まず高い報酬で軌跡を抽出し、その後、これらの軌跡を模倣してゲームを解く政策を訓練する。
実験の結果,この手法は,テキストベースのゲームでは既存のソリューションよりも優れており,環境とのインタラクション数の観点からよりサンプル効率が高いことがわかった。
さらに,学習方針は,アクション空間の制約を使わずに,既存の未確認ゲームに対する解よりも一般化可能であることを示す。
関連論文リスト
- Learning to Play Video Games with Intuitive Physics Priors [2.1548132286330453]
我々は、多数のビデオゲームでよく一般化されたオブジェクトベースの入力表現を設計する。
これらの表現を用いて,幼児に類似したゲームを学ぶエージェントの能力を評価する。
以上の結果から,人間のようなオブジェクトインタラクションのセットアップが,複数のビデオゲームを遊べるように学習できることが示唆された。
論文 参考訳(メタデータ) (2024-09-20T20:30:27Z) - AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game [12.384945632524424]
本稿では,シミュレーション環境における人間行動のプロキシの作成に焦点をあてる。
我々の研究は、最先端の大規模言語モデル(LLM)がゲームルールを効果的に把握し、現在の状況に基づいて意思決定できることを示した。
論文 参考訳(メタデータ) (2024-07-23T14:34:38Z) - SPRING: Studying the Paper and Reasoning to Play Games [102.5587155284795]
我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。
実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。
我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文 参考訳(メタデータ) (2023-05-24T18:14:35Z) - A Minimal Approach for Natural Language Action Space in Text-based Games [103.21433712630953]
本稿では,テキストベースのゲーム(TG)におけるアクション空間の探索という課題を再考する。
我々は,許容行動を利用する最小限のアプローチである$epsilon$-admissible Exploringをトレーニングフェーズに提案する。
本稿では,テキストベースのアクタ・クリティカル(TAC)エージェントを提案する。
論文 参考訳(メタデータ) (2023-05-06T16:05:27Z) - Learning to Play Text-based Adventure Games with Maximum Entropy
Reinforcement Learning [4.698846136465861]
我々はテキストベースの環境にソフト・アクター・クリティック(SAC)アルゴリズムを適用する。
報酬形成技術は、エージェントがポリシーをより早く学習し、より高いスコアを得るのに役立つことを示す。
論文 参考訳(メタデータ) (2023-02-21T15:16:12Z) - A Survey of Text Games for Reinforcement Learning informed by Natural
Language [0.0]
本調査は,自然言語による強化学習のための新しいテキストゲーム問題設定とソリューションの開発を支援することを目的とする。
具体的には,1) テキストゲーム強化学習における課題,2) テキストゲームとその後の環境を評価するための生成ツール,3) エージェントアーキテクチャが現在適用されている。
論文 参考訳(メタデータ) (2021-09-20T12:32:57Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - Interactive Fiction Game Playing as Multi-Paragraph Reading
Comprehension with Reinforcement Learning [94.50608198582636]
対話型フィクション(IF)ゲームと実際の自然言語テキストは、言語理解技術に対する新たな自然な評価を提供する。
IFゲーム解決の新たな視点を捉え,MPRC(Multi-Passage Reading)タスクとして再フォーマットする。
論文 参考訳(メタデータ) (2020-10-05T23:09:20Z) - Learning Dynamic Belief Graphs to Generalize on Text-Based Games [55.59741414135887]
テキストベースのゲームをプレイするには、自然言語処理とシーケンシャルな意思決定のスキルが必要である。
本研究では,原文からエンドツーエンドに学習したグラフ構造化表現を用いて,エージェントがテキストベースのゲームでどのように計画・一般化できるかを検討する。
論文 参考訳(メタデータ) (2020-02-21T04:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。