論文の概要: Learning Knowledge Graph-based World Models of Textual Environments
- arxiv url: http://arxiv.org/abs/2106.09608v1
- Date: Thu, 17 Jun 2021 15:45:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 16:16:56.123823
- Title: Learning Knowledge Graph-based World Models of Textual Environments
- Title(参考訳): テキスト環境の知識グラフに基づく世界モデル学習
- Authors: Prithviraj Ammanabrolu, Mark O. Riedl
- Abstract要約: 本研究は,テキストベースのゲーム環境のワールドモデル構築に焦点をあてる。
1)知識グラフとして世界を表現する際のエージェントの行動によって引き起こされる世界の変化を予測し,(2)世界での操作に必要な文脈的に関連する自然言語行動の集合を生成する。
- 参考スコア(独自算出の注目度): 16.67845396797253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: World models improve a learning agent's ability to efficiently operate in
interactive and situated environments. This work focuses on the task of
building world models of text-based game environments. Text-based games, or
interactive narratives, are reinforcement learning environments in which agents
perceive and interact with the world using textual natural language. These
environments contain long, multi-step puzzles or quests woven through a world
that is filled with hundreds of characters, locations, and objects. Our world
model learns to simultaneously: (1) predict changes in the world caused by an
agent's actions when representing the world as a knowledge graph; and (2)
generate the set of contextually relevant natural language actions required to
operate in the world. We frame this task as a Set of Sequences generation
problem by exploiting the inherent structure of knowledge graphs and actions
and introduce both a transformer-based multi-task architecture and a loss
function to train it. A zero-shot ablation study on never-before-seen textual
worlds shows that our methodology significantly outperforms existing textual
world modeling techniques as well as the importance of each of our
contributions.
- Abstract(参考訳): 世界モデルは、対話的で位置のある環境で効率的に操作する学習エージェントの能力を向上させる。
本研究は,テキストベースのゲーム環境のワールドモデル構築に焦点をあてる。
テキストベースのゲーム(interactive narratives)は、エージェントがテキスト自然言語を使って世界を理解し、対話する強化学習環境である。
これらの環境には、何百もの文字、場所、オブジェクトで満たされた世界を通して、長くて多段階のパズルやクエストが含まれている。
我々の世界モデルは同時に学習する:(1)知識グラフとして世界を表現するときエージェントの行動によって生じる世界の変化を予測する;(2)世界で活動するのに必要な文脈に関連した自然言語アクションのセットを生成する。
このタスクを知識グラフとアクションの固有の構造を利用してシーケンス生成問題の集合として構成し、トランスフォーマティブベースのマルチタスクアーキテクチャと損失関数の両方を導入して学習する。
ゼロショットアブレーション(ゼロショットアブレーション)により,提案手法が既存のテキスト世界モデリング手法をはるかに上回っており,それぞれの貢献の重要性も示している。
関連論文リスト
- Bridging Local Details and Global Context in Text-Attributed Graphs [62.522550655068336]
GraphBridgeは、コンテキストテキスト情報を活用することで、ローカルおよびグローバルな視点をブリッジするフレームワークである。
提案手法は最先端性能を実現し,グラフ対応トークン削減モジュールは効率を大幅に向上し,スケーラビリティの問題を解消する。
論文 参考訳(メタデータ) (2024-06-18T13:35:25Z) - Learning to Model the World with Language [100.76069091703505]
人間と対話し、世界で行動するためには、エージェントは人々が使用する言語の範囲を理解し、それを視覚の世界に関連付ける必要がある。
私たちのキーとなるアイデアは、エージェントが将来を予測するのに役立つ信号として、このような多様な言語を解釈すべきである、ということです。
我々は、将来のテキストや画像表現を予測するマルチモーダル世界モデルを学ぶエージェントであるDynalangでこれをインスタンス化する。
論文 参考訳(メタデータ) (2023-07-31T17:57:49Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Tachikuma: Understading Complex Interactions with Multi-Character and
Novel Objects by Large Language Models [67.20964015591262]
我々は,複数文字と新しいオブジェクトベースインタラクション推定タスクとサポートデータセットからなる,立久間というベンチマークを導入する。
このデータセットは、ゲームプレイ中のリアルタイム通信からログデータをキャプチャし、多様な、接地された複雑なインタラクションを提供して、さらなる探索を行う。
本稿では,対話理解の強化に有効であることを示すため,簡単なプロンプトベースラインを提案し,その性能評価を行う。
論文 参考訳(メタデータ) (2023-07-24T07:40:59Z) - Knowledge-enhanced Agents for Interactive Text Games [16.055119735473017]
テキストベースのゲームにおいてエージェントの機能的接地を改善するための知識注入フレームワークを提案する。
学習に基づくエージェントに注入するドメイン知識の2つの形態について考察する。
我々のフレームワークは、強化学習エージェントと言語モデルエージェントの2つの代表的なモデルクラスをサポートしている。
論文 参考訳(メタデータ) (2023-05-08T23:31:39Z) - Infusing Commonsense World Models with Graph Knowledge [89.27044249858332]
オープンワールドテキストアドベンチャーゲームにおける物語生成の設定について検討する。
基礎となるゲーム状態のグラフ表現は、接地グラフ表現と自然言語記述とアクションの両方を消費し出力するモデルを訓練するために使用することができる。
論文 参考訳(メタデータ) (2023-01-13T19:58:27Z) - A Systematic Survey of Text Worlds as Embodied Natural Language
Environments [0.76146285961466]
Text Worldsは2Dや3D環境とは異なり、テキスト記述のみを使用してレンダリングされる、エンボディエージェント用の仮想環境である。
これらの環境は、参入障壁が低いため、高忠実度3D環境の代替となる。
論文 参考訳(メタデータ) (2021-07-08T22:15:16Z) - Modeling Worlds in Text [16.67845396797253]
対話的な物語の知識グラフに基づく世界モデルを構築することができる学習エージェントの作成を可能にするデータセットを提供する。
我々のデータセットは、豊かな自然言語観測と知識グラフの間の24198のマッピングを提供する。
トレーニングデータは、複数のジャンルの27のゲームにまたがって収集され、さらに7836のホールトアウトインスタンスがテストセットに追加の9つのゲームに格納されている。
論文 参考訳(メタデータ) (2021-06-17T15:02:16Z) - Situated Language Learning via Interactive Narratives [16.67845396797253]
本稿では,文脈的関連のある自然言語を理解し,生成する能力を持つ学習エージェントの活用方法について考察する。
このようなエージェントを作成するための2つの重要なコンポーネントは、相互作用と環境接地です。
テキストゲームのパズルのような構造と自然言語状態とアクション空間が組み合わさったユニークな課題について論じる。
論文 参考訳(メタデータ) (2021-03-18T01:55:16Z) - Wandering Within a World: Online Contextualized Few-Shot Learning [62.28521610606054]
我々は、数ショット学習の標準フレームワークをオンライン環境に拡張することで、一般的な人間と機械学習環境のギャップを埋めることを目指している。
本研究では,世界中をさまようエージェントの視覚体験を模倣した大規模な屋内画像に基づく,新しいプロトタイプによる数ショット学習を提案する。
論文 参考訳(メタデータ) (2020-07-09T04:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。