論文の概要: Story Shaping: Teaching Agents Human-like Behavior with Stories
- arxiv url: http://arxiv.org/abs/2301.10107v1
- Date: Tue, 24 Jan 2023 16:19:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 13:07:10.868895
- Title: Story Shaping: Teaching Agents Human-like Behavior with Stories
- Title(参考訳): ストーリーシェーピング - エージェントにストーリーによる人間的行動を教える
- Authors: Xiangyu Peng, Christopher Cui, Wei Zhou, Renee Jia, Mark Riedl
- Abstract要約: 本稿では、強化学習エージェントが、タスクの達成方法に関する模範的なストーリーから暗黙の知識を推測するストーリーシェイピングを紹介する。
エージェントの推論された世界状態グラフと推定されたストーリー世界グラフとの類似性に基づいて本質的な報酬を生成する。
テキストベースのゲームにおいて,エージェントの動作を仮想ゲームキャラクタとして記述し,常識推論を必要とする実験を行った。
- 参考スコア(独自算出の注目度): 9.649246837532417
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reward design for reinforcement learning agents can be difficult in
situations where one not only wants the agent to achieve some effect in the
world but where one also cares about how that effect is achieved. For example,
we might wish for an agent to adhere to a tacit understanding of commonsense,
align itself to a preference for how to behave for purposes of safety, or
taking on a particular role in an interactive game. Storytelling is a mode for
communicating tacit procedural knowledge. We introduce a technique, Story
Shaping, in which a reinforcement learning agent infers tacit knowledge from an
exemplar story of how to accomplish a task and intrinsically rewards itself for
performing actions that make its current environment adhere to that of the
inferred story world. Specifically, Story Shaping infers a knowledge graph
representation of the world state from observations, and also infers a
knowledge graph from the exemplar story. An intrinsic reward is generated based
on the similarity between the agent's inferred world state graph and the
inferred story world graph. We conducted experiments in text-based games
requiring commonsense reasoning and shaping the behaviors of agents as virtual
game characters.
- Abstract(参考訳): 強化学習エージェントに対する報酬設計は、エージェントが世界に何らかの効果をもたらすことを望むだけでなく、その効果をどのように達成するかを気にする状況では困難である。
例えば、エージェントが常識の暗黙の理解に固執し、安全のためにどのように振る舞うかを好むか、インタラクティブなゲームで特定の役割を演じるか、といったことを望むかもしれません。
ストーリーテリングは、暗黙の手続き的な知識を伝えるためのモードである。
本稿では、強化学習エージェントが、タスクの達成方法に関する模範的な物語から暗黙の知識を推論し、現在の環境を推定されたストーリーワールドのそれに準拠した行動に本質的な報酬を与える手法であるストーリー・シェーピングを紹介する。
具体的には、ストーリーシェーピングは、観察から世界状態の知識グラフ表現を推論し、また、模範的なストーリーから知識グラフを推論する。
エージェントの推論された世界状態グラフと推定されたストーリー世界グラフとの類似性に基づいて本質的な報酬を生成する。
コモンセンス推論を必要とするテキストベースのゲームで実験を行い,仮想ゲームキャラクタとしてエージェントの振る舞いを形作る。
関連論文リスト
- Generating Visual Stories with Grounded and Coreferent Characters [63.07511918366848]
本稿では,一貫した接地的・中核的な特徴を持つ視覚的ストーリーを予測できる最初のモデルを提案する。
我々のモデルは、広く使われているVISTベンチマークの上に構築された新しいデータセットに基づいて微調整されています。
また、物語における文字の豊かさとコア参照を測定するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2024-09-20T14:56:33Z) - StoryVerse: Towards Co-authoring Dynamic Plot with LLM-based Character Simulation via Narrative Planning [8.851718319632973]
大きな言語モデル(LLM)は仮想文字の振る舞いを駆動し、プロットは文字と環境間の相互作用から現れる。
著者の著作意図と LLM によるキャラクタシミュレーションの創発的行動とを仲介するプロット作成ワークフローを提案する。
このプロセスは「生きた物語」を作り、様々なゲーム世界の状態に動的に適応し、著者、キャラクターシミュレーション、プレイヤーが共同で物語を作る。
論文 参考訳(メタデータ) (2024-05-17T23:04:51Z) - SCO-VIST: Social Interaction Commonsense Knowledge-based Visual
Storytelling [12.560014305032437]
本稿では、画像シーケンスをオブジェクトと関係を持つグラフとして表現するフレームワークであるSCO-VISTを紹介する。
SCO-VIST はこのグラフをプロットポイントを表し、意味的および発生に基づくエッジウェイトを持つプロットポイント間のブリッジを生成する。
この重み付きストーリーグラフは、Floyd-Warshallのアルゴリズムを用いて一連のイベントでストーリーラインを生成する。
論文 参考訳(メタデータ) (2024-02-01T04:09:17Z) - Synthesizing Physical Character-Scene Interactions [64.26035523518846]
仮想キャラクタとその周辺環境間のこのような相互作用を合成する必要がある。
本稿では,逆模倣学習と強化学習を用いて物理シミュレーション文字を学習するシステムを提案する。
我々のアプローチは、物理学に基づくキャラクターモーション生成を広い適用性に一歩近づいた。
論文 参考訳(メタデータ) (2023-02-02T05:21:32Z) - Infusing Commonsense World Models with Graph Knowledge [89.27044249858332]
オープンワールドテキストアドベンチャーゲームにおける物語生成の設定について検討する。
基礎となるゲーム状態のグラフ表現は、接地グラフ表現と自然言語記述とアクションの両方を消費し出力するモデルを訓練するために使用することができる。
論文 参考訳(メタデータ) (2023-01-13T19:58:27Z) - Learning Action-Effect Dynamics from Pairs of Scene-graphs [50.72283841720014]
本稿では,画像のシーングラフ表現を利用して,自然言語で記述された行動の効果を推論する手法を提案する。
提案手法は,既存のモデルと比較して,性能,データ効率,一般化能力の点で有効である。
論文 参考訳(メタデータ) (2022-12-07T03:36:37Z) - Commonsense Knowledge from Scene Graphs for Textual Environments [6.617487928813374]
シーングラフデータセットなどの視覚的データセットから得られたコモンセンス推論を利用する利点について検討する。
提案手法は既存の最先端手法よりも高い性能と競争性を有する。
論文 参考訳(メタデータ) (2022-10-19T03:09:17Z) - Incorporating Commonsense Knowledge into Story Ending Generation via
Heterogeneous Graph Networks [16.360265861788253]
本研究では,異なるレベルにおけるストーリーコンテキストの情報と,それら間の多義的な対話性の両方を明示的にモデル化するために,ストーリー異種グラフネットワーク(SHGN)を提案する。
より詳しくは、常識知識、単語、文を3種類のノードとみなす。
感情傾向を暗黙的に捉えるための2つの補助タスクを設計し、重要なイベントをコンテキストに配置する。
論文 参考訳(メタデータ) (2022-01-29T09:33:11Z) - Inherently Explainable Reinforcement Learning in Natural Language [14.117921448623342]
本稿では,本質的に説明可能な強化学習エージェントの開発に焦点をあてる。
この階層的説明可能な強化学習エージェントは、インタラクティブフィクション、テキストベースのゲーム環境で動作する。
私たちのエージェントは、説明責任を第一級市民として扱うように設計されています。
論文 参考訳(メタデータ) (2021-12-16T14:24:35Z) - PlotMachines: Outline-Conditioned Generation with Dynamic Plot State
Tracking [128.76063992147016]
PlotMachinesは、動的プロット状態を追跡することによってアウトラインをコヒーレントなストーリーに変換することを学習する、ニューラルな物語モデルである。
さらに,PlotMachinesを高レベルな談話構造で強化し,モデルが物語の異なる部分に対応する筆記スタイルを学習できるようにした。
論文 参考訳(メタデータ) (2020-04-30T17:16:31Z) - Learning Dynamic Belief Graphs to Generalize on Text-Based Games [55.59741414135887]
テキストベースのゲームをプレイするには、自然言語処理とシーケンシャルな意思決定のスキルが必要である。
本研究では,原文からエンドツーエンドに学習したグラフ構造化表現を用いて,エージェントがテキストベースのゲームでどのように計画・一般化できるかを検討する。
論文 参考訳(メタデータ) (2020-02-21T04:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。