論文の概要: Detecting and Adapting to Novelty in Games
- arxiv url: http://arxiv.org/abs/2106.02204v1
- Date: Fri, 4 Jun 2021 01:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 07:55:33.289108
- Title: Detecting and Adapting to Novelty in Games
- Title(参考訳): ゲームにおけるノベルティの検出と適応
- Authors: Xiangyu Peng, Jonathan C. Balloch, Mark O. Riedl
- Abstract要約: オープンワールドのノベルティは、ゲームプレイヤが「ハウスルール」に遭遇するなど、環境のルールが突然変化するときに起こる。
ゲームの状態とルールを知識グラフとして表現するモデルベース強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 7.893308498886085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-world novelty occurs when the rules of an environment can change
abruptly, such as when a game player encounters "house rules". To address
open-world novelty, game playing agents must be able to detect when novelty is
injected, and to quickly adapt to the new rules. We propose a model-based
reinforcement learning approach where game state and rules are represented as
knowledge graphs. The knowledge graph representation of the state and rules
allows novelty to be detected as changes in the knowledge graph, assists with
the training of deep reinforcement learners, and enables imagination-based
re-training where the agent uses the knowledge graph to perform look-ahead.
- Abstract(参考訳): オープンワールドのノベルティは、ゲームプレーヤーが「ハウスルール」に遭遇した場合など、環境のルールが突然変化する場合に発生する。
オープンワールドのノベルティに対処するために、ゲームプレイエージェントはノベルティが注入されたときに検出でき、新しいルールに迅速に適応する必要がある。
ゲームの状態とルールを知識グラフとして表現するモデルベース強化学習手法を提案する。
状態とルールの知識グラフ表現により、知識グラフの変化として新規性を検出でき、深層強化学習者のトレーニングを支援し、エージェントが知識グラフを使用してルックアヘッドを行う想像力に基づく再学習を可能にする。
関連論文リスト
- Autoverse: An Evolvable Game Language for Learning Robust Embodied Agents [2.624282086797512]
シングルプレイヤ2Dグリッドベースのゲームのための,進化可能なドメイン固有言語であるAutoverseを紹介する。
オープンエンデッドラーニング(OEL)アルゴリズムのスケーラブルなトレーニンググラウンドとしての利用を実証する。
論文 参考訳(メタデータ) (2024-07-05T02:18:02Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - Efficient Open-world Reinforcement Learning via Knowledge Distillation
and Autonomous Rule Discovery [5.680463564655267]
ルール駆動のディープラーニングエージェント(RDQ)がフレームワークの実装の可能な1つだ。
RDQは,世界との対話において,タスク固有のルールを抽出することに成功した。
実験では,RDQエージェントはベースラインエージェントよりも新規性に非常に耐性があることが示されている。
論文 参考訳(メタデータ) (2023-11-24T04:12:50Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Story Shaping: Teaching Agents Human-like Behavior with Stories [9.649246837532417]
本稿では、強化学習エージェントが、タスクの達成方法に関する模範的なストーリーから暗黙の知識を推測するストーリーシェイピングを紹介する。
エージェントの推論された世界状態グラフと推定されたストーリー世界グラフとの類似性に基づいて本質的な報酬を生成する。
テキストベースのゲームにおいて,エージェントの動作を仮想ゲームキャラクタとして記述し,常識推論を必要とする実験を行った。
論文 参考訳(メタデータ) (2023-01-24T16:19:09Z) - Infusing Commonsense World Models with Graph Knowledge [89.27044249858332]
オープンワールドテキストアドベンチャーゲームにおける物語生成の設定について検討する。
基礎となるゲーム状態のグラフ表現は、接地グラフ表現と自然言語記述とアクションの両方を消費し出力するモデルを訓練するために使用することができる。
論文 参考訳(メタデータ) (2023-01-13T19:58:27Z) - Learning Generalizable Behavior via Visual Rewrite Rules [0.9558392439655015]
本稿では,ニューラルネットワークを使わずに環境動態を捉えるための新しい表現と学習手法を提案する。
これは、人のために設計されたゲームにおいて、アクションの効果が連続した視覚的観察における局所的な変化の形で知覚されることがしばしばあるという観察に由来する。
我々のアルゴリズムは、このような視覚的変化を抽出し、それらを「視覚的書き換え規則」と呼ぶ一連の行動依存記述規則(VRR)に凝縮するように設計されている。
論文 参考訳(メタデータ) (2021-12-09T21:23:26Z) - How to Avoid Being Eaten by a Grue: Structured Exploration Strategies
for Textual Worlds [16.626095390308304]
質問に答えることで世界の知識グラフを構築することを学習するエージェントであるQ*BERTを紹介する。
MC!Q*BERTは知識グラフに基づく本質的なモチベーションを用いてボトルネックを検出するエージェントである。
本研究は,9つのテキストゲームにおいて,我々の手法が現状よりも優れていることを示すアブレーション研究と結果を提示する。
論文 参考訳(メタデータ) (2020-06-12T18:24:06Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z) - Learning Dynamic Belief Graphs to Generalize on Text-Based Games [55.59741414135887]
テキストベースのゲームをプレイするには、自然言語処理とシーケンシャルな意思決定のスキルが必要である。
本研究では,原文からエンドツーエンドに学習したグラフ構造化表現を用いて,エージェントがテキストベースのゲームでどのように計画・一般化できるかを検討する。
論文 参考訳(メタデータ) (2020-02-21T04:38:37Z) - Generative Adversarial Zero-Shot Relational Learning for Knowledge
Graphs [96.73259297063619]
我々は、この厄介なキュレーションを解放するために、新しい定式化、ゼロショット学習を考える。
新たに追加された関係について,テキスト記述から意味的特徴を学習しようと試みる。
我々は,GAN(Generative Adrial Networks)を活用し,テキストと知識グラフ領域の接続を確立する。
論文 参考訳(メタデータ) (2020-01-08T01:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。