Fugu-MT 論文翻訳(概要): MarioGPT: Open-Ended Text2Level Generation through Large Language Models

論文の概要: MarioGPT: Open-Ended Text2Level Generation through Large Language Models

arxiv url: http://arxiv.org/abs/2302.05981v1
Date: Sun, 12 Feb 2023 19:12:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-14 17:30:27.001158
Title: MarioGPT: Open-Ended Text2Level Generation through Large Language Models
Title（参考訳）: MarioGPT: 大規模言語モデルによるオープンソースのText2Level生成
Authors: Shyam Sudhakaran, Miguel Gonz\'alez-Duque, Claire Glanois, Matthias Freiberger, Elias Najarro, Sebastian Risi
Abstract要約: タイルベースのゲームレベルを生成するために訓練された細調整GPT2モデルであるMarioGPTを紹介する。我々は,MarioGPTが多様なレベルを生成できるだけでなく,制御可能なレベル生成のためにテキストをプロンプできることを示す。
参考スコア（独自算出の注目度）: 9.87407154597402
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Procedural Content Generation (PCG) algorithms provide a technique to generate complex and diverse environments in an automated way. However, while generating content with PCG methods is often straightforward, generating meaningful content that reflects specific intentions and constraints remains challenging. Furthermore, many PCG algorithms lack the ability to generate content in an open-ended manner. Recently, Large Language Models (LLMs) have shown to be incredibly effective in many diverse domains. These trained LLMs can be fine-tuned, re-using information and accelerating training for new tasks. In this work, we introduce MarioGPT, a fine-tuned GPT2 model trained to generate tile-based game levels, in our case Super Mario Bros levels. We show that MarioGPT can not only generate diverse levels, but can be text-prompted for controllable level generation, addressing one of the key challenges of current PCG techniques. As far as we know, MarioGPT is the first text-to-level model. We also combine MarioGPT with novelty search, enabling it to generate diverse levels with varying play-style dynamics (i.e. player paths). This combination allows for the open-ended generation of an increasingly diverse range of content.
Abstract（参考訳）: 手続き型コンテンツ生成(PCG)アルゴリズムは、複雑で多様な環境を自動生成する技術を提供する。しかし、PCGメソッドでコンテンツを生成することは多くの場合簡単であるが、特定の意図や制約を反映した意味のあるコンテンツを生成することは困難である。さらに、多くのPCGアルゴリズムは、オープンな方法でコンテンツを生成する能力に欠ける。最近、Large Language Models (LLMs) は多くの多様なドメインで驚くほど効果的であることが示されている。これらの訓練されたLSMは微調整され、情報を再利用し、新しいタスクのトレーニングを加速することができる。本研究は,スーパーマリオブラザーズレベルにおいて,タイルベースのゲームレベルを生成するための微調整GPT2モデルであるMarioGPTを紹介する。我々はMarioGPTが多様なレベルを生成できるだけでなく、制御可能なレベル生成のためにテキストプロンプトが可能であることを示し、現在のPCG技術における重要な課題の1つに対処する。私たちの知る限り、MarioGPTは最初のテキスト・ツー・レベルのモデルです。また、MarioGPTとノベルティ検索を組み合わせることで、様々なプレイスタイルのダイナミックス(すなわちプレイヤーパス)で様々なレベルを生成できる。この組み合わせにより、ますます多様なコンテンツのオープンな生成が可能になる。

関連論文リスト

Word2Minecraft: Generating 3D Game Levels through Large Language Models [6.037493811943889]
本稿では,構造化されたストーリーに基づいて,Minecraftでプレイ可能なゲームレベルを生成するシステムであるWord2Minecraftを紹介する。ストーリーの複雑さをカスタマイズできるフレキシブルなフレームワークを導入し、ダイナミックなレベル生成を可能にします。 GPT-4-Turboは物語のコヒーレンスや客観的楽しみなど,ほとんどの領域でGPT-4o-Miniより優れていた。
論文参考訳（メタデータ） (2025-03-18T18:38:38Z)
Can Graph Neural Networks Learn Language with Extremely Weak Text Supervision? [62.12375949429938]
CLIPパイプラインによる転送可能なグラフニューラルネットワーク(GNN)の構築は、3つの根本的な問題のために難しい。我々は、マルチモーダル・プロンプト・ラーニングを利用して、事前学習したGNNを下流のタスクやデータに効果的に適応させる。我々の新しいパラダイムは、グラフプロンプトとテキストプロンプトの両方を同時に学習することで、Large Language Models(LLM)と直接同じ空間にグラフを埋め込む。
論文参考訳（メタデータ） (2024-12-11T08:03:35Z)
CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
我々は,LLMの性能を高めるため,グラフィカル検索拡張コード生成フレームワークであるCodeGRAGを提案する。 CodeGRAGは、制御フローとデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミング言語と自然言語のギャップを埋める。ハードメタグラフプロンプト、ソフトプロンプト技術、事前訓練されたGNN専門家の目的の有効性を検証するために、C++言語とピソン言語の両方を含む4つのデータセットで様々な実験と改善が行われた。
論文参考訳（メタデータ） (2024-05-03T02:48:55Z)
Game Generation via Large Language Models [3.4051285393187327]
本稿では,大言語モデル(LLM)を用いたゲーム生成について検討する。ゲーム記述言語に基づいて,ゲームルールとレベルを同時に生成するLLMベースのフレームワークを提案する。
論文参考訳（メタデータ） (2024-04-11T10:06:05Z)
GET: Unlocking the Multi-modal Potential of CLIP for Generalized Category Discovery [50.564146730579424]
テキスト埋め込み合成器(TES)を提案する。提案手法は,CLIPのマルチモーダルポテンシャルを解放し,すべてのGCDベンチマークにおいて,ベースライン手法よりも大きなマージンで性能を向上する。
論文参考訳（メタデータ） (2024-03-15T02:40:13Z)
Kosmos-G: Generating Images in Context with Multimodal Large Language Models [117.0259361818715]
現在の被写体駆動画像生成法では、テストタイムチューニングが必要であり、インターリーブされたマルチイメージとテキスト入力を受け付けない。本稿では,マルチモーダル大規模言語モデルの高度なマルチモーダル認識機能を活用するモデルであるKosmos-Gを提案する。 Kosmos-Gは、インターリーブされたマルチイメージとテキスト入力によるゼロショットの主観的生成の印象的な能力を示す。
論文参考訳（メタデータ） (2023-10-04T17:28:44Z)
ZeroGen: Zero-shot Multimodal Controllable Text Generation with Multiple Oracles [29.460712493470453]
マルチモーダル信号(textscZeroGen)を用いたゼロショット制御可能なテキスト生成の新しいパラダイムを提案する。 textscZeroGenはトークンレベルから文レベルまで連続的にテキストと画像の制御を利用し、復号時にそれらを統一された確率空間にマッピングする。 textscZeroGenはキャプションタスクにおいて、大きなマージンで上回るだけでなく、高い制御率を持つマルチモーダルニュース生成にも大きな可能性を秘めている。
論文参考訳（メタデータ） (2023-06-29T03:22:43Z)
MGDoc: Pre-training with Multi-granular Hierarchy for Document Image Understanding [53.03978356918377]
異なるレベルの粒度のコンテンツ間の空間的階層的関係は、文書画像理解タスクに不可欠である。既存の方法は単語レベルか地域レベルから特徴を学習するが、両方を同時に考えることができない。 MGDocは,ページレベル,領域レベル,単語レベル情報を同時にエンコードするマルチモーダル・マルチグラニュラ事前学習フレームワークである。
論文参考訳（メタデータ） (2022-11-27T22:47:37Z)
Learning to Transfer Prompts for Text Generation [97.64625999380425]
転送可能なテキスト生成のための新しいプロンプトベース手法(PTG)を提案する。まず、PTGは、様々なソース生成タスクの一連のソースプロンプトを学習し、ターゲット生成タスクを実行するためのターゲットプロンプトとしてこれらのプロンプトを転送する。広範な実験では、PTGは微調整法よりも競争力または優れた結果が得られる。
論文参考訳（メタデータ） (2022-05-03T14:53:48Z)
TegTok: Augmenting Text Generation via Task-specific and Open-world Knowledge [83.55215993730326]
本稿では,タスク固有およびオープンワールド知識(TegTok)によるTExt生成の統一化を提案する。本モデルでは,2種類の知識ソースからの知識エントリを高密度検索により選択し,それぞれ入力エンコーディングと出力デコーディングの段階に注入する。
論文参考訳（メタデータ） (2022-03-16T10:37:59Z)
Experience-Driven PCG via Reinforcement Learning: A Super Mario Bros Study [2.2215852332444905]
このフレームワークは、当初スーパーマリオブラザーズゲームでテストされている。生成の正確性は、ニューラルネットアシスト進化レベル修復器によって保証される。提案するフレームワークは、無限にプレイ可能なスーパーマリオブラザーズレベルを生成することができる。
論文参考訳（メタデータ） (2021-06-30T08:10:45Z)
GeDi: Generative Discriminator Guided Sequence Generation [53.15651536569169]
本稿では,より小さなLMを生成的識別器として利用し,大規模なLMから生成を誘導する効率的な方法としてGeDiを提案する。 GeDiは最先端技術よりも制御性が強く,生成速度も30倍以上に向上することがわかった。
論文参考訳（メタデータ） (2020-09-14T17:45:36Z)
TOAD-GAN: Coherent Style Level Generation from a Single Example [24.039037782220017]
トークンベースのゲームレベルを生成する新しいPCGアルゴリズムであるTOAD-GANを提案する。スーパーマリオブラザーズレベルへの応用を実証し、任意のサイズで類似したスタイルの新たなレベルを生成することができる。
論文参考訳（メタデータ） (2020-08-04T13:44:50Z)
Capturing Local and Global Patterns in Procedural Content Generation via Machine Learning [9.697217570243845]
機械学習(PCGML)法による最近の手続き的コンテンツ生成により、学習者は既存のコンテンツから類似したコンテンツを生成することができる。これらのアプローチが対称性のような大規模な視覚パターンをどの程度うまく捉えることができるかは、オープンな疑問である。本稿では,PCGMLアルゴリズムが適切なパターンを生成する能力について,その領域として3つのゲームにマッチする手法を提案する。
論文参考訳（メタデータ） (2020-05-26T08:58:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。