論文の概要: The Procedural Content Generation Benchmark: An Open-source Testbed for Generative Challenges in Games
- arxiv url: http://arxiv.org/abs/2503.21474v1
- Date: Thu, 27 Mar 2025 13:05:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:54:07.676911
- Title: The Procedural Content Generation Benchmark: An Open-source Testbed for Generative Challenges in Games
- Title(参考訳): 手続き的コンテンツ生成ベンチマーク: ゲームにおけるジェネレーティブチャレンジのためのオープンソースのテストベッド
- Authors: Ahmed Khalifa, Roberto Gallotta, Matthew Barthet, Antonios Liapis, Julian Togelius, Georgios N. Yannakakis,
- Abstract要約: ベンチマークには12のゲーム関連の問題があり、それぞれに複数のバリエーションがある。
各問題には、コンテンツ表現、制御パラメータ、品質、多様性、制御性の評価指標がそれぞれ備わっている。
- 参考スコア(独自算出の注目度): 4.409440064748338
- License:
- Abstract: This paper introduces the Procedural Content Generation Benchmark for evaluating generative algorithms on different game content creation tasks. The benchmark comes with 12 game-related problems with multiple variants on each problem. Problems vary from creating levels of different kinds to creating rule sets for simple arcade games. Each problem has its own content representation, control parameters, and evaluation metrics for quality, diversity, and controllability. This benchmark is intended as a first step towards a standardized way of comparing generative algorithms. We use the benchmark to score three baseline algorithms: a random generator, an evolution strategy, and a genetic algorithm. Results show that some problems are easier to solve than others, as well as the impact the chosen objective has on quality, diversity, and controllability of the generated artifacts.
- Abstract(参考訳): 本稿では,異なるゲームコンテンツ作成タスクにおける生成アルゴリズムの評価を行うための手続き的コンテンツ生成ベンチマークを提案する。
ベンチマークには12のゲーム関連の問題があり、それぞれに複数のバリエーションがある。
問題は、異なる種類のレベルを作成することから、単純なアーケードゲームのためのルールセットを作成することまで様々である。
それぞれの問題には、コンテンツ表現、制御パラメータ、品質、多様性、制御性の評価指標がそれぞれ備わっている。
このベンチマークは、生成アルゴリズムを比較するための標準化された方法への第一歩として意図されている。
このベンチマークを用いて、ランダムジェネレータ、進化戦略、遺伝的アルゴリズムの3つのベースラインアルゴリズムをスコアリングする。
結果は、ある問題が他の問題よりも解決しやすいこと、そして選択した目的が生成したアーティファクトの品質、多様性、制御性に与える影響を示している。
関連論文リスト
- CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings [70.95565672516979]
LiveCodeBenchやUSACOといった既存のベンチマークは、プライベートテストケースの可用性の欠如、特別な審査員のサポートの欠如、不整合実行環境のために不足している。
CodeEloは標準化された競合レベルのコード生成ベンチマークで、これらすべての課題に初めて効果的に対処する。
論文 参考訳(メタデータ) (2025-01-02T13:49:00Z) - Touchstone Benchmark: Are We on the Right Way for Evaluating AI Algorithms for Medical Segmentation? [90.30635552818875]
9種類の腹部臓器の大規模共同セグメント化ベンチマークであるTouchstoneを報告する。
このベンチマークは、世界中の76の病院から5,195回のCTスキャンと、11の病院から5,903回のCTスキャンに基づいています。
私たちは19のAIアルゴリズムの発明者14人を招待してアルゴリズムをトレーニングしましたが、私たちのチームは第三者として、3つのテストセットでこれらのアルゴリズムを独立して評価しました。
論文 参考訳(メタデータ) (2024-11-06T05:09:34Z) - Best-$k$ Search Algorithm for Neural Text Generation [118.02691398555781]
本稿では,品質と多様性のバランスをとる決定論的探索アルゴリズムを提案する。
提案アルゴリズムはパラメータフリーで、軽量で、効率的で、使いやすくなっている。
論文 参考訳(メタデータ) (2022-11-22T00:26:13Z) - Contrastive Learning for Diverse Disentangled Foreground Generation [67.81298739373766]
本稿では,様々な要因を明示的に制御した多種多様な前景生成手法を提案する。
我々は、暗黙の入力に対して様々なフォアグラウンド結果を生成するために、遅延符号を用いたコントラスト学習を利用する。
実験により,本手法の多様性と生成制御性において,最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-11-04T18:51:04Z) - Towards QD-suite: developing a set of benchmarks for Quality-Diversity
algorithms [0.0]
既存のベンチマークは標準化されておらず、現在、品質多様性(QD)に匹敵するMNISTはない。
我々は、QD手法が直面する課題の特定と、目標とする、挑戦的でスケーラブルなベンチマークの開発が重要なステップであると主張している。
論文 参考訳(メタデータ) (2022-05-06T13:33:50Z) - No-Regret Learning in Time-Varying Zero-Sum Games [99.86860277006318]
固定ゼロサムゲームにおける繰り返しプレイからの学習は、ゲーム理論とオンライン学習における古典的な問題である。
提案手法は,3つの性能基準の下で,良好な保証を同時に享受できる1つのパラメータフリーアルゴリズムである。
本アルゴリズムは,ある特性を満たすブラックボックスベースラーナー群に対するメタアルゴリズムを用いた2層構造に基づく。
論文 参考訳(メタデータ) (2022-01-30T06:10:04Z) - Massive-scale Decoding for Text Generation using Lattices [34.2658286826597]
多数の生成オプションを符号化する格子を構成するための探索アルゴリズムを提案する。
我々のアルゴリズムは、文法的かつ高品質な数百から数千の多様な選択肢を1つの線形サイズの格子に符号化している。
論文 参考訳(メタデータ) (2021-12-14T18:56:11Z) - A Systematic Characterization of Sampling Algorithms for Open-ended
Language Generation [71.31905141672529]
本稿では,自己回帰型言語モデルに広く採用されている祖先サンプリングアルゴリズムについて検討する。
エントロピー低減, 秩序保存, 斜面保全の3つの重要な特性を同定した。
これらの特性を満たすサンプリングアルゴリズムのセットが,既存のサンプリングアルゴリズムと同等に動作することがわかった。
論文 参考訳(メタデータ) (2020-09-15T17:28:42Z) - Trading Off Diversity and Quality in Natural Language Generation [12.672685374008259]
応答品質と多様性の両方を同時に最大化することを目的とした多目的最適化問題としてデコーディングをキャストした。
我々のフレームワークは、品質・多様性のスペクトル全体に沿って、デコード手法の大規模な評価を行うことができる。
我々は,この知見を活用して,グローバルな正規化温度サンプリングを精度よく近似するEmphselective sampleと呼ばれるアルゴリズムを作成し,評価する。
論文 参考訳(メタデータ) (2020-04-22T09:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。