論文の概要: Towards Objective Metrics for Procedurally Generated Video Game Levels
- arxiv url: http://arxiv.org/abs/2201.10334v1
- Date: Tue, 25 Jan 2022 14:13:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 15:44:50.188804
- Title: Towards Objective Metrics for Procedurally Generated Video Game Levels
- Title(参考訳): 手続き的に生成されたゲームレベルの客観的指標を目指して
- Authors: Michael Beukman, Steven James and Christopher Cleghorn
- Abstract要約: シミュレーションに基づく評価指標を2つ導入し, 生成レベルの多様性と難易度を測定した。
我々の多様性指標は、現在の方法よりも、レベルサイズや表現の変化に対して堅牢であることを示す。
難易度基準は、テスト済みのドメインの1つで既存の難易度推定と相関するが、他のドメインではいくつかの課題に直面している。
- 参考スコア(独自算出の注目度): 2.320417845168326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With increasing interest in procedural content generation by academia and
game developers alike, it is vital that different approaches can be compared
fairly. However, evaluating procedurally generated video game levels is often
difficult, due to the lack of standardised, game-independent metrics. In this
paper, we introduce two simulation-based evaluation metrics that involve
analysing the behaviour of an A* agent to measure the diversity and difficulty
of generated levels in a general, game-independent manner. Diversity is
calculated by comparing action trajectories from different levels using the
edit distance, and difficulty is measured as how much exploration and expansion
of the A* search tree is necessary before the agent can solve the level. We
demonstrate that our diversity metric is more robust to changes in level size
and representation than current methods and additionally measures factors that
directly affect playability, instead of focusing on visual information. The
difficulty metric shows promise, as it correlates with existing estimates of
difficulty in one of the tested domains, but it does face some challenges in
the other domain. Finally, to promote reproducibility, we publicly release our
evaluation framework.
- Abstract(参考訳): アカデミアやゲーム開発者による手続き的コンテンツ生成への関心が高まる中、異なるアプローチを公平に比較することは不可欠である。
しかし、標準化されたゲームに依存しない指標が欠如しているため、手続き的に生成されたゲームレベルの評価は難しいことが多い。
本稿では,A*エージェントの動作を分析し,ゲームに依存しない方法で生成レベルの多様性と難易度を測定するためのシミュレーションに基づく2つの評価指標を提案する。
異なるレベルの行動軌跡を編集距離を用いて比較することにより多様性を算出し、エージェントがレベルを解決できるまでにa*探索木の探索と拡張がどの程度必要かという難易度を計測する。
我々の多様性指標は、現在の手法よりもレベルサイズや表現の変化に対して堅牢であり、視覚情報に焦点をあてるのではなく、遊びやすさに直接影響を及ぼす要因も測定できることを実証する。
難易度基準は、テスト済みドメインの1つで既存の難易度推定と相関するが、他のドメインではいくつかの課題に直面している。
最後に,再現性を促進するため,評価フレームワークを公表する。
関連論文リスト
- Perceptual Similarity for Measuring Decision-Making Style and Policy Diversity in Games [28.289135305943056]
プレイスタイルとして知られる意思決定スタイルの定義と測定は、ゲームにおいて不可欠である。
本稿では,様々な状態心理学を用いたマルチスケール分析,粒度に根ざした知覚核,交差点対結合法を有効利用して精度を高めるための3つの拡張点を紹介する。
そこで本研究では,エンド・ツー・エンドのゲーム分析と,多種多様なプレイスタイルのための人工知能の進化について検討した。
論文 参考訳(メタデータ) (2024-08-12T10:55:42Z) - POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.67608003501479]
主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。
このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文 参考訳(メタデータ) (2024-07-20T16:37:21Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Preference-conditioned Pixel-based AI Agent For Game Testing [1.5059676044537105]
環境とのインタラクションによって学習するゲームテストAIエージェントは、これらの課題を軽減する可能性がある。
本稿では,ユーザの好みに応じて設定された環境を探索しながら,主に画素ベースの状態観測に依存するエージェント設計を提案する。
実AAAゲームにおける多くの側面に類似した複雑なオープンワールド環境において、調査対象とテスト実行品質に対して、我々のエージェントは、最先端の画素ベースのゲームテストエージェントよりも大幅に優れています。
論文 参考訳(メタデータ) (2023-08-18T04:19:36Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Ordinal Regression for Difficulty Estimation of StepMania Levels [18.944506234623862]
我々は,StepManiaレベルの難易度予測タスクを順序回帰(OR)タスクとして定式化し,解析する。
我々は、多くの競争力のあるORモデルと非ORモデルを評価し、ニューラルネットワークベースのモデルが芸術の状態を著しく上回ることを示した。
我々は、トレーニングされたモデルが人間のラベルよりも優れていることを示すユーザー実験で締めくくった。
論文 参考訳(メタデータ) (2023-01-23T15:30:01Z) - Generating Game Levels of Diverse Behaviour Engagement [2.5739833468005595]
emphSuper Mario Bros.の実験では、異なるペルソナを持つエージェントが同じ評価基準を使用すると、特定のペルソナのレベルが生成されることが示されている。
単純なゲームでは、特定のプレイヤーアーチタイプのゲームプレイングエージェントをレベルテスタとして使用することが、おそらく、さまざまな振る舞いのエンゲージメントを発生させるために必要なすべてであることを意味します。
論文 参考訳(メタデータ) (2022-07-05T15:08:12Z) - Modeling Content Creator Incentives on Algorithm-Curated Platforms [76.53541575455978]
本研究では,アルゴリズムの選択が露出ゲームにおける(ナッシュ)平衡の存在と性格にどのように影響するかを検討する。
本研究では、露出ゲームにおける平衡を数値的に見つけるためのツールを提案し、MovieLensとLastFMデータセットの監査結果を示す。
論文 参考訳(メタデータ) (2022-06-27T08:16:59Z) - Procedural Content Generation using Neuroevolution and Novelty Search
for Diverse Video Game Levels [2.320417845168326]
手続き的に生成されたビデオゲームコンテンツは、ゲーム開発者や大手スタジオのコンテンツ制作予算を大幅に削減する可能性がある。
しかし、採用の妨げとなるのは、遅い生成や品質の低下、コンテンツの多様性といった制限だ。
進化的探索に基づく進化的探索手法を導入し,様々なレベルをリアルタイムでプロシージャ的に生成する手法を提案する。
論文 参考訳(メタデータ) (2022-04-14T12:54:32Z) - Uncertainty-aware Score Distribution Learning for Action Quality
Assessment [91.05846506274881]
行動品質評価(AQA)のための不確実性認識スコア分布学習(USDL)手法を提案する。
具体的には、異なる評価スコアの確率を記述したスコア分布に関連する事例として、アクションを考察する。
微粒なスコアラベルが利用できる状況下では、多パス不確実性を考慮したスコア分布学習法(MUSDL)を考案し、スコアの不整合成分を探索する。
論文 参考訳(メタデータ) (2020-06-13T15:41:29Z) - Towards Universal Representation Learning for Deep Face Recognition [106.21744671876704]
対象のドメイン知識を活用せずに、与えられたトレーニングデータに見つからない大きな変化に対処できる普遍的な表現学習フレームワークを提案する。
実験により,LFW や MegaFace などの一般的な顔認識データセットにおいて,本手法が最高性能を実現することを示す。
論文 参考訳(メタデータ) (2020-02-26T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。