論文の概要: Ordinal Regression for Difficulty Estimation of StepMania Levels
- arxiv url: http://arxiv.org/abs/2301.09485v1
- Date: Mon, 23 Jan 2023 15:30:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 13:15:55.952262
- Title: Ordinal Regression for Difficulty Estimation of StepMania Levels
- Title(参考訳): ステップマニアの難易度推定のための正規回帰
- Authors: Billy Joe Franks, Benjamin Dinkelmann, Sophie Fellenz and Marius Kloft
- Abstract要約: 我々は,StepManiaレベルの難易度予測タスクを順序回帰(OR)タスクとして定式化し,解析する。
我々は、多くの競争力のあるORモデルと非ORモデルを評価し、ニューラルネットワークベースのモデルが芸術の状態を著しく上回ることを示した。
我々は、トレーニングされたモデルが人間のラベルよりも優れていることを示すユーザー実験で締めくくった。
- 参考スコア(独自算出の注目度): 18.944506234623862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: StepMania is a popular open-source clone of a rhythm-based video game. As is
common in popular games, there is a large number of community-designed levels.
It is often difficult for players and level authors to determine the difficulty
level of such community contributions. In this work, we formalize and analyze
the difficulty prediction task on StepMania levels as an ordinal regression
(OR) task. We standardize a more extensive and diverse selection of this data
resulting in five data sets, two of which are extensions of previous work. We
evaluate many competitive OR and non-OR models, demonstrating that neural
network-based models significantly outperform the state of the art and that
StepMania-level data makes for an excellent test bed for deep OR models. We
conclude with a user experiment showing our trained models' superiority over
human labeling.
- Abstract(参考訳): StepManiaはリズムベースのビデオゲームのオープンソースクローンとして人気がある。
人気ゲームでは一般的なように、コミュニティが設計したレベルが多数ある。
プレイヤーやレベルライターがそのようなコミュニティ貢献の難易度を決定することはしばしば困難である。
本研究では,StepManiaレベルの難易度予測タスクを順序回帰(OR)タスクとして形式化し,解析する。
私たちは、このデータのより広範囲で多様な選択を標準化し、5つのデータセットを作成します。
我々は、多くの競合モデルや非orモデルを評価し、ニューラルネットワークベースのモデルがアートの状態を著しく上回り、ステップマニアレベルのデータが深層やモデルにとって優れたテストベッドとなることを示す。
我々は、トレーニングされたモデルが人間のラベルよりも優れていることを示すユーザー実験で結論付けた。
関連論文リスト
- LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文 参考訳(メタデータ) (2024-10-14T17:51:23Z) - Improving Conditional Level Generation using Automated Validation in Match-3 Games [39.887603099741696]
本稿では,既存のレベル設計から学習するモデルを改善する新しい手法であるAvalonを提案する。
条件付き変分オートエンコーダを用いて,Match-3レベルのレイアウトを生成する。
条件付けの困難さを伴わないアブレーションモデルと比較することにより,我々のアプローチを定量的に評価する。
論文 参考訳(メタデータ) (2024-09-10T09:07:47Z) - Difficulty Modelling in Mobile Puzzle Games: An Empirical Study on
Different Methods to Combine Player Analytics and Simulated Data [0.0]
一般的なプラクティスは、プレイヤーとコンテンツとのインタラクションによって収集されたデータからメトリクスを作成することです。
これにより、コンテンツがリリースされた後にのみ見積が可能であり、将来のプレイヤーの特徴を考慮しない。
本稿では,そのような条件下での難易度推定の潜在的な解を多数提示する。
論文 参考訳(メタデータ) (2024-01-30T20:51:42Z) - The Unreasonable Effectiveness of Easy Training Data for Hard Tasks [84.30018805150607]
既存の事前学習言語モデルが比較的容易にハードなデータから一般化されることがしばしばあるという驚くべき結論を提示する。
本稿では,テキスト内学習,線形ヘッド,QLoRAなどの簡単な微調整手法を用いて,このような難解な一般化を実演する。
本研究は, LMの難解な一般化が, 研究課題に対して驚くほど強いことを結論づける。
論文 参考訳(メタデータ) (2024-01-12T18:36:29Z) - Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models [115.501751261878]
人為的なデータに基づく微調整言語モデル(LM)が普及している。
我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。
ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2023-12-11T18:17:43Z) - Inverse Scaling: When Bigger Isn't Better [80.42834197416444]
大規模言語モデル(LM)は、スケールの増大による全体的な損失に対する予測可能な改善を示している。
我々は,LMが逆スケーリングや,スケールの増大に伴うタスクパフォーマンスの悪化を示す可能性があるという主張を裏付ける証拠を示す。
論文 参考訳(メタデータ) (2023-06-15T20:11:23Z) - Personalized Game Difficulty Prediction Using Factorization Machines [0.9558392439655011]
コンテンツレコメンデーションからの手法を借りて,ゲームレベルのパーソナライズした難易度推定に寄与する。
我々は、プレイヤーが将来のゲームレベルを通過させるのに必要な試行回数と、他のプレイヤーがプレイする以前のレベルの試行回数に基づいて、難易度を予測することができる。
この結果から,FMはゲームデザイナーがプレイヤー体験を最適化し,プレイヤーとゲームについてより深く学ぶことができる,有望なツールであることが示唆された。
論文 参考訳(メタデータ) (2022-09-06T08:03:46Z) - Towards Objective Metrics for Procedurally Generated Video Game Levels [2.320417845168326]
シミュレーションに基づく評価指標を2つ導入し, 生成レベルの多様性と難易度を測定した。
我々の多様性指標は、現在の方法よりも、レベルサイズや表現の変化に対して堅牢であることを示す。
難易度基準は、テスト済みのドメインの1つで既存の難易度推定と相関するが、他のドメインではいくつかの課題に直面している。
論文 参考訳(メタデータ) (2022-01-25T14:13:50Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Style Curriculum Learning for Robust Medical Image Segmentation [62.02435329931057]
深部セグメンテーションモデルは、トレーニングデータセットとテストデータセットの間の画像強度の分散シフトによって、しばしば劣化する。
本稿では,そのような分散シフトが存在する場合に,ロバストなセグメンテーションを確保するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-01T08:56:24Z) - Statistical Modelling of Level Difficulty in Puzzle Games [0.0]
我々は、古典的な成功確率を超えるパズルゲームに対して、レベル困難のモデルを定式化する。
モデルは、ゲーム『Lily's Garden by Tactile Games』から収集されたデータセットに適合し、評価される。
論文 参考訳(メタデータ) (2021-07-05T13:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。