論文の概要: ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks
- arxiv url: http://arxiv.org/abs/2510.18455v1
- Date: Tue, 21 Oct 2025 09:28:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.239666
- Title: ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks
- Title(参考訳): ChronoPlay: ゲームRAGベンチマークにおけるデュアルダイナミクスと認証をモデル化するフレームワーク
- Authors: Liyang He, Yuren Zhang, Ziwei Zhu, Zhenghui Li, Shiwei Tong,
- Abstract要約: ChronoPlayは、ゲームRAGベンチマークの自動および連続生成のためのフレームワークである。
3つの異なるゲームでフレームワークをインスタンス化し、ゲーム領域で最初の動的RAGベンチマークを作成します。
- 参考スコア(独自算出の注目度): 9.557567437027478
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval Augmented Generation (RAG) systems are increasingly vital in dynamic domains like online gaming, yet the lack of a dedicated benchmark has impeded standardized evaluation in this area. The core difficulty lies in Dual Dynamics: the constant interplay between game content updates and the shifting focus of the player community. Furthermore, the necessity of automating such a benchmark introduces a critical requirement for player-centric authenticity to ensure generated questions are realistic. To address this integrated challenge, we introduce ChronoPlay, a novel framework for the automated and continuous generation of game RAG benchmarks. ChronoPlay utilizes a dual-dynamic update mechanism to track both forms of change, and a dual-source synthesis engine that draws from official sources and player community to ensure both factual correctness and authentic query patterns. We instantiate our framework on three distinct games to create the first dynamic RAG benchmark for the gaming domain, offering new insights into model performance under these complex and realistic conditions. Code is avaliable at: https://github.com/hly1998/ChronoPlay.
- Abstract(参考訳): Retrieval Augmented Generation (RAG) システムは、オンラインゲームのような動的ドメインにおいてますます重要になっているが、専用ベンチマークの欠如により、この分野の標準化された評価が妨げられている。
ゲームコンテンツのアップデートとプレイヤーコミュニティのシフトする焦点の間の絶え間ない相互作用である。
さらに、そのようなベンチマークを自動化する必要性は、生成した質問が現実的であることを保証するために、プレイヤー中心の認証に重要な要件を導入する。
この統合的な課題に対処するため,ゲームRAGベンチマークの自動および連続生成のための新しいフレームワークであるChronoPlayを紹介した。
ChronoPlayは、両方のフォームの変更を追跡するためのデュアルダイナミックアップデートメカニズムと、公式ソースとプレーヤコミュニティから引き出されたデュアルソース合成エンジンを使用して、事実の正しさと真正なクエリパターンの両方を保証する。
我々は3つの異なるゲームに関するフレームワークをインスタンス化し、ゲーム領域における最初の動的RAGベンチマークを作成し、これらの複雑で現実的な条件下でのモデルパフォーマンスに関する新たな洞察を提供する。
コードは https://github.com/hly1998/ChronoPlay.com で検証可能である。
関連論文リスト
- ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。
Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。
モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文 参考訳(メタデータ) (2025-03-27T16:39:40Z) - Model as a Game: On Numerical and Spatial Consistency for Generative Games [117.36098212829766]
本稿では,モデル・アズ・ア・ゲーム(MaaG)のメカニズムを十分に構築した上で,モデル・アズ・ア・ゲーム(MaaG)を真に構成するものを探るため,生成ゲームのパラダイムを再考する。
DiTアーキテクチャに基づいて,(1) LogicNetを統合してイベントトリガを決定する数値モジュール,(2) 探索領域のマップを維持する空間モジュール,(2) 生成中の位置情報を検索して連続性を確保する,という2つの特殊なモジュールを設計する。
論文 参考訳(メタデータ) (2025-03-27T05:46:15Z) - Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。
既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。
我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-12-11T06:35:18Z) - Unbounded: A Generative Infinite Game of Character Life Simulation [68.37260000219479]
生成モデルを用いて,有限なハードコードシステムの境界を超越したゲームである生成無限ゲームの概念を導入する。
我々は、生成AIの最近の進歩を活用して、生成モデルに完全にカプセル化されたキャラクターライフシミュレーションゲームUnboundedを作成する。
論文 参考訳(メタデータ) (2024-10-24T17:59:31Z) - A Text-to-Game Engine for UGC-Based Role-Playing Games [6.5715027492220734]
本稿では,単純なテキスト入力を複雑なマルチモーダルRPG体験に変換する基礎モデルを活用する,テキスト・ツー・ゲームエンジンの新しいフレームワークを提案する。
エンジンは動的にゲームナラティブを生成し、テキスト、ビジュアル、メカニックを統合すると同時に、プレイヤーのインタラクションに基づいてキャラクター、環境、ゲームプレイをリアルタイムで適応させる。
論文 参考訳(メタデータ) (2024-07-11T05:33:19Z) - FDQN: A Flexible Deep Q-Network Framework for Game Automation [0.0]
本研究では,CNNを用いて高次元センサデータをリアルタイムに処理する,最先端のフレキシブルQ-Network (FDQN) フレームワークを提案する。
モジュール構造で設計されており、フレームワークのコア部分に触れることなく、他のHTMLベースのゲームに簡単に適応できる。
論文 参考訳(メタデータ) (2024-05-29T05:00:50Z) - Dynabench: Rethinking Benchmarking in NLP [82.26699038776812]
動的データセットの作成とモデルベンチマークのためのオープンソースプラットフォームであるdynabenchを紹介する。
DynabenchはWebブラウザで動作し、ループ内の人間とモデルデータセットの作成をサポートする。
私たちは、これらの概念を図示し、プラットフォームの約束を強調する4つの初期のNLPタスクを報告します。
論文 参考訳(メタデータ) (2021-04-07T17:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。