論文の概要: WorldScore: A Unified Evaluation Benchmark for World Generation
- arxiv url: http://arxiv.org/abs/2504.00983v1
- Date: Tue, 01 Apr 2025 17:20:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 15:43:09.208771
- Title: WorldScore: A Unified Evaluation Benchmark for World Generation
- Title(参考訳): WorldScore: ワールドジェネレーションのための統一された評価ベンチマーク
- Authors: Haoyi Duan, Hong-Xing Yu, Sirui Chen, Li Fei-Fei, Jiajun Wu,
- Abstract要約: 我々は、ワールドジェネレーションのための最初の統一ベンチマークであるWorldScoreベンチマークを紹介する。
WorldScoreベンチマークには3000のテストサンプルのキュレートされたデータセットが含まれている。
WorldScoreのメトリクスは,3つの重要な側面 – 可制御性,品質,ダイナミック性 – を通じて生成された世界を評価します。
- 参考スコア(独自算出の注目度): 26.259206146192817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the WorldScore benchmark, the first unified benchmark for world generation. We decompose world generation into a sequence of next-scene generation tasks with explicit camera trajectory-based layout specifications, enabling unified evaluation of diverse approaches from 3D and 4D scene generation to video generation models. The WorldScore benchmark encompasses a curated dataset of 3,000 test examples that span diverse worlds: static and dynamic, indoor and outdoor, photorealistic and stylized. The WorldScore metrics evaluate generated worlds through three key aspects: controllability, quality, and dynamics. Through extensive evaluation of 19 representative models, including both open-source and closed-source ones, we reveal key insights and challenges for each category of models. Our dataset, evaluation code, and leaderboard can be found at https://haoyi-duan.github.io/WorldScore/
- Abstract(参考訳): 我々は、ワールドジェネレーションのための最初の統一ベンチマークであるWorldScoreベンチマークを紹介する。
本研究では,3Dおよび4Dシーン生成から映像生成モデルへの多様なアプローチの統一的な評価を可能にするために,カメラトラジェクトリに基づくレイアウト仕様を明示した次世代タスクに分解する。
WorldScoreベンチマークには、静的、動的、屋内、屋外、フォトリアリスティック、スタイリングなど、さまざまな世界にわたる3000のテストサンプルのキュレートされたデータセットが含まれている。
WorldScoreのメトリクスは,3つの重要な側面 – 可制御性,品質,ダイナミック性 – を通じて生成された世界を評価します。
オープンソースとクローズドソースの両方を含む19の代表的なモデルの広範な評価を通じて、モデルのカテゴリ毎に重要な洞察と課題を明らかにする。
私たちのデータセット、評価コード、リーダーボードはhttps://haoyi-duan.github.io/WorldScore/で確認できます。
関連論文リスト
- 3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models [94.48803082248872]
3D世代は急速に進歩しているが、3D評価の開発はペースを保っていない。
大規模人選好データセット3DGen-Benchを開発した。
次に、CLIPベースのスコアモデルである3DGen-ScoreとMLLMベースの自動評価器である3DGen-Evalを訓練する。
論文 参考訳(メタデータ) (2025-03-27T17:53:00Z) - SimWorld: A Unified Benchmark for Simulator-Conditioned Scene Generation via World Model [1.3700170633913733]
本稿では,世界モデルに基づくシミュレーション条件付きシーン生成エンジンを提案する。
実世界のシーンと一致したシミュレーションシステムを構築することで、シミュレーションデータとラベルを世界モデルにおけるデータ生成の条件として、任意のシーンに対して収集することができる。
その結果,これらの画像は下流知覚モデルの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-03-18T06:41:02Z) - What Are You Doing? A Closer Look at Controllable Human Video Generation [73.89117620413724]
What Are You Doing?」は、人間の制御可能な画像とビデオの生成を評価するための新しいベンチマークである。
このビデオは、1,544本のキャプション付きビデオで構成されており、56の細かなカテゴリーで細かな収集と注釈付けがなされている。
制御可能な画像・映像生成における7つの最先端モデルの詳細な解析を行う。
論文 参考訳(メタデータ) (2025-03-06T17:59:29Z) - WorldModelBench: Judging Video Generation Models As World Models [57.776769550453594]
ビデオ生成モデルは急速に進歩し、ロボット工学や自動運転といった意思決定アプリケーションをサポートするビデオワールドモデルとしての地位を確立している。
現在のベンチマークでは、これらの主張を厳格に評価することができず、一般的なビデオ品質にのみ焦点が当てられている。
アプリケーション駆動ドメインにおけるビデオ生成モデルのワールドモデリング能力を評価するためのベンチマークであるWorldModelBenchを提案する。
論文 参考訳(メタデータ) (2025-02-28T03:58:23Z) - Benchmarking and Learning Multi-Dimensional Quality Evaluator for Text-to-3D Generation [26.0726219629689]
近年,テキスト・ツー・3D生成は目覚ましい進歩を遂げているが,これらの手法の評価はいまだに困難である。
既存のベンチマークには、異なるプロンプトカテゴリと評価次元に関するきめ細かい評価が欠けている。
まず,MATE-3Dという総合ベンチマークを提案する。
ベンチマークには、単一のオブジェクト生成と複数のオブジェクト生成をカバーする、よく設計された8つのプロンプトカテゴリが含まれており、結果として1,280のテクスチャメッシュが生成される。
論文 参考訳(メタデータ) (2024-12-15T12:41:44Z) - From an Image to a Scene: Learning to Imagine the World from a Million 360 Videos [71.22810401256234]
オブジェクトやシーンの3次元理解は、人間が世界と対話する能力において重要な役割を果たす。
大規模合成およびオブジェクト中心の3Dデータセットは、オブジェクトの3D理解を持つモデルのトレーニングに有効であることが示されている。
我々は360-1M、360度ビデオデータセット、およびスケールの多様な視点から対応するフレームを効率的に見つけるプロセスを紹介した。
論文 参考訳(メタデータ) (2024-12-10T18:59:44Z) - VBench++: Comprehensive and Versatile Benchmark Suite for Video Generative Models [111.5892290894904]
VBenchは、"ビデオ生成品質"を特定の、階層的、そして非絡み合ったディメンションに分解するベンチマークスイートである。
我々は、人間の知覚とベンチマークの整合性を検証するために、人間の嗜好アノテーションのデータセットを提供する。
VBench++は、テキスト・トゥ・ビデオと画像・トゥ・ビデオの評価をサポートする。
論文 参考訳(メタデータ) (2024-11-20T17:54:41Z) - VBench: Comprehensive Benchmark Suite for Video Generative Models [100.43756570261384]
VBenchは、"ビデオ生成品質"を特定の、階層的、そして非絡み合ったディメンションに分解するベンチマークスイートである。
我々は、人間の知覚とベンチマークの整合性を検証するために、人間の嗜好アノテーションのデータセットを提供する。
VBenchは、すべてのプロンプト、評価方法、生成されたビデオ、人間の好みのアノテーションを含むオープンソースとして公開します。
論文 参考訳(メタデータ) (2023-11-29T18:39:01Z) - Stanford-ORB: A Real-World 3D Object Inverse Rendering Benchmark [31.357709524280022]
Stanford-ORBは、新しい現実世界の3Dオブジェクト逆レンダリングベンチマークである。
近年の逆レンダリングの進歩により、3Dコンテンツ生成における幅広い現実世界の応用が可能となった。
論文 参考訳(メタデータ) (2023-10-24T17:57:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。