論文の概要: VoxelCodeBench: Benchmarking 3D World Modeling Through Code Generation
- arxiv url: http://arxiv.org/abs/2604.02580v1
- Date: Thu, 02 Apr 2026 23:33:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.243698
- Title: VoxelCodeBench: Benchmarking 3D World Modeling Through Code Generation
- Title(参考訳): VoxelCodeBench: コード生成による3Dワールドモデリングのベンチマーク
- Authors: Yan Zheng, Florian Bordes,
- Abstract要約: 本稿では,3次元理解と環境生成のためのコード生成機能の解析を行うプラットフォームであるVoxelCodeを紹介する。
我々のプラットフォームは、自然言語タスク仕様、Unreal EngineでのAPI駆動コード実行、自動メトリクスと人的評価の両方をサポートする統合評価パイプラインを統合しています。
- 参考スコア(独自算出の注目度): 15.578526245420859
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating code generation models for 3D spatial reasoning requires executing generated code in realistic environments and assessing outputs beyond surface-level correctness. We introduce a platform VoxelCode, for analyzing code generation capabilities for 3D understanding and environment creation. Our platform integrates natural language task specification, API-driven code execution in Unreal Engine, and a unified evaluation pipeline supporting both automated metrics and human assessment. To demonstrate its utility, we construct VoxelCodeBench, a benchmark of voxel manipulation tasks spanning three reasoning dimensions: symbolic interpretation, geometric construction, and artistic composition. Evaluating leading code generation models, we find that producing executable code is far easier than producing spatially correct outputs, with geometric construction and multi-object composition proving particularly challenging. By open-sourcing our platform and benchmark, we provide the community with extensible infrastructure for developing new 3D code generation benchmarks and probing spatial reasoning in future models.
- Abstract(参考訳): 3次元空間推論のためのコード生成モデルを評価するには、現実的な環境で生成されたコードを実行し、表面レベルの正確性を超えたアウトプットを評価する必要がある。
本稿では,3次元理解と環境生成のためのコード生成機能の解析を行うプラットフォームであるVoxelCodeを紹介する。
我々のプラットフォームは、自然言語タスク仕様、Unreal EngineでのAPI駆動コード実行、自動メトリクスと人的評価の両方をサポートする統合評価パイプラインを統合しています。
実用性を示すために,VoxelCodeBenchは,3つの推論次元(記号解釈,幾何学的構成,芸術的構成)にまたがるボクセル操作タスクのベンチマークである。
先導的なコード生成モデルを評価すると、空間的に正しい出力を生成するよりも実行可能コードを生成する方がはるかに容易であることが分かり、幾何学的構成と多目的合成は特に困難である。
プラットフォームとベンチマークをオープンソース化することで、私たちはコミュニティに新しい3Dコード生成ベンチマークを開発し、将来のモデルで空間的推論を探索するための拡張可能なインフラを提供します。
関連論文リスト
- Benchmarking PhD-Level Coding in 3D Geometric Computer Vision [43.42170296855238]
3Dビジョンのためのコーディングを評価するベンチマークであるGeoCodeBenchを紹介する。
現在のエコシステムを反映する8つの代表的なオープンソースモデルとクローズドソースモデルを評価した。
ベストモデルであるGPT-5は36.6%のパスレートしか達成できなかった。
論文 参考訳(メタデータ) (2026-03-31T17:50:55Z) - Bioinspired123D: Generative 3D Modeling System for Bioinspired Structures [1.1458853556386797]
パラメトリックプログラムを通じて製造可能な3D構造を直接生成する軽量かつモジュラーなコード・アズ・ジオメトリ・パイプラインであるBioinspired123Dを紹介する。
Bioinspired123Dの中核となるのが、Blender Pythonスクリプトに自然言語設計キューを翻訳するために微調整された、コンパクトな言語モデルであるBioinspired3Dである。
我々は,3次元幾何スクリプト生成のための新しいベンチマークの性能評価を行い,Bioinspired123Dが非微細化ベースモデルに対してほぼ4倍の改善を示した。
論文 参考訳(メタデータ) (2026-02-11T15:49:40Z) - Towards Realistic Project-Level Code Generation via Multi-Agent Collaboration and Semantic Architecture Modeling [7.753074942497876]
CodeProjectEvalは、12.7ファイルと2,388.6行のタスクを持つ18の現実世界リポジトリから構築されたプロジェクトレベルのコード生成データセットである。
プロジェクトをアーキテクチャ設計、スケルトン生成、コードフィリングステージに分解するマルチエージェントフレームワークであるProjectGenを提案する。
実験によると、ProjectGenは、52/124のテストケースを小さなプロジェクトレベルのコード生成データセットDevBenchに渡すことで、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-11-05T12:12:35Z) - Human-in-the-Loop: Quantitative Evaluation of 3D Models Generation by Large Language Models [0.0]
本稿では,大規模言語モデルの生成した3次元モデルの定量的評価のためのループ・フレームワークの人間について紹介する。
本稿では, 体積精度, 表面アライメント, 次元忠実度, トポロジ的複雑度など, 類似度と複雑性の総合的な指標スイートを提案する。
本研究は,コードレベルが完璧に再構築され,意味的豊かさが向上し,生成精度が向上したことを示す。
論文 参考訳(メタデータ) (2025-09-06T11:04:15Z) - Unifi3D: A Study on 3D Representations for Generation and Reconstruction in a Common Framework [12.995265721478132]
本稿では,再構成・生成における3次元表現の性能を評価するための統合評価フレームワークを提案する。
プリプロセスやメッシュ再構築,オートエンコーダによる圧縮,生成など,3D生成パイプラインに関わるすべてのステップに対して,ベストプラクティスを導出します。
論文 参考訳(メタデータ) (2025-09-02T16:25:12Z) - Object-X: Learning to Reconstruct Multi-Modal 3D Object Representations [114.57192386025373]
Object-Xは多目的なマルチモーダル3D表現フレームワークである。
リッチなオブジェクトの埋め込みをエンコードして、幾何学的および視覚的再構成に復号することができる。
シーンアライメント、シングルイメージの3Dオブジェクト再構成、ローカライゼーションなど、さまざまなダウンストリームタスクをサポートする。
論文 参考訳(メタデータ) (2025-06-05T09:14:42Z) - Agentic 3D Scene Generation with Spatially Contextualized VLMs [67.31920821192323]
本稿では,複雑な3D環境の生成,理解,編集を可能にする新しいパラダイムを提案する。
我々は,VLMが空間コンテキストから反復的に読み取って更新するエージェント型3Dシーン生成パイプラインを開発した。
その結果,我々のフレームワークは多様かつ困難な入力を処理でき,事前の作業では観測できないような一般化のレベルを達成することができることがわかった。
論文 参考訳(メタデータ) (2025-05-26T15:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。