論文の概要: AI-powered Contextual 3D Environment Generation: A Systematic Review
- arxiv url: http://arxiv.org/abs/2506.05449v1
- Date: Thu, 05 Jun 2025 15:56:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.172653
- Title: AI-powered Contextual 3D Environment Generation: A Systematic Review
- Title(参考訳): AIを活用したコンテキスト3D環境生成 : システムレビュー
- Authors: Miguel Silva, Alexandre Valle de Carvalho,
- Abstract要約: 本研究では,既存の3次元シーン生成のための生成AI技術について,体系的なレビューを行う。
最先端のアプローチを検討することで、シーンの真正性やテキスト入力の影響など、重要な課題が提示される。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generation of high-quality 3D environments is crucial for industries such as gaming, virtual reality, and cinema, yet remains resource-intensive due to the reliance on manual processes. This study performs a systematic review of existing generative AI techniques for 3D scene generation, analyzing their characteristics, strengths, limitations, and potential for improvement. By examining state-of-the-art approaches, it presents key challenges such as scene authenticity and the influence of textual inputs. Special attention is given to how AI can blend different stylistic domains while maintaining coherence, the impact of training data on output quality, and the limitations of current models. In addition, this review surveys existing evaluation metrics for assessing realism and explores how industry professionals incorporate AI into their workflows. The findings of this study aim to provide a comprehensive understanding of the current landscape and serve as a foundation for future research on AI-driven 3D content generation. Key findings include that advanced generative architectures enable high-quality 3D content creation at a high computational cost, effective multi-modal integration techniques like cross-attention and latent space alignment facilitate text-to-3D tasks, and the quality and diversity of training data combined with comprehensive evaluation metrics are critical to achieving scalable, robust 3D scene generation.
- Abstract(参考訳): 高品質な3D環境の創出は、ゲーム、バーチャルリアリティー、映画などの産業にとって重要であるが、手作業のプロセスに依存しているため資源集約的なままである。
本研究では,既存の3次元シーン生成のための生成AI技術を体系的に検討し,その特性,強度,限界,改善の可能性を分析した。
最先端のアプローチを検討することで、シーンの真正性やテキスト入力の影響など、重要な課題が提示される。
AIがコヒーレンスを維持しながら異なるスタイルのドメインをブレンドする方法、トレーニングデータの出力品質への影響、現在のモデルの制限について特に注目されている。
さらに、本レビューでは、リアリズムを評価するための既存の評価指標を調査し、業界の専門家がAIをワークフローに組み込む方法について調査する。
本研究は,現在の景観を包括的に理解し,AIによる3Dコンテンツ生成の基盤となることを目的としている。
鍵となる発見は、高度な生成アーキテクチャにより、高い計算コストで高品質な3Dコンテンツ作成が可能であり、クロスアテンションや潜在空間アライメントのような効果的なマルチモーダル統合技術は、テキストから3Dタスクを容易にし、包括的な評価指標と組み合わせたトレーニングデータの品質と多様性は、スケーラブルで堅牢な3Dシーン生成を実現するために重要である。
関連論文リスト
- MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans [76.39726619818896]
EAI(Embodied AI)の研究は、スキル獲得、シミュレート・トゥ・リアル・トランスファー、一般化をサポートするために、高品質で多様な3Dシーンを必要とする。
既存のデータセットは、このプロセスがアーティスト主導の設計に大きく依存していることを示している。
実世界のスキャンから構築した大規模でシミュレート可能な3DシーンデータセットであるMetaScenesを提案する。
論文 参考訳(メタデータ) (2025-05-05T06:13:25Z) - Recent Advance in 3D Object and Scene Generation: A Survey [14.673302810271219]
本調査は,最先端の3D生成技術に関する構造化された理解を読者に提供することを目的としている。
本稿では,レイアウト誘導合成,2次元先行シーン生成,ルール駆動モデリングの3つの主要なパラダイムに着目した。
論文 参考訳(メタデータ) (2025-04-16T03:22:06Z) - Embodied Intelligence for 3D Understanding: A Survey on 3D Scene Question Answering [28.717312557697376]
3D Scene Question Answeringは、3D視覚認識と自然言語処理を統合した学際的なタスクである。
大規模マルチモーダルモデリングの最近の進歩は、多様なデータセットの作成を促し、3D SQAのための命令チューニングとゼロショット手法の開発を加速させた。
本稿では,3D SQAを総合的に調査し,データセット,方法論,評価指標を体系的に検討する。
論文 参考訳(メタデータ) (2025-02-01T07:01:33Z) - 3DGCQA: A Quality Assessment Database for 3D AI-Generated Contents [50.730468291265886]
本稿では,テキスト・ツー・3D生成手法を用いて構築した新しい3DGC品質評価データセットである3DGCQAを提案する。
可視化によって、生成された3DGCに6つの共通の歪みカテゴリが存在することが直感的に明らかになる。
主観的品質評価は評価者によって行われ、その評価は異なる生成方法における品質の顕著な変動を示す。
いくつかの客観的品質評価アルゴリズムが3DGCQAデータセットでテストされている。
論文 参考訳(メタデータ) (2024-09-11T12:47:40Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - A Survey On Text-to-3D Contents Generation In The Wild [5.875257756382124]
3Dコンテンツ作成は、ゲーム、ロボットシミュレーション、仮想現実など、さまざまなアプリケーションにおいて重要な役割を果たす。
この課題に対処するために、テキストから3D生成技術が、3D生成を自動化するための有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2024-05-15T15:23:22Z) - A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing
Objects in 3D Scenes [80.20670062509723]
3Dシークエンスキャプションは、3Dシーンの詳細な説明を作成することを目的とした、視覚言語によるブリッジングタスクである。
2次元の視覚的キャプションと比較して、現実世界の表現が密接なため、大きな可能性と課題が提示される。
既存手法の人気と成功にもかかわらず、この分野の進歩を要約した総合的な調査は乏しい。
論文 参考訳(メタデータ) (2024-03-12T10:04:08Z) - 3D objects and scenes classification, recognition, segmentation, and
reconstruction using 3D point cloud data: A review [5.85206759397617]
3次元(3D)点雲解析は、現実的な画像やマシンビジョンにおいて魅力的な対象の1つとなっている。
最近、ディープラーニングモデルのような様々な技術を用いて、新しい戦略の開発に多大な努力が注がれている。
オブジェクトやシーンの検出,認識,セグメンテーション,再構築など,3Dポイントで行うさまざまなタスクについて検討した。
論文 参考訳(メタデータ) (2023-06-09T15:45:23Z) - Joint Supervised and Self-Supervised Learning for 3D Real-World
Challenges [16.328866317851187]
ポイントクラウド処理と3D形状理解は、ディープラーニング技術が大きな可能性を実証する難しいタスクである。
ここでは、データ不足と大きなドメインギャップにより教師付き学習が失敗する合成および実世界の点雲を含むいくつかのシナリオについて考察する。
形状分類や部分分割の主課題を学習しながら3次元パズルを解くマルチタスクモデルにより、自己超越を利用して、標準的な特徴表現を豊かにすることを提案する。
論文 参考訳(メタデータ) (2020-04-15T23:34:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。