論文の概要: VoxScene: Anchor-Conditioned Voxel Diffusion for Indoor Scene Arrangement
- arxiv url: http://arxiv.org/abs/2605.17102v1
- Date: Sat, 16 May 2026 18:10:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.608322
- Title: VoxScene: Anchor-Conditioned Voxel Diffusion for Indoor Scene Arrangement
- Title(参考訳): VoxScene:Anchor-conditioned Voxel Diffusion for indoor Scene Arrangement
- Authors: Haotian Mao, Yuhan Huang, Jiatao Lin, Yang Zhao, Hui Wang, Yiheng Zhang, Yuwang Wang, Chenliang Zhou, Yan Zhang, Fangcheng Zhong, Xubo Yang,
- Abstract要約: VoxSceneは3Dシーン合成に適したアンカー条件のボクセル拡散フレームワークである。
離散ボクセルの相互排他性を利用して空間的曖昧性を排除し,衝突のない配置を保証する。
- 参考スコア(独自算出の注目度): 21.464029085947697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present VoxScene, a novel anchor-conditioned voxel diffusion framework tailored for 3D scene synthesis. Current data-driven layout generation techniques typically rely on bounding proxies or implicit representations, which overlook volumetric structures. This geometric blindness inevitably leads to severe physical collisions and structural entanglement, particularly in densely populated environments. To overcome these limitations, we shift the paradigm to an explicit, object-centric voxel representation. Our pipeline sequentially synthesizes discrete volumetric occupancies conditioned on prior anchors and local context. By exploiting the mutually exclusive nature of discrete voxels, our approach eliminates spatial ambiguities and guarantees collision-free arrangements, even in highly complex environments. Furthermore, the synthesized high-fidelity voxel grids serve as discriminative geometric queries for downstream asset retrieval. Extensive experiments demonstrate the universality of our method, achieving state-of-the-art physical plausibility and unlocking shape diversity compared to existing layout planners.
- Abstract(参考訳): 本稿では,3次元シーン合成に適した新しいアンカー条件付きボクセル拡散フレームワークであるVoxSceneを紹介する。
現在のデータ駆動レイアウト生成技術は、典型的には、ボリューム構造を見渡すような、バウンディングプロキシや暗黙の表現に依存している。
この幾何学的な盲目は必然的に激しい物理的衝突と構造的絡み合い、特に密集した環境において起こる。
これらの制限を克服するために、パラダイムを明示的なオブジェクト中心のボクセル表現にシフトする。
我々のパイプラインは、先行アンカーと局所的な文脈で条件付けられた離散的な体積占有を逐次的に合成する。
離散ボクセルの相互排他的性質を生かして空間的曖昧性を排除し,高度に複雑な環境においても衝突のない配置を保証する。
さらに、合成された高忠実度ボクセルグリッドは下流資産検索のための識別幾何学的クエリとして機能する。
提案手法の普遍性を実証し,既存のレイアウトプランナと比較して,最先端の物理的妥当性と形状の多様性を解放する実験を行った。
関連論文リスト
- Orchestrating Spatial Semantics via a Zone-Graph Paradigm for Intricate Indoor Scene Generation [18.745553312257503]
自律的な3次元室内合成のための統合フレームワークである ZoneMaestro を提案する。
ZoneMaestroは、新しいトポロジベースのロジックを内部化することによって、高レベルのセマンティックインテントを機能ゾーンと制約に変換する。
ゾーンマエストロは, 密度安全二分法を, 構造的コヒーレンスとインテンションの両面において, 最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-05-04T12:40:37Z) - Semantic Foam: Unifying Spatial and Semantic Scene Decomposition [38.873957037866965]
我々はSemantic Foamを導入し、最近提案されたRadiant Foam表現を意味分解タスクに拡張する。
提案手法は,Radiant Foam's Voronoi メッシュの自然体積分解とセルレベルでパラメータ化された明示的な意味的特徴場を統合する。
実験の結果,ガウスグループやSAGAのような最先端の手法と比較して,オブジェクトレベルのセグメンテーション性能が優れていることがわかった。
論文 参考訳(メタデータ) (2026-04-29T03:40:13Z) - StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。
最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。
結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文 参考訳(メタデータ) (2026-01-12T15:41:27Z) - StereoSpace: Depth-Free Synthesis of Stereo Geometry via End-to-End Diffusion in a Canonical Space [55.40440023281068]
本稿では,単分子対ステレオ合成のための拡散ベースのフレームワークであるStereoSpaceを紹介する。
標準整定空間と条件付けは、生成元が対応を推測し、非閉塞をエンドツーエンドに埋めるように誘導する。
論文 参考訳(メタデータ) (2025-12-11T18:59:59Z) - CogStereo: Neural Stereo Matching with Implicit Spatial Cognition Embedding [5.663297699303346]
CogStereoは、データセット固有の前提に頼らずに、挑戦的な領域に対処する新しいフレームワークである。
CogStereoは、単眼深度特徴を先行として使用することにより、暗黙の空間認識を洗練プロセスに組み込む。
CogStereoは、画素ワイド不確実性と認識誘導特徴を組み合わせた二重条件改善機構を用いて、ミスマッチの一貫したグローバルな補正を行う。
論文 参考訳(メタデータ) (2025-10-25T02:09:04Z) - OpenHype: Hyperbolic Embeddings for Hierarchical Open-Vocabulary Radiance Fields [25.81679730373062]
連続的な双曲型潜在空間を用いてシーン階層を表現する新しい手法であるOpenHypeを提案する。
双曲幾何学の特性を活用することにより、OpenHypeは自然にマルチスケールな関係を符号化する。
提案手法は,標準ベンチマークにおける最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-10-24T13:17:56Z) - RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion [64.49056527678606]
本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-10-16T17:59:13Z) - RoomCraft: Controllable and Complete 3D Indoor Scene Generation [51.19602078504066]
RoomCraftは、実際の画像、スケッチ、テキスト記述をコヒーレントな3D屋内シーンに変換するマルチステージパイプラインである。
このアプローチでは,シーン生成パイプラインと制約駆動最適化フレームワークを組み合わせる。
RoomCraftは、リアルでセマンティックなコヒーレントで視覚的に魅力的な部屋レイアウトを生成する上で、既存の方法よりもはるかに優れています。
論文 参考訳(メタデータ) (2025-06-27T15:03:17Z) - X-Scene: Large-Scale Driving Scene Generation with High Fidelity and Flexible Controllability [49.4647778989539]
X-Sceneは大規模ドライビングシーン生成のための新しいフレームワークである。
幾何的複雑度と外観の忠実度の両方を実現し、フレキシブルな制御性を提供する。
X-Sceneは、大規模な運転シーン生成のための制御性と忠実性を大幅に向上させる。
論文 参考訳(メタデータ) (2025-06-16T14:43:18Z) - Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based
View Synthesis [70.40950409274312]
我々は、細い構造を再構築する能力を損なうことなく、表面への収束を促すために密度場を変更する。
また, メッシュの単純化と外観モデルの適合により, 融合型メッシュ方式を開発した。
私たちのモデルで生成されたコンパクトメッシュは、モバイルデバイス上でリアルタイムでレンダリングできます。
論文 参考訳(メタデータ) (2024-02-19T18:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。