論文の概要: Orchestrating Spatial Semantics via a Zone-Graph Paradigm for Intricate Indoor Scene Generation
- arxiv url: http://arxiv.org/abs/2605.02537v1
- Date: Mon, 04 May 2026 12:40:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.285587
- Title: Orchestrating Spatial Semantics via a Zone-Graph Paradigm for Intricate Indoor Scene Generation
- Title(参考訳): 複雑な屋内シーン生成のためのゾーングラフパラダイムによる空間意味論のオーケストレーション
- Authors: Meisheng Zhang, Shizhao Sun, Yang Zhao, Ziyuan Liu, Zhijun Gao, Jiang Bian,
- Abstract要約: 自律的な3次元室内合成のための統合フレームワークである ZoneMaestro を提案する。
ZoneMaestroは、新しいトポロジベースのロジックを内部化することによって、高レベルのセマンティックインテントを機能ゾーンと制約に変換する。
ゾーンマエストロは, 密度安全二分法を, 構造的コヒーレンスとインテンションの両面において, 最先端のベースラインを著しく上回っていることを示す。
- 参考スコア(独自算出の注目度): 18.745553312257503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous 3D indoor scene synthesis breaks down in non-convex rooms with tightly coupled spatial constraints. Data-driven generators lack topological priors for long-horizon planning, while iterative agents fragment semantics and become geometrically brittle. We present ZoneMaestro, a unified framework that shifts the paradigm from object-centric synthesis to Zone-Graph Orchestration. By internalizing a novel zone-based logic, ZoneMaestro translates high-level semantic intent into functional zones and topological constraints, enabling robust adaptation to diverse architectural forms. To support this, we construct Zone-Scene-10K, a large-scale dataset enriched with explicit Zone-Graph annotations. We further introduce an Alternating Alignment Strategy that cycles between reasoning internalization and Zone-Aware Group Relative Policy Optimization (Z-GRPO), effectively reconciling the tension between semantic richness and geometric validity without relying on external physics engines. To rigorously evaluate spatial intelligence beyond convex primitives, we formally define the task of Intricate Spatial Orchestration and release SCALE, a stress-test benchmark for irregular indoor scenarios with complex, dense spatial relations. Extensive experiments demonstrate that ZoneMaestro resolves the density-safety dichotomy, significantly outperforming state-of-the-art baselines in both structural coherence and intent adherence.
- Abstract(参考訳): 空間制約が密接な非凸室における3次元室内シーンの自動合成
データ駆動ジェネレータは、長期計画のトポロジカルな先行性を欠いているが、反復的エージェントは断片的セマンティクスを分解し、幾何学的に不安定になる。
ZoneMaestroは、オブジェクト中心の合成からゾーングラフオーケストレーションへパラダイムをシフトする統合フレームワークです。
ZoneMaestroは、新しいゾーンベースのロジックを内部化することによって、高レベルのセマンティックインテントを機能ゾーンとトポロジ的制約に変換し、多様なアーキテクチャ形式への堅牢な適応を可能にする。
これをサポートするために,明示的なゾーングラフアノテーションを付加した大規模データセットである Zone-Scene-10K を構築した。
さらに、推論内部化とゾーン・アウェア・グループ相対政策最適化(Z-GRPO)の間を循環させ、外部物理エンジンを頼らずに意味豊かさと幾何学的妥当性の緊張を効果的に緩和する代替アライメント戦略を導入する。
コンベックスプリミティブを超える空間知能を厳密に評価するために,複雑で密密な空間関係を持つ不規則な屋内シナリオを対象としたストレステストベンチマークであるIntricate Spatial Orchestration and Release SCALEを正式に定義する。
広範囲にわたる実験により、ゾーンマエストロは密度安全二分法を解決し、構造的コヒーレンスとインテンションの両面において最先端のベースラインを著しく上回ることを示した。
関連論文リスト
- Riemannian and Symplectic Geometry for Hierarchical Text-Driven Place Recognition [6.392844932864485]
SympLocは、粗い段階における多レベルアライメントを備えた、新しい粗大な局所化フレームワークである。
既存の最先端のアプローチと比較して、Top-1リコール@10mでは19%改善されている。
論文 参考訳(メタデータ) (2026-04-02T04:13:42Z) - LG-HCC: Local Geometry-Aware Hierarchical Context Compression for 3D Gaussian Splatting [77.81227097905865]
アンカーベースの3DGS圧縮スキームは、いくつかの高度な文脈モデルを通してガウスの冗長性を減少させる。
本稿では, アンカープルーニングとエントロピー符号化にアンカー幾何学的相関を組み込んだ3DGSのための局所幾何学的階層型コンテキスト圧縮フレームワークを提案する。
実験の結果、LG-HCCは構造保存の問題を効果的に緩和し、Mip-NeRF360データセット上のScaffold-GSベースラインと比較して最大30.85倍のストレージを削減した。
論文 参考訳(メタデータ) (2026-03-30T13:39:35Z) - Thinking with Geometry: Active Geometry Integration for Spatial Reasoning [68.59084007360615]
我々は,能動的知覚にパラダイム・パッシブ・フュージョンをシフトさせるフレームワークであるGeoThinkerを提案する。
特徴混合の代わりに、GeoThinkerはモデルが内部の推論要求に応じて条件付けられた幾何学的証拠を選択的に検索することを可能にする。
その結果,次世代の空間知能には,空間構造を積極的に統合する能力が不可欠であることが示唆された。
論文 参考訳(メタデータ) (2026-02-05T18:59:32Z) - RSGround-R1: Rethinking Remote Sensing Visual Grounding through Spatial Reasoning [61.84363374647606]
リモートセンシングビジュアルグラウンドディング(RSVG)は、自然言語記述に基づく大規模空中画像における対象物体のローカライズを目的としている。
これらの記述はしばしば位置的手がかりに大きく依存しており、空間的推論においてMLLM(Multimodal Large Language Models)に固有の課題を提起している。
空間理解の高度化を図るために,textbfRSGround-R1 と呼ばれる推論誘導型位置認識後学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T12:35:57Z) - GFLAN: Generative Functional Layouts [1.1458853556386797]
GFLANは、フロアプラン合成を明示的な因子化によって、トポロジカルプランニングと幾何学的実現に再構成する生成フレームワークである。
提案手法は,2段階分解の原理を優先して,直接画素間あるいは壁面追跡生成から逸脱する。
論文 参考訳(メタデータ) (2025-12-18T07:52:47Z) - GeoGNN: Quantifying and Mitigating Semantic Drift in Text-Attributed Graphs [59.61242815508687]
テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、事前訓練された言語モデル(PLM)を使用してノードテキストを符号化し、これらの埋め込みを線形近傍アグリゲーションを通じて伝播する。
本研究は,意味的ドリフトの度合いを計測する局所PCAベースの計量を導入し,異なる凝集機構が多様体構造にどのように影響するかを解析するための最初の定量的枠組みを提供する。
論文 参考訳(メタデータ) (2025-11-12T06:48:43Z) - HierRelTriple: Guiding Indoor Layout Generation with Hierarchical Relationship Triplet Losses [52.70183252341687]
本稿では,空間的関係学習に着目した階層型三重項に基づく屋内関係学習手法HierRelTripleを提案する。
階層型リレーショナル三重項モデリングフレームワークであるHierRelTripleを導入する。
非条件レイアウト合成、フロアプラン条件付きレイアウト生成、シーン再構成の実験により、HierRelは空間関係のメトリクスを15%以上改善することを示した。
論文 参考訳(メタデータ) (2025-03-26T07:31:52Z) - EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks [24.41705039390567]
EmbodiedVSR (Embodied Visual Space Reasoning) は動的シーングラフ誘導型Chain-of-Thought (CoT)推論を統合する新しいフレームワークである。
本手法はタスク固有の微調整なしでゼロショット空間推論を可能にする。
実験により,我々のフレームワークは,既存のMLLM法よりも精度と推論コヒーレンスにおいて優れていることが示された。
論文 参考訳(メタデータ) (2025-03-14T05:06:07Z) - Achieving Hyperbolic-Like Expressiveness with Arbitrary Euclidean Regions: A New Approach to Hierarchical Embeddings [9.614222676567385]
本稿では,任意の幾何学的領域を埋め込み表現として用いることを支援するフレキシブルユークリッドフレームワークRegDを提案する。
RegDは、領域間の深さに基づく相似性を導入し、双曲幾何学の重要な性質をエミュレートすることで、双曲的表現性を実現する。
実世界の多様なデータセットに対する実証的な評価は、最先端の手法よりも一貫した性能向上を示す。
論文 参考訳(メタデータ) (2025-01-29T09:44:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。