論文の概要: CAGE: Continuity-Aware edGE Network Unlocks Robust Floorplan Reconstruction
- arxiv url: http://arxiv.org/abs/2509.15459v2
- Date: Tue, 14 Oct 2025 20:13:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 15:32:13.990803
- Title: CAGE: Continuity-Aware edGE Network Unlocks Robust Floorplan Reconstruction
- Title(参考訳): CAGE:連続性を認識したEDGEネットワークがロバストなフロアプランの再構築を解除
- Authors: Yiyi Liu, Chunyang Liu, Bohan Wang, Weiqin Jiao, Bojian Wu, Lubin Fan, Yuwei Chen, Fashuai Li, Biao Xiong,
- Abstract要約: 我々は,点-雲密度マップから直接ベクトルフロアプランを再構築する堅牢なフレームワークであるCAGEを提案する。
CAGEは最先端のパフォーマンスを達成し、F1スコアは99.1%(部屋)、91.7%(コーナー)、89.3%(角度)である。
- 参考スコア(独自算出の注目度): 24.09888364478496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present CAGE (Continuity-Aware edGE) network, a robust framework for reconstructing vector floorplans directly from point-cloud density maps. Traditional corner-based polygon representations are highly sensitive to noise and incomplete observations, often resulting in fragmented or implausible layouts.Recent line grouping methods leverage structural cues to improve robustness but still struggle to recover fine geometric details. To address these limitations,we propose a native edge-centric formulation, modeling each wall segment as a directed, geometrically continuous edge. This representation enables inference of coherent floorplan structures, ensuring watertight, topologically valid room boundaries while improving robustness and reducing artifacts. Towards this design, we develop a dual-query transformer decoder that integrates perturbed and latent queries within a denoising framework, which not only stabilizes optimization but also accelerates convergence. Extensive experiments on Structured3D and SceneCAD show that CAGE achieves state-of-the-art performance, with F1 scores of 99.1% (rooms), 91.7% (corners), and 89.3% (angles). The method also demonstrates strong cross-dataset generalization, underscoring the efficacy of our architectural innovations. Code and pretrained models are available on our project page: https://github.com/ee-Liu/CAGE.git.
- Abstract(参考訳): CAGE(Continuity-Aware edGE)ネットワークは,点-クラウド密度マップから直接ベクトルフロアプランを再構築するための堅牢なフレームワークである。
従来のコーナーベースのポリゴン表現はノイズや不完全な観測に非常に敏感であり、しばしば断片化や不明瞭なレイアウトをもたらす。
これらの制約に対処するために,各壁セグメントを有向的かつ幾何学的に連続したエッジとしてモデル化する,ネイティブエッジ中心の定式化を提案する。
この表現は、コヒーレントなフロアプラン構造を推論し、水密で、トポロジカルに有効な部屋の境界を確保しつつ、ロバスト性を改善し、アーティファクトを低減できる。
この設計に向けて、最適化を安定化するだけでなく収束を加速する、摂動クエリと潜時クエリをデノナイジングフレームワークに統合するデュアルクエリトランスフォーマーデコーダを開発する。
Structured3DとSceneCADの大規模な実験により、CAGEは99.1%(部屋)、91.7%(コーナー)、89.3%(角度)の最先端のパフォーマンスを達成した。
この手法はまた、アーキテクチャの革新の有効性を裏付ける強力なクロスデータセットの一般化も示している。
コードと事前トレーニングされたモデルは、プロジェクトのページで利用可能です。
関連論文リスト
- StepVAR: Structure-Texture Guided Pruning for Visual Autoregressive Models [98.72926158261937]
本稿では,Visual AutoRegressive モデルのためのトレーニングフリートークン解析フレームワークを提案する。
我々は局所的なテクスチャの詳細を捉えるために軽量なハイパスフィルタを使用し、グローバルな構造情報を保存するために主成分分析(PCA)を活用している。
スパーストークンの下で有効な次世代の予測を維持するために,近接した特徴伝達戦略を導入する。
論文 参考訳(メタデータ) (2026-03-02T11:35:05Z) - FACE: A Face-based Autoregressive Representation for High-Fidelity and Efficient Mesh Generation [50.71369329585773]
フェースレベルでメッシュを生成する新しいAutoregressive AutoencoderフレームワークであるFACEを紹介する。
当社のワンフェイスワンツーケン戦略は、メッシュの基本構築ブロックである三角形の面を、単一の統一トークンとして扱います。
FACEは、標準ベンチマークで最先端の再構築品質を達成する。
論文 参考訳(メタデータ) (2026-03-02T06:47:15Z) - Raster2Seq: Polygon Sequence Generation for Floorplan Reconstruction [21.366278792227785]
本稿では,シーケンス・ツー・シーケンス・タスクとしてフロアプランをフレーミングするRaster2Seqを提案する。
自己回帰デコーダは、画像特徴および以前に生成されたコーナーに基づいて、次のコーナーを予測することを学ぶ。
提案手法は,標準ベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2026-02-09T18:58:46Z) - FloorplanVLM: A Vision-Language Model for Floorplan Vectorization [15.691267151619442]
本稿では,ベクトル化を画像条件付きシーケンスモデリングタスクとして再構成する統合フレームワークFloorplanVLMを提案する。
この「ピクセル・ツー・シーケンス」パラダイムは、壁や湾曲した弧のような複雑な接地における正確で全体的な制約満足度を可能にする。
論文 参考訳(メタデータ) (2026-02-06T08:57:52Z) - ControlVP: Interactive Geometric Refinement of AI-Generated Images with Consistent Vanishing Points [32.23473666846317]
生成した画像の点不整合を補正するユーザガイドフレームワークである制御VPを提案する。
提案手法は, 構造物の輪郭から導出される構造的ガイダンスを組み込むことにより, 事前学習拡散モデルを拡張する。
本手法は,ベースラインに匹敵する視力を維持しながら,グローバルな幾何整合性を向上させる。
論文 参考訳(メタデータ) (2025-12-08T12:38:11Z) - Enhancing Floor Plan Recognition: A Hybrid Mix-Transformer and U-Net Approach for Precise Wall Segmentation [0.0]
本研究では,Mix-TransformerエンコーダとU-Netデコーダを組み合わせたハイブリッドニューラルネットワークMitUNetを紹介する。
我々の手法は精度とリコールのバランスを保ち、正確な境界回復を保証する。
CubiCasa5kデータセットと独自の地域データセットの実験は、構造的に正しいマスクを生成する上でのMitUNetの優位性を示している。
論文 参考訳(メタデータ) (2025-12-02T04:47:53Z) - TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - Rethinking Multimodal Point Cloud Completion: A Completion-by-Correction Perspective [8.276620253870338]
ポイント雲の完成は、部分的な観測から完全な3次元形状を再構築することを目的としている。
ほとんどのメソッドは、いまだにCompletion-by-Inpaintingパラダイムに従っている。
完全形状から始まるコンプリーション・バイ・コレクション(Completion-by-Correction)を提案する。
論文 参考訳(メタデータ) (2025-11-15T11:51:13Z) - Light-SQ: Structure-aware Shape Abstraction with Superquadrics for Generated Meshes [60.92139345612904]
我々は、新しいスーパークワッドリックベースの最適化フレームワークLight-SQを提案する。
本稿では,構造対応ボリューム分解によるブロック再配置戦略を提案する。
実験によると、Light-SQはスーパークワッドリックで効率よく、高忠実で、編集可能な形状の抽象化を可能にする。
論文 参考訳(メタデータ) (2025-09-29T16:18:32Z) - Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [59.17489431187807]
本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。
本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文 参考訳(メタデータ) (2025-09-18T13:45:08Z) - Geometry-Editable and Appearance-Preserving Object Compositon [67.98806888489385]
汎用オブジェクト合成(GOC)は、対象オブジェクトを望まれる幾何学的性質を持つ背景シーンにシームレスに統合することを目的としている。
近年のアプローチは意味的埋め込みを導出し、それらを高度な拡散モデルに統合し、幾何学的に編集可能な生成を可能にする。
本稿では,まずセマンティックな埋め込みを活用して,所望の幾何学的変換を暗黙的にキャプチャするDistangled Geometry-editable and Outearance-Preserving Diffusionモデルを提案する。
論文 参考訳(メタデータ) (2025-05-27T09:05:28Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - CornerFormer: Boosting Corner Representation for Fine-Grained Structured
Reconstruction [20.04081992616026]
構造復元のための改良されたコーナー表現法を提案する。
隣接する角や小さな縁など、きめ細かい構造を再構築する方がよい。
コーナーでは+1.9%@F-1、エッジでは+3.0%@F-1である。
論文 参考訳(メタデータ) (2023-04-14T11:51:26Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Quantization in Relative Gradient Angle Domain For Building Polygon
Estimation [88.80146152060888]
CNNアプローチは、しばしばノイズの多いエッジや丸いコーナーを含む不正確な建築形態を生成する。
CNNセグメンテーション出力から角状かつ簡潔なビルディングポリゴンを生成するために,ビルディングコーナーの事前知識を利用するモジュールを提案する。
提案手法は, 円形近似によるCNN出力を, より鮮明な形状の建物足跡に改良することを示した。
論文 参考訳(メタデータ) (2020-07-10T21:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。