論文の概要: PolyRoom: Room-aware Transformer for Floorplan Reconstruction
- arxiv url: http://arxiv.org/abs/2407.10439v1
- Date: Mon, 15 Jul 2024 04:53:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 16:20:45.756233
- Title: PolyRoom: Room-aware Transformer for Floorplan Reconstruction
- Title(参考訳): PolyRoom: フロアプラン再構築のためのルームアウェア変換器
- Authors: Yuzhou Liu, Lingjie Zhu, Xiaodong Ma, Hanqiao Ye, Xiang Gao, Xianwei Zheng, Shuhan Shen,
- Abstract要約: 点群からフロアプランを再構築する部屋対応トランスであるPolyRoomを提案する。
具体的には、トレーニング中の密集的な監視と角度情報の有効活用を可能にするため、一様サンプリングフロアプラン表現を採用する。
2つの広く使用されているデータセットの結果は、PolyRoomが現在の最先端の手法を量的にも質的にも上回っていることを示している。
- 参考スコア(独自算出の注目度): 17.154556344393743
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing geometry and topology structures from raw unstructured data has always been an important research topic in indoor mapping research. In this paper, we aim to reconstruct the floorplan with a vectorized representation from point clouds. Despite significant advancements achieved in recent years, current methods still encounter several challenges, such as missing corners or edges, inaccuracies in corner positions or angles, self-intersecting or overlapping polygons, and potentially implausible topology. To tackle these challenges, we present PolyRoom, a room-aware Transformer that leverages uniform sampling representation, room-aware query initialization, and room-aware self-attention for floorplan reconstruction. Specifically, we adopt a uniform sampling floorplan representation to enable dense supervision during training and effective utilization of angle information. Additionally, we propose a room-aware query initialization scheme to prevent non-polygonal sequences and introduce room-aware self-attention to enhance memory efficiency and model performance. Experimental results on two widely used datasets demonstrate that PolyRoom surpasses current state-of-the-art methods both quantitatively and qualitatively. Our code is available at: https://github.com/3dv-casia/PolyRoom/.
- Abstract(参考訳): 生の非構造データから幾何構造とトポロジー構造を再構成することは、屋内マッピング研究において常に重要な研究課題である。
本稿では,点雲からベクトル化された表現でフロアプランを再構築することを目的とする。
近年の進歩にもかかわらず、現在の手法は、角や縁の欠如、角の位置や角度の不正確さ、自己交差または重なり合う多角形、そして潜在的に予測できないトポロジーなど、いくつかの課題に直面している。
これらの課題に対処するために、一様サンプリング表現、ルームアウェアクエリ初期化、フロアプラン再構築のためのルームアウェアセルフアテンションを利用する、部屋アウェアトランスフォーマーであるPolyRoomを提案する。
具体的には、トレーニング中の密集的な監視と角度情報の有効活用を可能にするため、一様サンプリングフロアプラン表現を採用する。
さらに,非ポリゴンシーケンスを防止し,メモリ効率とモデル性能を向上させるために,部屋認識型クエリ初期化手法を提案する。
2つの広く使われているデータセットの実験結果は、PolyRoomが現在の最先端の手法を量的にも質的にも上回っていることを示している。
私たちのコードは、https://github.com/3dv-casia/PolyRoom/で利用可能です。
関連論文リスト
- FRI-Net: Floorplan Reconstruction via Room-wise Implicit Representation [18.157827697752317]
本研究では,FRI-Netと呼ばれる新しい3次元点雲からの2次元フロアプラン再構築手法を提案する。
フロアプランの幾何学的事前をトレーニング戦略に組み込むことにより、生成された部屋ポリゴンはより幾何学的に規則的である。
提案手法は,提案手法の有効性を実証し,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-07-15T13:01:44Z) - P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - PolyDiffuse: Polygonal Shape Reconstruction via Guided Set Diffusion
Models [26.819929072916363]
PolyDiffuseは、視覚センサデータを拡散モデル(DM)で多角形に変換する新しい構造化再構成アルゴリズムである。
DMは、生成AIが爆発する中、新興機械であり、センサデータに条件付けされた生成プロセスとして再構築を定式化している。
我々は,多角形の集合としてのフロアプランと,一組のポリラインとしての自律走行車用HDマップという,2種類の多角形形状を再構築するためのアプローチを評価した。
論文 参考訳(メタデータ) (2023-06-02T11:38:04Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Recurrent Generic Contour-based Instance Segmentation with Progressive
Learning [111.31166268300817]
本稿では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。
従来のSnakeアルゴリズムに動機付け,提案したPolySnakeはより優れた,堅牢なセグメンテーション性能を実現する。
論文 参考訳(メタデータ) (2023-01-21T05:34:29Z) - GeoUDF: Surface Reconstruction from 3D Point Clouds via Geometry-guided
Distance Representation [73.77505964222632]
スパース点雲から離散曲面を再構成する問題に対処する学習ベース手法であるGeoUDFを提案する。
具体的には、UDFのための幾何誘導学習法とその勾配推定を提案する。
予測されたUDFから三角形メッシュを抽出するために,カスタマイズされたエッジベースマーチングキューブモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-30T06:02:01Z) - Connecting the Dots: Floorplan Reconstruction Using Two-Level Queries [27.564355569013706]
本稿では,複数の部屋の多角形を並列に生成するトランスフォーマーアーキテクチャを提案する。
提案手法は,Structured3DとSceneCADの2つの挑戦的データセットに対して,新たな最先端化を実現する。
追加情報、すなわちセマンティックルームタイプやドアや窓のようなアーキテクチャ要素を予測するために簡単に拡張できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:09Z) - PolyBuilding: Polygon Transformer for End-to-End Building Extraction [9.196604757138825]
PolyBuildingはリモートセンシング画像から建物のベクトル表現を予測する。
モデルはそれらの関係を学習し、画像からコンテキスト情報を符号化し、構築ポリゴンの最終セットを予測する。
また、ピクセルレベルのカバレッジ、インスタンスレベルの精度とリコール、幾何学レベルの特性など、新たな最先端性を実現している。
論文 参考訳(メタデータ) (2022-11-03T04:53:17Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - PoinTr: Diverse Point Cloud Completion with Geometry-Aware Transformers [81.71904691925428]
本稿では,ポイントクラウドの完了をセット・ツー・セットの翻訳問題として再定義する手法を提案する。
我々はまた、ポイントクラウド補完のためにトランスフォーマーエンコーダデコーダアーキテクチャを採用するPoinTrと呼ばれる新しいモデルも設計している。
提案手法は,新しいベンチマークと既存ベンチマークの両方において,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T17:58:56Z) - FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning [49.30194762653723]
本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
まず、新しいデータセットをコンパイルし、トレーニングサンプルを合成する新しいデータ拡張スキームを開発する。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴を関連付けるマルチタスク学習ネットワークである。
論文 参考訳(メタデータ) (2021-07-06T08:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。