論文の概要: FloorSAM: SAM-Guided Floorplan Reconstruction with Semantic-Geometric Fusion
- arxiv url: http://arxiv.org/abs/2509.15750v1
- Date: Fri, 19 Sep 2025 08:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.076852
- Title: FloorSAM: SAM-Guided Floorplan Reconstruction with Semantic-Geometric Fusion
- Title(参考訳): FloorSAM:Semantic-Geometric Fusionを用いたSAM誘導フロアプラン再構築
- Authors: Han Ye, Haofu Wang, Yunchi Zhang, Jiangjian Xiao, Yuqiang Jin, Jinyuan Liu, Wen-An Zhang, Uladzislau Sychou, Alexander Tuzikov, Vladislav Sobolevskii, Valerii Zakharov, Boris Sokolov, Minglei Fu,
- Abstract要約: 我々は,LDARデータから正確なフロアプラン再構築を行うために,点雲密度マップをSAM(Segment Anything Model)と統合するフレームワークであるFloorSAMを提案する。
グリッドベースのフィルタリング、適応分解能投影、画像強調を用いて、ロバストなトップダウン密度マップを作成する。
GibおよびISPRSデータセットのテストは、特にノイズの多い複雑な設定において、従来の方法よりも正確さ、リコール、堅牢性を示している。
- 参考スコア(独自算出の注目度): 38.44214429214816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing building floor plans from point cloud data is key for indoor navigation, BIM, and precise measurements. Traditional methods like geometric algorithms and Mask R-CNN-based deep learning often face issues with noise, limited generalization, and loss of geometric details. We propose FloorSAM, a framework that integrates point cloud density maps with the Segment Anything Model (SAM) for accurate floor plan reconstruction from LiDAR data. Using grid-based filtering, adaptive resolution projection, and image enhancement, we create robust top-down density maps. FloorSAM uses SAM's zero-shot learning for precise room segmentation, improving reconstruction across diverse layouts. Room masks are generated via adaptive prompt points and multistage filtering, followed by joint mask and point cloud analysis for contour extraction and regularization. This produces accurate floor plans and recovers room topological relationships. Tests on Giblayout and ISPRS datasets show better accuracy, recall, and robustness than traditional methods, especially in noisy and complex settings. Code and materials: github.com/Silentbarber/FloorSAM.
- Abstract(参考訳): ポイントクラウドデータからビルのフロアプランを再構築することは、屋内ナビゲーション、BIM、そして正確な測定の鍵となる。
幾何アルゴリズムやマスクR-CNNに基づくディープラーニングのような伝統的な手法は、ノイズ、限定的な一般化、幾何学的詳細の喪失といった問題に直面していることが多い。
我々は,LDARデータから正確なフロアプラン再構築を行うために,点雲密度マップをSAM(Segment Anything Model)と統合するフレームワークであるFloorSAMを提案する。
グリッドベースのフィルタリング、適応分解能投影、画像強調を用いて、ロバストなトップダウン密度マップを作成する。
FloorSAMはSAMのゼロショット学習を使って部屋のセグメンテーションを正確にし、多様なレイアウトの再構築を改善している。
ルームマスクは適応的なプロンプトポイントと多段階フィルタリングによって生成され、続いて輪郭抽出と正則化のためのジョイントマスクと点雲解析が続く。
これにより正確なフロアプランが作成され、部屋のトポロジカルな関係が回復する。
GiblayoutとISPRSデータセットのテストは、特にノイズや複雑な設定において、従来の方法よりも正確さ、リコール、堅牢性を示している。
コードと資料:github.com/Silentbarber/FloorSAM
関連論文リスト
- Towards Localizing Structural Elements: Merging Geometrical Detection with Semantic Verification in RGB-D Data [0.0]
本稿では, 壁面や地表面などの構造成分を局所化するための実時間パイプラインについて, 純三次元平面検出のための幾何計算を統合した。
並列なマルチスレッドアーキテクチャを持ち、環境中で検出されたすべての平面のポーズと方程式を正確に推定し、汎視的セグメンテーション検証を用いて地図構造を形成するものをフィルタリングし、検証された構成部品のみを保持する。
また、検出されたコンポーネントを統一された3次元シーングラフに(再)関連付けることで、幾何学的精度と意味的理解のギャップを埋めることもできる。
論文 参考訳(メタデータ) (2024-09-10T16:28:09Z) - Unsupervised 3D Point Cloud Completion via Multi-view Adversarial Learning [61.14132533712537]
MAL-UPCは、領域レベルとカテゴリ固有の幾何学的類似性の両方を効果的に活用するフレームワークである。
我々のMAL-UPCは3Dの完全な監視を一切必要とせず、トレーニングセットにおける一視点部分的な観察のみを必要とする。
論文 参考訳(メタデータ) (2024-07-13T06:53:39Z) - A Hybrid Semantic-Geometric Approach for Clutter-Resistant Floorplan
Generation from Building Point Clouds [2.0859227544921874]
本研究では,レーザ走査型ビルディングポイント雲からのクラッタ耐性フロアプラン生成のためのハイブリッドセマンティック・ジオメトリ手法を提案する。
提案手法は,精度,リコール,インターセクション・オーバー・ユニオン(IOU),ベティ誤差,ワープ誤差の計測値を用いて評価する。
論文 参考訳(メタデータ) (2023-05-15T20:08:43Z) - Structure PLP-SLAM: Efficient Sparse Mapping and Localization using
Point, Line and Plane for Monocular, RGB-D and Stereo Cameras [13.693353009049773]
本稿では,PPRモジュールを組み込んだ高機能カメラローカライゼーションを実現するために,ポイント・ライン・クラウドを用いた視界SLAMシステムを提案する。
再構成された線や平面上での複数の実行時最適化を提案することにより,幾何的プリミティブをスケールのあいまいさで再構築するという課題に対処する。
その結果,提案したSLAMはセマンティック機能をしっかりと組み込んで,トラッキングとバックエンドの最適化を強化していることがわかった。
論文 参考訳(メタデータ) (2022-07-13T09:05:35Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Efficient 3D Deep LiDAR Odometry [16.388259779644553]
PWCLO-Netという名前の効率的な3Dポイント・クラウド・ラーニング・アーキテクチャが最初に提案される。
アーキテクチャ全体は、コストボリュームとマスクの適応的な学習を実現するために、徹底的にエンドツーエンドに最適化されています。
論文 参考訳(メタデータ) (2021-11-03T11:09:49Z) - PWCLO-Net: Deep LiDAR Odometry in 3D Point Clouds Using Hierarchical
Embedding Mask Optimization [17.90299648470637]
本稿では,PWCLO-Netと呼ばれる深部LiDAR計測のための3Dポイントクラウド学習モデルを提案する。
このモデルでは,LiDARオドメトリータスクのためのピラミッド,ウォーピング,コストボリューム構造を構築し,粗大なアプローチで推定されたポーズを階層的に洗練する。
提案手法は,KITTI odometry データセットのほとんどのシーケンスにおいて,最近の学習手法より優れ,マッピング最適化による幾何学的アプローチ LOAM よりも優れている。
論文 参考訳(メタデータ) (2020-12-02T05:23:41Z) - Dense Hybrid Recurrent Multi-view Stereo Net with Dynamic Consistency
Checking [54.58791377183574]
1)DRENet(Dense Reception Expanded)モジュールで,原サイズの密集した特徴マップをマルチスケールのコンテキスト情報で抽出し,2)HU-LSTM(Hybrid U-LSTM)を用いて3次元マッチングボリュームを予測深度マップに変換する。
R-MVSNetのメモリ消費は19.4%しかかからないが,本手法は最先端の手法と競合する性能を示し,メモリ消費を劇的に削減する。
論文 参考訳(メタデータ) (2020-07-21T14:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。