論文の概要: PanoTPS-Net: Panoramic Room Layout Estimation via Thin Plate Spline Transformation
- arxiv url: http://arxiv.org/abs/2510.11992v1
- Date: Mon, 13 Oct 2025 22:40:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.109908
- Title: PanoTPS-Net: Panoramic Room Layout Estimation via Thin Plate Spline Transformation
- Title(参考訳): パノTPS-Net:薄板スプライン変換によるパノラマルームレイアウト推定
- Authors: Hatem Ibrahem, Ahmed Salem, Qinmin Vivian Hu, Guanghui Wang,
- Abstract要約: 部屋の3Dレイアウトを正確に推定することは、コンピュータビジョンにおいて重要な課題である。
本稿では,パノラマ画像から部屋のレイアウトを推定する新しいモデルであるパノTPS-Netを提案する。
- 参考スコア(独自算出の注目度): 9.400960986963328
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately estimating the 3D layout of rooms is a crucial task in computer vision, with potential applications in robotics, augmented reality, and interior design. This paper proposes a novel model, PanoTPS-Net, to estimate room layout from a single panorama image. Leveraging a Convolutional Neural Network (CNN) and incorporating a Thin Plate Spline (TPS) spatial transformation, the architecture of PanoTPS-Net is divided into two stages: First, a convolutional neural network extracts the high-level features from the input images, allowing the network to learn the spatial parameters of the TPS transformation. Second, the TPS spatial transformation layer is generated to warp a reference layout to the required layout based on the predicted parameters. This unique combination empowers the model to properly predict room layouts while also generalizing effectively to both cuboid and non-cuboid layouts. Extensive experiments on publicly available datasets and comparisons with state-of-the-art methods demonstrate the effectiveness of the proposed method. The results underscore the model's accuracy in room layout estimation and emphasize the compatibility between the TPS transformation and panorama images. The robustness of the model in handling both cuboid and non-cuboid room layout estimation is evident with a 3DIoU value of 85.49, 86.16, 81.76, and 91.98 on PanoContext, Stanford-2D3D, Matterport3DLayout, and ZInD datasets, respectively. The source code is available at: https://github.com/HatemHosam/PanoTPS_Net.
- Abstract(参考訳): 正確な部屋の3Dレイアウトの推定は、ロボット工学、拡張現実、インテリアデザインなど、コンピュータビジョンにおける重要なタスクである。
本稿では,パノラマ画像から部屋のレイアウトを推定する新しいモデルであるパノTPS-Netを提案する。
畳み込みニューラルネットワーク(CNN)を活用して、TPS(Thin Plate Spline)空間変換を導入することにより、PanoTPS-Netのアーキテクチャは、2段階に分けられる。
次に、TPS空間変換層を生成し、予測パラメータに基づいて基準レイアウトを所要レイアウトにワープする。
このユニークな組み合わせは、モデルが部屋のレイアウトを適切に予測し、キュービイドと非キュービイドの両方に効果的に一般化することを可能にする。
公開データセットの大規模な実験と最先端手法との比較により,提案手法の有効性が示された。
その結果,TPS変換とパノラマ画像との整合性が強調された。
パノコンテキスト、スタンフォード-2D3D、マターポート3DLayout、ZInDデータセットの3DIoU値は85.49、86.16、81.76、91.98である。
ソースコードは、https://github.com/HatemHosam/PanoTPS_Net.comで入手できる。
関連論文リスト
- Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model [15.892685514932323]
マルチビュールームレイアウト推定のための新しい手法であるPlain-DUSt3Rを提案する。
Plane-DUSt3RはDUSt3Rフレームワークを室内レイアウトデータセット(Structure3D)に組み込んで構造平面を推定する。
均一かつ同相な結果を生成することにより、Plane-DUSt3Rは、単一の後処理ステップと2D検出結果のみを用いて、部屋レイアウトの推定を可能にする。
論文 参考訳(メタデータ) (2025-02-24T02:14:19Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - 3D Room Layout Estimation from a Cubemap of Panorama Image via Deep
Manhattan Hough Transform [17.51123287432334]
学習可能なハフ変換ブロックにおける長距離幾何学的パターンをモデル化することにより、3次元空間の壁面を推定する別の手法を提案する。
我々は、この特徴を立方体写像タイルからマンハッタン世界のハフ空間に変換し、その特徴を直接幾何学的出力にマッピングする。
畳み込み層は局所勾配のような線の特徴を学習するだけでなく、グローバル情報を利用して単純なネットワーク構造で閉塞壁を予測する。
論文 参考訳(メタデータ) (2022-07-19T14:22:28Z) - LGT-Net: Indoor Panoramic Room Layout Estimation with Geometry-Aware
Transformer Network [1.3512949730789903]
部屋レイアウト推定のための効率的なネットワークLGT-Netを提案する。
実験の結果,提案したLGT-Netは,ベンチマークデータセット上での現在のSOTA(State-of-the-arts)よりも優れたパフォーマンスを実現することがわかった。
論文 参考訳(メタデータ) (2022-03-03T16:28:10Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。