論文の概要: Single-Shot Cuboids: Geodesics-based End-to-end Manhattan Aligned Layout
Estimation from Spherical Panoramas
- arxiv url: http://arxiv.org/abs/2102.03939v1
- Date: Sun, 7 Feb 2021 22:52:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 10:41:33.915114
- Title: Single-Shot Cuboids: Geodesics-based End-to-end Manhattan Aligned Layout
Estimation from Spherical Panoramas
- Title(参考訳): 単発cuboids:球面パノラマを用いた測地線に基づくエンドツーエンドマンハッタンアラインレイアウト推定
- Authors: Nikolaos Zioulis, Federico Alvarez, Dimitrios Zarpalas, Petros Daras
- Abstract要約: 単一ショットで全室レイアウトを推定する方法を示し、後処理の必要性を排除した。
私たちの仕事は、マンハッタンに沿ったアウトプットを直接推測する最初のものです。
- 参考スコア(独自算出の注目度): 25.683946679206716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It has been shown that global scene understanding tasks like layout
estimation can benefit from wider field of views, and specifically spherical
panoramas. While much progress has been made recently, all previous approaches
rely on intermediate representations and postprocessing to produce
Manhattan-aligned estimates. In this work we show how to estimate full room
layouts in a single-shot, eliminating the need for postprocessing. Our work is
the first to directly infer Manhattan-aligned outputs. To achieve this, our
data-driven model exploits direct coordinate regression and is supervised
end-to-end. As a result, we can explicitly add quasi-Manhattan constraints,
which set the necessary conditions for a homography-based Manhattan alignment
module. Finally, we introduce the geodesic heatmaps and loss and a
boundary-aware center of mass calculation that facilitate higher quality
keypoint estimation in the spherical domain. Our models and code are publicly
available at https://vcl3d.github.io/SingleShotCuboids/.
- Abstract(参考訳): レイアウト推定などのグローバルなシーン理解タスクは、広い視野、特に球面パノラマの恩恵を受けることができることが示されています。
近年、多くの進展が見られたが、以前のアプローチはすべて中間表現と後処理に依存してマンハッタンに整合した見積もりを生成する。
本稿では,全室レイアウトを単一ショットで推定する方法を示し,後処理の必要性を解消する。
私たちの仕事はマンハッタン整列アウトプットを直接推論する最初のものです。
これを達成するために、データ駆動モデルは直接座標回帰を利用して、エンドツーエンドで監視されます。
その結果、ホモグラフィに基づくマンハッタンアライメントモジュールに必要な条件を設定する擬似マンタン制約を明示的に追加することができる。
最後に,測地線ヒートマップと損失,球面領域における高品質キーポイント推定を容易にする質量計算の境界認識中心について紹介する。
私たちのモデルとコードはhttps://vcl3d.github.io/SingleShotCuboids/で公開されています。
関連論文リスト
- Self-supervised 3D Point Cloud Completion via Multi-view Adversarial Learning [61.14132533712537]
我々は、オブジェクトレベルとカテゴリ固有の幾何学的類似性の両方を効果的に活用するフレームワークであるMAL-SPCを提案する。
私たちのMAL-SPCは3Dの完全な監視を一切必要とせず、各オブジェクトに1つの部分点クラウドを必要とするだけです。
論文 参考訳(メタデータ) (2024-07-13T06:53:39Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Deep Single Image Camera Calibration by Heatmap Regression to Recover Fisheye Images Under Manhattan World Assumption [9.018416031676136]
立方体建物に沿って横たわるマンハッタンの世界は、カメラの角度推定に役立ちます。
ラベル付き画像座標の向きを検出するために,熱マップ回帰を用いた学習に基づく校正手法を提案する。
提案手法は,大規模データセットやオフザシェルフカメラにおいて,従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-03-30T05:57:59Z) - Surface Normal Clustering for Implicit Representation of Manhattan
Scenes [67.16489078998961]
暗黙のニューラルネットワーク表現を用いたビュー合成と3次元モデリングは、マルチビューカメラに非常に効果的である。
追加の監視を利用する既存の方法の多くは、高密度のピクセルワイドラベルや、ローカライズされたシーン先行を必要とする。
本研究では,マンハッタンのシーンの幾何学的先行性を活用し,暗黙的ニューラルラディアンス場表現を改善することを目的とする。
論文 参考訳(メタデータ) (2022-12-02T17:46:55Z) - 3D Room Layout Estimation from a Cubemap of Panorama Image via Deep
Manhattan Hough Transform [17.51123287432334]
学習可能なハフ変換ブロックにおける長距離幾何学的パターンをモデル化することにより、3次元空間の壁面を推定する別の手法を提案する。
我々は、この特徴を立方体写像タイルからマンハッタン世界のハフ空間に変換し、その特徴を直接幾何学的出力にマッピングする。
畳み込み層は局所勾配のような線の特徴を学習するだけでなく、グローバル情報を利用して単純なネットワーク構造で閉塞壁を予測する。
論文 参考訳(メタデータ) (2022-07-19T14:22:28Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Self-supervised 360$^{\circ}$ Room Layout Estimation [20.062713286961326]
ラベル付きデータを使わずにパノラマ的な部屋配置推定モデルを訓練するための,最初の自己教師方式を提案する。
弊社のアプローチでは、データ共有シナリオとアクティブラーニングにおける有望なソリューションも示しています。
論文 参考訳(メタデータ) (2022-03-30T04:58:07Z) - Transferable End-to-end Room Layout Estimation via Implicit Encoding [34.99591465853653]
一つのパノラマ画像から部屋のレイアウトを推定する問題について検討する。
入力パノラマ画像からパラメトリックレイアウトを直接予測するエンドツーエンド手法を提案する。
論文 参考訳(メタデータ) (2021-12-21T16:33:14Z) - Pose Normalization of Indoor Mapping Datasets Partially Compliant to the
Manhattan World Assumption [0.802904964931021]
室内マッピング点雲と三角形メッシュの新しいポーズ正規化法を提案する。
提案手法は,複数の屋内マッピングデータセットに対して定量的に評価される。
論文 参考訳(メタデータ) (2021-07-16T09:07:01Z) - Confidence Adaptive Anytime Pixel-Level Recognition [86.75784498879354]
任意の時間推論は、いつでも停止される可能性のある予測の進行を行うモデルを必要とする。
我々は,任意のピクセルレベルの認識に対して,最初の統一とエンドツーエンドのモデルアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-01T20:01:57Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。