論文の概要: Surface Normal Estimation of Tilted Images via Spatial Rectifier
- arxiv url: http://arxiv.org/abs/2007.09264v2
- Date: Thu, 14 Jul 2022 17:43:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 14:34:20.056241
- Title: Surface Normal Estimation of Tilted Images via Spatial Rectifier
- Title(参考訳): 空間整流器による傾斜画像の表面正規化
- Authors: Tien Do, Khiem Vuong, Stergios I. Roumeliotis, and Hyun Soo Park
- Abstract要約: 既存のアプローチでは、重力整列画像を用いてトレーニングされたため、表面の正常を予測できる境界性能を示す。
この2つの仮説は,(1) 視覚的シーンレイアウトは重力方向の指標であり,(2) トレーニングデータの構造的分布から,すべての面が等しく学習された推定器で表されるわけではない,というものである。
傾斜画像の表面正規分布を重力分布に一致するものに変換する空間推定器を設計する。
- 参考スコア(独自算出の注目度): 23.112310775824714
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a spatial rectifier to estimate surface normals of
tilted images. Tilted images are of particular interest as more visual data are
captured by arbitrarily oriented sensors such as body-/robot-mounted cameras.
Existing approaches exhibit bounded performance on predicting surface normals
because they were trained using gravity-aligned images. Our two main hypotheses
are: (1) visual scene layout is indicative of the gravity direction; and (2)
not all surfaces are equally represented by a learned estimator due to the
structured distribution of the training data, thus, there exists a
transformation for each tilted image that is more responsive to the learned
estimator than others. We design a spatial rectifier that is learned to
transform the surface normal distribution of a tilted image to the rectified
one that matches the gravity-aligned training data distribution. Along with the
spatial rectifier, we propose a novel truncated angular loss that offers a
stronger gradient at smaller angular errors and robustness to outliers. The
resulting estimator outperforms the state-of-the-art methods including data
augmentation baselines not only on ScanNet and NYUv2 but also on a new dataset
called Tilt-RGBD that includes considerable roll and pitch camera motion.
- Abstract(参考訳): 本稿では,傾斜画像の表面正規度を推定する空間整流器を提案する。
より視覚的なデータは、ボディ/ロボット搭載カメラのような任意の方向のセンサーによって撮影される。
既存のアプローチでは、重力整列画像を用いてトレーニングされたため、表面の正常を予測できる境界性能を示す。
2つの主仮説は,(1)視覚シーンレイアウトは重心方向の指標であり,(2)すべての表面がトレーニングデータの構造化分布により学習推定器によって等しく表現されるわけではないため,学習推定器に応答する各傾き画像に対する変換が存在する,というものである。
本研究では,傾斜画像の表面正規分布を重力方向のトレーニングデータ分布と一致する補正値に変換することを学習する空間整流器を設計する。
空間整流器と共に, 角誤差が小さく, 外れ値に対するロバスト性が向上する新しい断面積角損失を提案する。
結果として得られた推定値は、scannetとnyuv2だけでなく、かなりのロールとピッチカメラの動きを含むtilt-rgbdと呼ばれる新しいデータセットでも、データ拡張ベースラインを含む最先端の手法を上回る。
関連論文リスト
- Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Boosting 3-DoF Ground-to-Satellite Camera Localization Accuracy via
Geometry-Guided Cross-View Transformer [66.82008165644892]
地上レベルの画像と一致/検索衛星画像との相対的な回転と変換を推定することにより、地上カメラの位置と方向の精度を向上させる手法を提案する。
実験の結果,本手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-16T11:52:27Z) - 2D LiDAR and Camera Fusion Using Motion Cues for Indoor Layout
Estimation [2.6905021039717987]
地上ロボットは、単一の床と垂直の壁を持つ屋内空間を探索し、一連の強度画像と2D LiDARデータセットを収集する。
センサ出力と画像セグメンテーションのアライメントは、LiDAR点をアライメントすることで、共同で計算される。
地層境界抽出のための画像の曖昧さをLiDAR観測の助けを借りて除去する。
論文 参考訳(メタデータ) (2022-04-24T06:26:02Z) - SPIN: Simplifying Polar Invariance for Neural networks Application to
vision-based irradiance forecasting [2.624902795082451]
画像の極座標への展開は、畳み込みアーキテクチャを訓練するためのより明示的な表現を提供する。
この前処理ステップはシーン表現の標準化によって予測結果を大幅に改善することを示す。
この変換は回転の中心を取り巻く領域を拡大し、より正確な短期照射予測をもたらす。
論文 参考訳(メタデータ) (2021-11-29T12:58:57Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z) - Deep Photometric Stereo for Non-Lambertian Surfaces [89.05501463107673]
我々は、PS-FCNと呼ばれる、校正された測光ステレオのための完全な畳み込みディープネットワークを導入する。
PS-FCNは反射率観測から表面正規へのマッピングを学習し、一般的な等方反射率と未知の等方反射率で表面を処理できる。
光方向が不明な未定のシナリオに対処するため、入力画像から光方向を推定するLCNetという新しい畳み込みネットワークを導入する。
論文 参考訳(メタデータ) (2020-07-26T15:20:53Z) - Where am I looking at? Joint Location and Orientation Estimation by
Cross-View Matching [95.64702426906466]
ジオタグ付き空中画像の大規模データベースを考えると、クロスビューなジオローカライゼーションは問題となる。
地上画像と空中画像の向きを知ることは、これらの2つのビュー間のあいまいさを著しく軽減することができる。
局所化時の横方向のアライメントを推定する動的類似マッチングネットワークを設計する。
論文 参考訳(メタデータ) (2020-05-08T05:21:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。