論文の概要: Distortion-aware Monocular Depth Estimation for Omnidirectional Images
- arxiv url: http://arxiv.org/abs/2010.08942v2
- Date: Mon, 30 Nov 2020 01:41:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 04:15:50.274179
- Title: Distortion-aware Monocular Depth Estimation for Omnidirectional Images
- Title(参考訳): 全方位画像の歪み・アウェア単眼深度推定
- Authors: Hong-Xiang Chen and Kunhong Li and Zhiheng Fu and Mengyi Liu and
Zonghao Chen and Yulan Guo
- Abstract要約: 室内パノラマにおけるこの問題に対処するために,DAMO(Distortion-Aware Monocular Omnidirectional)深度推定ネットワークを提案する。
まず、全方位画像からキャリブレーションされた意味的特徴を抽出する歪み認識モジュールを提案する。
第二に、球面から投影される領域の不均一分布を扱うために、目的関数に対するプラグアンドプレイ球面対応重み行列を導入する。
- 参考スコア(独自算出の注目度): 26.027353545874522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A main challenge for tasks on panorama lies in the distortion of objects
among images. In this work, we propose a Distortion-Aware Monocular
Omnidirectional (DAMO) dense depth estimation network to address this challenge
on indoor panoramas with two steps. First, we introduce a distortion-aware
module to extract calibrated semantic features from omnidirectional images.
Specifically, we exploit deformable convolution to adjust its sampling grids to
geometric variations of distorted objects on panoramas and then utilize a strip
pooling module to sample against horizontal distortion introduced by inverse
gnomonic projection. Second, we further introduce a plug-and-play
spherical-aware weight matrix for our objective function to handle the uneven
distribution of areas projected from a sphere. Experiments on the 360D dataset
show that the proposed method can effectively extract semantic features from
distorted panoramas and alleviate the supervision bias caused by distortion. It
achieves state-of-the-art performance on the 360D dataset with high efficiency.
- Abstract(参考訳): パノラマにおけるタスクの主な課題は、画像間の物体の歪みにある。
本研究では,室内パノラマにおけるこの問題に対処するため,DAMO(Distortion-Aware Monocular Omnidirectional)の深度推定ネットワークを提案する。
まず、全方位画像から校正意味特徴を抽出する歪み認識モジュールを提案する。
具体的には,変形可能な畳み込みを利用して,そのサンプリング格子をパノラマ上の歪曲物体の幾何学的変動に調整し,逆グノーモン射影による水平歪みに対してストリッププーリングモジュールを用いてサンプリングする。
第二に、球面から投影される領域の不均一分布を扱うために、目的関数に対するプラグアンドプレイ球面対応重み行列を導入する。
360dデータセットを用いた実験により,提案手法は歪みパノラマから意味的特徴を効果的に抽出し,歪みに起因する監督バイアスを軽減できることがわかった。
360Dデータセットの最先端のパフォーマンスを高い効率で達成する。
関連論文リスト
- RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。
DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。
事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。
微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文 参考訳(メタデータ) (2024-06-27T06:38:56Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Distortion-aware Transformer in 360{\deg} Salient Object Detection [44.74647420381127]
本稿では,歪み問題に対処するトランスフォーマーモデルDATFormerを提案する。
360degデータの特徴を利用するために,学習可能な関係行列を提案する。
我々のモデルは既存の2D SOD(salient object detection)法と360 SOD法より優れている。
論文 参考訳(メタデータ) (2023-08-07T07:28:24Z) - Parametric Depth Based Feature Representation Learning for Object
Detection and Segmentation in Bird's Eye View [44.78243406441798]
本稿では,このような特徴変換をモデル化するために,深度などの幾何学的情報を活用することに焦点を当てる。
まず2次元画像の特徴を,各ビューの画素ごとのパラメトリック深度分布を予測して,エゴ車に定義された3次元空間に引き上げる。
次に、深度からBEVフレームへの3次元空間占有度に基づいて、3次元特徴体積を集約する。
論文 参考訳(メタデータ) (2023-07-09T06:07:22Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Multi-Projection Fusion and Refinement Network for Salient Object
Detection in 360{\deg} Omnidirectional Image [141.10227079090419]
我々は,360度全方位画像中の有向物体を検出するために,MPFR-Net(Multi-Projection Fusion and Refinement Network)を提案する。
MPFR-Netは、等角射影像と対応する4つの立方体展開像を入力として使用する。
2つの全方位データセットの実験結果から,提案手法は定性的かつ定量的に,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-12-23T14:50:40Z) - SphereDepth: Panorama Depth Estimation from Spherical Domain [17.98608948955211]
本稿では,新しいパノラマ深度推定法であるSphereDepthを提案する。
プロジェクション前処理なしで球面メッシュ上の深さを直接予測する。
パノラマ深度推定の最先端手法と同等の結果が得られる。
論文 参考訳(メタデータ) (2022-08-29T16:50:19Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Distortion-Tolerant Monocular Depth Estimation On Omnidirectional Images
Using Dual-cubemap [37.82642960470551]
デュアルキューブマップを用いた歪み耐性全方位深度推定アルゴリズムを提案する。
DCDEモジュールでは、正確なNFoV深度を推定するために、回転に基づくデュアルキューブマップモデルを提案する。
その後、境界修正モジュールは不連続な境界を滑らかにするよう設計され、これは正確かつ視覚的に連続する全方位深さに寄与する。
論文 参考訳(メタデータ) (2022-03-18T04:20:36Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。