論文の概要: UnRectDepthNet: Self-Supervised Monocular Depth Estimation using a
Generic Framework for Handling Common Camera Distortion Models
- arxiv url: http://arxiv.org/abs/2007.06676v3
- Date: Tue, 6 Oct 2020 19:41:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 23:51:56.136141
- Title: UnRectDepthNet: Self-Supervised Monocular Depth Estimation using a
Generic Framework for Handling Common Camera Distortion Models
- Title(参考訳): UnRectDepthNet:共通カメラ歪みモデル処理のためのジェネリックフレームワークを用いた自己監督単眼深度推定
- Authors: Varun Ravi Kumar, Senthil Yogamani, Markus Bach, Christian Witt,
Stefan Milz and Patrick Mader
- Abstract要約: 本研究では,未修正単眼ビデオから深度,ユークリッド距離,および視覚計測を推定するための,汎用的な規模対応型自己教師パイプラインを提案する。
提案アルゴリズムは,KITTI修正データセットでさらに評価され,最先端の結果が得られた。
- 参考スコア(独自算出の注目度): 8.484676769284578
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In classical computer vision, rectification is an integral part of multi-view
depth estimation. It typically includes epipolar rectification and lens
distortion correction. This process simplifies the depth estimation
significantly, and thus it has been adopted in CNN approaches. However,
rectification has several side effects, including a reduced field of view
(FOV), resampling distortion, and sensitivity to calibration errors. The
effects are particularly pronounced in case of significant distortion (e.g.,
wide-angle fisheye cameras). In this paper, we propose a generic scale-aware
self-supervised pipeline for estimating depth, euclidean distance, and visual
odometry from unrectified monocular videos. We demonstrate a similar level of
precision on the unrectified KITTI dataset with barrel distortion comparable to
the rectified KITTI dataset. The intuition being that the rectification step
can be implicitly absorbed within the CNN model, which learns the distortion
model without increasing complexity. Our approach does not suffer from a
reduced field of view and avoids computational costs for rectification at
inference time. To further illustrate the general applicability of the proposed
framework, we apply it to wide-angle fisheye cameras with 190$^\circ$
horizontal field of view. The training framework UnRectDepthNet takes in the
camera distortion model as an argument and adapts projection and unprojection
functions accordingly. The proposed algorithm is evaluated further on the KITTI
rectified dataset, and we achieve state-of-the-art results that improve upon
our previous work FisheyeDistanceNet. Qualitative results on a distorted test
scene video sequence indicate excellent performance
https://youtu.be/K6pbx3bU4Ss.
- Abstract(参考訳): 古典的コンピュータビジョンでは、整流は多視点深度推定の不可欠な部分である。
典型的には、エピポーラ補正とレンズ歪み補正を含む。
このプロセスは深さ推定を大幅に単純化し、cnnのアプローチで採用されている。
しかし、修正には、視野の縮小(FOV)、再サンプリング歪み、校正誤差に対する感度など、いくつかの副作用がある。
この効果は特に大きな歪み(広角魚眼カメラなど)の場合には顕著に発音される。
本稿では,非再現単眼映像から深さ,ユークリッド距離,視覚オドメトリを推定する汎用的なスケールアウェア自己教師付きパイプラインを提案する。
補正されたKITTIデータセットと同等のバレル歪みを有する未修正KITTIデータセットに対して、同様の精度を示す。
補正ステップがCNNモデルに暗黙的に吸収されるという直感は、複雑さを増すことなく歪みモデルを学習する。
提案手法は視野の縮小に悩まされず,推論時の修正に要する計算コストを回避する。
提案フレームワークの汎用性をさらに説明するために,190$^\circ$水平視野を持つ広角魚眼カメラに適用する。
トレーニングフレームワークUnRectDepthNetは、カメラ歪みモデルを引数として取り込んで、プロジェクションとアンプロジェクション機能を適用する。
提案アルゴリズムはkitti正規化データセット上でさらに評価され,これまでのfisheye distancenetの成果を改良した最新結果が得られる。
歪んだテストシーンのビデオシーケンスの質的な結果は、優れたパフォーマンス https://youtu.be/K6pbx3bU4Ssを示している。
関連論文リスト
- Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [55.52743265122446]
ディープオートエンコーダは視覚領域における異常検出のタスクに使われてきた。
我々は、訓練中に識別情報を使用することが可能な自己指導型学習体制を適用することで、この問題に対処する。
MVTec ADデータセットを用いた実験では,高い検出性能と局所化性能を示した。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Rethinking Generic Camera Models for Deep Single Image Camera
Calibration to Recover Rotation and Fisheye Distortion [8.877834897951578]
本稿では,様々な歪みに対処可能な汎用カメラモデルを提案する。
提案手法は,市販の魚眼カメラで撮影した2つの大規模データセットと画像に対して,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-11-25T05:58:23Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z) - A Deep Ordinal Distortion Estimation Approach for Distortion
Rectification [48.53655425945156]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。
本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。
歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文 参考訳(メタデータ) (2020-07-21T10:03:42Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。