論文の概要: Wide-angle Image Rectification: A Survey
- arxiv url: http://arxiv.org/abs/2011.12108v2
- Date: Wed, 1 Dec 2021 12:24:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 17:30:44.889628
- Title: Wide-angle Image Rectification: A Survey
- Title(参考訳): 広角画像の再現性:サーベイ
- Authors: Jinlong Fan and Jing Zhang and Stephen J. Maybank and Dacheng Tao
- Abstract要約: 広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
- 参考スコア(独自算出の注目度): 86.36118799330802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wide field-of-view (FOV) cameras, which capture a larger scene area than
narrow FOV cameras, are used in many applications including 3D reconstruction,
autonomous driving, and video surveillance. However, wide-angle images contain
distortions that violate the assumptions underlying pinhole camera models,
resulting in object distortion, difficulties in estimating scene distance,
area, and direction, and preventing the use of off-the-shelf deep models
trained on undistorted images for downstream computer vision tasks. Image
rectification, which aims to correct these distortions, can solve these
problems. In this paper, we comprehensively survey progress in wide-angle image
rectification from transformation models to rectification methods.
Specifically, we first present a detailed description and discussion of the
camera models used in different approaches. Then, we summarize several
distortion models including radial distortion and projection distortion. Next,
we review both traditional geometry-based image rectification methods and deep
learning-based methods, where the former formulate distortion parameter
estimation as an optimization problem and the latter treat it as a regression
problem by leveraging the power of deep neural networks. We evaluate the
performance of state-of-the-art methods on public datasets and show that
although both kinds of methods can achieve good results, these methods only
work well for specific camera models and distortion types. We also provide a
strong baseline model and carry out an empirical study of different distortion
models on synthetic datasets and real-world wide-angle images. Finally, we
discuss several potential research directions that are expected to further
advance this area in the future.
- Abstract(参考訳): 狭いFOVカメラよりも広いシーン領域を撮影する広視野視野カメラは、3D再構成、自動運転、ビデオ監視など多くのアプリケーションで使用されている。
しかし、広角画像には、基礎となるピンホールカメラモデルに反する歪みが含まれており、オブジェクトの歪み、シーン距離、面積、方向の推定の困難、下流コンピュータビジョンタスクのための歪みのない画像に基づいてトレーニングされた既成の深度モデルの使用を防止する。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では,変換モデルから修正手法への広角画像修正の進展を包括的に調査する。
具体的には、まず、異なるアプローチで使用されるカメラモデルの詳細な説明と議論を行う。
次に、放射歪や投影歪を含む複数の歪みモデルを要約する。
次に,従来の幾何学に基づく画像整流法と,前者が歪みパラメータ推定を最適化問題として扱う深層学習法の両方について検討し,後者は深層ニューラルネットワークのパワーを利用して回帰問題として扱う。
公開データセットにおける最先端手法の性能を評価し,どちらの手法も良好な結果が得られるが,特定のカメラモデルや歪みタイプに対してのみ有効であることを示す。
また,強いベースラインモデルを提供し,合成データセットと実世界の広角画像の異なる歪みモデルについて経験的研究を行った。
最後に,今後,この分野をさらに前進させるであろう研究の方向性について検討する。
関連論文リスト
- Möbius Transform for Mitigating Perspective Distortions in Representation Learning [43.86985901138407]
パースペクティブ歪み(PD)は、画像の形状、大きさ、向き、角度、その他の空間的関係に前例のない変化を引き起こす。
M"オビウス変換の特定の族に対して,パラメータ制御を微粒化することにより,MPDを緩和する手法を提案する。
我々は,この新たなデータセットに対して,ディープラーニングモデルの堅牢性を評価するために,視点的に歪んだベンチマークデータセットであるImageNet-PDを提案する。
論文 参考訳(メタデータ) (2024-03-07T15:39:00Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - How to turn your camera into a perfect pinhole model [0.38233569758620056]
本稿では,画像からの歪みを除去する前処理ステップを含む新しいアプローチを提案する。
本手法は歪みモデルを仮定する必要がなく, 厳しい歪み画像に適用できる。
このモデルは、多くのアルゴリズムとアプリケーションの深刻なアップグレードを可能にします。
論文 参考訳(メタデータ) (2023-09-20T13:54:29Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Rethinking Generic Camera Models for Deep Single Image Camera
Calibration to Recover Rotation and Fisheye Distortion [8.877834897951578]
本稿では,様々な歪みに対処可能な汎用カメラモデルを提案する。
提案手法は,市販の魚眼カメラで撮影した2つの大規模データセットと画像に対して,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-11-25T05:58:23Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - UnRectDepthNet: Self-Supervised Monocular Depth Estimation using a
Generic Framework for Handling Common Camera Distortion Models [8.484676769284578]
本研究では,未修正単眼ビデオから深度,ユークリッド距離,および視覚計測を推定するための,汎用的な規模対応型自己教師パイプラインを提案する。
提案アルゴリズムは,KITTI修正データセットでさらに評価され,最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-07-13T20:35:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。