論文の概要: IMU-Assisted Learning of Single-View Rolling Shutter Correction
- arxiv url: http://arxiv.org/abs/2011.03106v2
- Date: Tue, 14 Sep 2021 14:56:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 12:15:42.672369
- Title: IMU-Assisted Learning of Single-View Rolling Shutter Correction
- Title(参考訳): 単視点転がりシャッター補正のIMU支援学習
- Authors: Jiawei Mo, Md Jahidul Islam, Junaed Sattar
- Abstract要約: ローリングシャッター歪みは、写真やコンピュータビジョンアルゴリズムにとって非常に望ましくない。
回転シャッター補正のための1つの画像から深度と行ワイドポーズを予測するディープニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 16.242924916178282
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rolling shutter distortion is highly undesirable for photography and computer
vision algorithms (e.g., visual SLAM) because pixels can be potentially
captured at different times and poses. In this paper, we propose a deep neural
network to predict depth and row-wise pose from a single image for rolling
shutter correction. Our contribution in this work is to incorporate inertial
measurement unit (IMU) data into the pose refinement process, which, compared
to the state-of-the-art, greatly enhances the pose prediction. The improved
accuracy and robustness make it possible for numerous vision algorithms to use
imagery captured by rolling shutter cameras and produce highly accurate
results. We also extend a dataset to have real rolling shutter images, IMU
data, depth maps, camera poses, and corresponding global shutter images for
rolling shutter correction training. We demonstrate the efficacy of the
proposed method by evaluating the performance of Direct Sparse Odometry (DSO)
algorithm on rolling shutter imagery corrected using the proposed approach.
Results show marked improvements of the DSO algorithm over using uncorrected
imagery, validating the proposed approach.
- Abstract(参考訳): ローリングシャッター歪みは、異なる時間とポーズでピクセルをキャプチャできるため、写真やコンピュータビジョンアルゴリズム(例えば、ビジュアルスラム)にとって非常に好ましくない。
本稿では,シャッター補正のための1つの画像から深度と行ワイドポーズを予測するディープニューラルネットワークを提案する。
この研究における我々の貢献は、慣性測定ユニット(IMU)データをポーズ改善プロセスに組み込むことであり、これは最先端と比較して、ポーズ予測を大幅に強化する。
精度と堅牢性の向上により、多数の視覚アルゴリズムがローリングシャッターカメラで捉えた画像を使用でき、精度の高い結果が得られる。
また、実際のシャッター画像、IMUデータ、深度マップ、カメラポーズ、およびローリングシャッター補正トレーニングのための対応するグローバルシャッター画像を含むデータセットを拡張する。
提案手法の有効性を,提案手法を用いて補正したローリングシャッター画像に対する直接スパースオドメトリー(DSO)アルゴリズムの性能評価により実証する。
その結果、補正されていない画像よりもDSOアルゴリズムが大幅に改善され、提案手法が検証された。
関連論文リスト
- Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.737266480464156]
コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。
3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:31:33Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Robust Camera Pose Refinement for Multi-Resolution Hash Encoding [19.655282240361835]
ニューラルレンダリングの計算コストを削減するため,マルチレゾリューションハッシュ符号化が提案されている。
カメラのポーズを校正し、効率的なマルチ解像度ハッシュ符号化を用いて幾何学的表現を学習するための共同最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-03T06:49:27Z) - Learning Markerless Robot-Depth Camera Calibration and End-Effector Pose
Estimation [0.0]
本研究では,ディープカメラを用いた学習型マーカーレス外部キャリブレーションシステムを提案する。
自動生成された実世界のデータから,エンドエフェクタ(EE)セグメンテーション,単一フレーム回転予測,キーポイント検出のモデルを学習する。
複数のカメラのポーズからのトレーニングデータと、未確認のポーズからのテストデータによるロバスト性は、センチメートル以下の評価と、デシラディアン以下の平均キャリブレーションを与え、推定誤差を与えます。
論文 参考訳(メタデータ) (2022-12-15T00:53:42Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - An Adaptive Framework for Learning Unsupervised Depth Completion [59.17364202590475]
カラー画像から高密度深度マップとそれに伴うスパース深度測定を推定する手法を提案する。
正規化とコビジュアライゼーションは、モデルの適合度とデータによって関連付けられており、単一のフレームワークに統合可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T02:27:55Z) - Real-Time, Deep Synthetic Aperture Sonar (SAS) Autofocus [34.77467193499518]
合成開口ソナー(sas)は、送信/受信波形の正確な飛行時間計測を必要とする。
これを解決するために、画像再構成後の後処理ステップとして、Emphautofocusアルゴリズムを用いて、画像フォーカスを改善する。
これらの限界を克服し、データ駆動方式で重み付け関数を暗黙的に学習するための深層学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T15:16:29Z) - Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。
本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。
従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文 参考訳(メタデータ) (2020-12-10T18:59:48Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。