論文の概要: Toward Efficient Visual Gyroscopes: Spherical Moments, Harmonics Filtering, and Masking Techniques for Spherical Camera Applications
- arxiv url: http://arxiv.org/abs/2404.01924v2
- Date: Mon, 23 Sep 2024 09:07:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-09 03:37:09.897559
- Title: Toward Efficient Visual Gyroscopes: Spherical Moments, Harmonics Filtering, and Masking Techniques for Spherical Camera Applications
- Title(参考訳): 効率的な視覚ジャイロスコープに向けて:球面カメラ応用のための球運動,高調波フィルタ,マスキング技術
- Authors: Yao Du, Carlos M. Mateo, Mirjana Maras, Tsun-Hsuan Wang, Marc Blanchon, Alexander Amini, Daniela Rus, Omar Tahri,
- Abstract要約: 視覚ジャイロスコープは、画像を通してカメラの回転を推定する。
従来のRGBカメラに比べて視野が広い全方位カメラの統合は、より正確で堅牢な結果をもたらすことが証明されている。
本稿では,効率的なマルチマスク・フィルタ回転エステータと学習に基づく最適化を組み合わせた,新しい視覚ジャイロスコープを導入することで,これらの課題に対処する。
- 参考スコア(独自算出の注目度): 83.8743080143778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike a traditional gyroscope, a visual gyroscope estimates camera rotation through images. The integration of omnidirectional cameras, offering a larger field of view compared to traditional RGB cameras, has proven to yield more accurate and robust results. However, challenges arise in situations that lack features, have substantial noise causing significant errors, and where certain features in the images lack sufficient strength, leading to less precise prediction results. Here, we address these challenges by introducing a novel visual gyroscope, which combines an Efficient Multi-Mask-Filter Rotation Estimator(EMMFRE) and a Learning based optimization(LbTO) to provide a more efficient and accurate rotation estimation from spherical images. Experimental results demonstrate superior performance of the proposed approach in terms of accuracy. The paper emphasizes the advantages of integrating machine learning to optimize analytical solutions, discusses limitations, and suggests directions for future research.
- Abstract(参考訳): 従来のジャイロスコープとは異なり、視覚ジャイロスコープは画像を通してカメラの回転を推定する。
従来のRGBカメラに比べて視野が広い全方位カメラの統合は、より正確で堅牢な結果をもたらすことが証明されている。
しかし、特徴が欠如し、重大なノイズが発生し、画像の特定の特徴が十分な強度に欠けており、正確な予測結果が得られない状況において、課題が生じる。
本稿では,効率的なマルチマスク・フィルタ回転推定器(EMMFRE)と学習ベース最適化(LbTO)を組み合わせて,球面画像からより効率的かつ正確な回転推定を行う,新しい視覚ジャイロスコープを導入することにより,これらの課題に対処する。
実験により,提案手法の精度において優れた性能を示した。
分析ソリューションを最適化し、制限について議論し、将来の研究の方向性を提案するため、機械学習を統合する利点を強調した。
関連論文リスト
- VICAN: Very Efficient Calibration Algorithm for Large Camera Networks [49.17165360280794]
ポースグラフ最適化手法を拡張する新しい手法を提案する。
我々は、カメラを含む二部グラフ、オブジェクトの動的進化、各ステップにおけるカメラオブジェクト間の相対変換について考察する。
我々のフレームワークは従来のPGOソルバとの互換性を維持しているが、その有効性はカスタマイズされた最適化方式の恩恵を受けている。
論文 参考訳(メタデータ) (2024-03-25T17:47:03Z) - Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation [26.987638406423123]
6-DoFターゲットのポーズを推定するための高速ニューラルネットワーク場(NeRF)に基づく並列最適化手法を提案する。
高速NeRFモデルから描画された画素と観測画像中の画素との残差を最小化することにより、カメラの変換と回転を予測できる。
実験により,本手法は,合成ベンチマークと実世界のベンチマークの両方において,一般化とロバスト性を向上できることを示した。
論文 参考訳(メタデータ) (2022-10-18T19:09:58Z) - Robustifying the Multi-Scale Representation of Neural Radiance Fields [86.69338893753886]
実世界の画像の両問題を克服するために,頑健なマルチスケールニューラルラジアンス場表現手法を提案する。
提案手法は,NeRFにインスパイアされたアプローチを用いて,マルチスケール画像効果とカメラ位置推定問題に対処する。
例えば、日常的に取得したマルチビュー画像からオブジェクトの正確な神経表現を行うためには、カメラの正確な位置推定が不可欠であることを示す。
論文 参考訳(メタデータ) (2022-10-09T11:46:45Z) - Revisiting Rolling Shutter Bundle Adjustment: Toward Accurate and Fast
Solution [6.317266060165099]
本研究では,ローリングシャッター(RS)カメラを用いて,カメラの6-DoFポーズと環境形状を推定し,ロバストで高速なバンドル調整ソリューションを提案する。
これは、センサーの追加、フレームレートの高い動画の入力、カメラの動きに対する制限的な仮定、読み出し方向、効率の低下など、既存の作業の課題に対処する。
論文 参考訳(メタデータ) (2022-09-18T08:21:07Z) - High Dynamic Range and Super-Resolution from Raw Image Bursts [52.341483902624006]
本稿では,露光ブラケット付きハンドヘルドカメラで撮影した原写真からの高解像度・高ダイナミックレンジカラー画像の再構成について紹介する。
提案アルゴリズムは,画像復元における最先端の学習手法と比較して,メモリ要求の少ない高速なアルゴリズムである。
実験では、ハンドヘルドカメラで野生で撮影された実際の写真に最大4ドル(約4,800円)の超高解像度な要素で優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-29T13:31:28Z) - Neural Global Shutter: Learn to Restore Video from a Rolling Shutter
Camera with Global Reset Feature [89.57742172078454]
ローリングシャッター(RS)画像センサは、撮影中にカメラや物体が動き出すとき、幾何学的歪みに悩まされる。
本稿では,ローリングシャッターとグローバルリセット機能(RSGR)を用いて,クリーンなグローバルシャッター(GS)ビデオの復元を行う。
この機能により、修正問題をデブロアのようなものにし、不正確でコストのかかる運動推定をなくすことができる。
論文 参考訳(メタデータ) (2022-04-03T02:49:28Z) - Learning-Based Framework for Camera Calibration with Distortion
Correction and High Precision Feature Detection [14.297068346634351]
本稿では,これらのボトルネックに対処する従来の手法と学習に基づくアプローチを組み合わせたハイブリッドカメラキャリブレーションフレームワークを提案する。
特に、このフレームワークは学習に基づくアプローチを利用して、効率的な歪み補正とロバストなチェス盤角座標符号化を行う。
広範に使われている2つのカメラキャリブレーションツールボックスと比較して、実データと合成データの両方の実験結果は、提案フレームワークのより良い堅牢性と高い精度を示す。
論文 参考訳(メタデータ) (2022-02-01T00:19:18Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z) - IMU-Assisted Learning of Single-View Rolling Shutter Correction [16.242924916178282]
ローリングシャッター歪みは、写真やコンピュータビジョンアルゴリズムにとって非常に望ましくない。
回転シャッター補正のための1つの画像から深度と行ワイドポーズを予測するディープニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-11-05T21:33:25Z) - PlenoptiCam v1.0: A light-field imaging framework [8.467466998915018]
光界カメラは狭帯域深度センシングアプリケーションにおいてリッチな3次元情報検索において重要な役割を担っている。
レンズカメラによる露光から光フィールドを構成する際の重要な障害は、4次元画像データを計算的に調整し、調整し、再配置することである。
特定の望遠カメラ専用のパイプラインを調整することで、全体的な画質を向上させるためのいくつかの試みが提案されている。
論文 参考訳(メタデータ) (2020-10-14T09:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。