論文の概要: Pose Estimation from Camera Images for Underwater Inspection
- arxiv url: http://arxiv.org/abs/2407.16961v1
- Date: Wed, 24 Jul 2024 03:00:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 14:53:14.775505
- Title: Pose Estimation from Camera Images for Underwater Inspection
- Title(参考訳): 水中検査のためのカメラ画像からの姿勢推定
- Authors: Luyuan Peng, Hari Vishnu, Mandar Chitre, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng Tan,
- Abstract要約: ビジュアルローカライゼーションは慣性ナビゲーションシステムに代わる費用対効果がある。
画像からの機械学習によるポーズ推定は,水中環境において有望であることを示す。
我々は、新しいビュー合成モデルを用いて、探索されていない地域でのポーズ推定を大幅に強化し、強化されたトレーニングデータを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-precision localization is pivotal in underwater reinspection missions. Traditional localization methods like inertial navigation systems, Doppler velocity loggers, and acoustic positioning face significant challenges and are not cost-effective for some applications. Visual localization is a cost-effective alternative in such cases, leveraging the cameras already equipped on inspection vehicles to estimate poses from images of the surrounding scene. Amongst these, machine learning-based pose estimation from images shows promise in underwater environments, performing efficient relocalization using models trained based on previously mapped scenes. We explore the efficacy of learning-based pose estimators in both clear and turbid water inspection missions, assessing the impact of image formats, model architectures and training data diversity. We innovate by employing novel view synthesis models to generate augmented training data, significantly enhancing pose estimation in unexplored regions. Moreover, we enhance localization accuracy by integrating pose estimator outputs with sensor data via an extended Kalman filter, demonstrating improved trajectory smoothness and accuracy.
- Abstract(参考訳): 高精度のローカライゼーションは水中再検査ミッションにおいて重要な役割を担っている。
慣性航法システム、ドップラー速度計、音響位置決めといった従来のローカライゼーション手法は重要な課題に直面しており、一部のアプリケーションでは費用対効果がない。
このような場合、視覚的ローカライゼーションはコスト効率の良い代替手段であり、既存の検査車両に搭載されたカメラを利用して周囲のシーンの画像からポーズを推定する。
これらのうち、画像からの機械学習によるポーズ推定は、水中環境における将来性を示し、以前にマッピングされたシーンに基づいて訓練されたモデルを用いて効率的な再局在を行う。
本研究では, 画像形式, モデルアーキテクチャ, トレーニングデータ多様性の影響を評価し, 清浄・濁水検査ミッションにおける学習型ポーズ推定装置の有効性について検討する。
我々は、新しいビュー合成モデルを用いて、拡張トレーニングデータを生成することにより、未探索領域におけるポーズ推定を大幅に強化する。
さらに,ポーズ推定器出力を拡張Kalmanフィルタを介してセンサデータと統合することにより,位置推定精度を向上し,軌道の滑らかさと精度を向上させた。
関連論文リスト
- FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。
我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。
本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-25T03:54:01Z) - FisheyeDepth: A Real Scale Self-Supervised Depth Estimation Model for Fisheye Camera [8.502741852406904]
魚眼カメラに適した自己監督深度推定モデルである魚眼深度について述べる。
魚眼カメラモデルを訓練中の投射と再投射の段階に組み込んで画像歪みの処理を行う。
また、連続するフレーム間の幾何学的投影に実際のポーズ情報を組み込んで、従来のポーズネットワークで推定されたポーズを置き換える。
論文 参考訳(メタデータ) (2024-09-23T14:31:42Z) - Improved Image-based Pose Regressor Models for Underwater Environments [0.0]
単一のRGB画像から6自由度ポーズを高精度に再現する。
ステレオカメラ画像を用いたデータ拡張によるモデル精度の向上について検討する。
実験により, 模擬水と清浄水の両方で精度の高いモデルが得られた。
論文 参考訳(メタデータ) (2024-03-13T09:20:43Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.35438297011176]
視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-02-22T12:55:01Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - Improving Buoy Detection with Deep Transfer Learning for Mussel Farm
Automation [7.906113472259946]
ニュージーランドの養殖業は急速に拡大しており、特に貝類の輸出に重点を置いている。
ムッセル農業活動の需要が発展を続けるにつれ、人工知能とコンピュータビジョン技術の統合が、運用効率を高める効果的なアプローチとして現れつつある。
本研究は, 深層学習手法を活用して, ブイ検出の高度化を図っている。
論文 参考訳(メタデータ) (2023-08-18T01:53:47Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - 6D Camera Relocalization in Visually Ambiguous Extreme Environments [79.68352435957266]
本研究では,深海や地球外地形などの極端な環境下で得られた画像の列から,カメラのポーズを確実に推定する手法を提案する。
本手法は,室内ベンチマーク (7-Scenes データセット) における最先端手法と同等の性能を20%のトレーニングデータで達成する。
論文 参考訳(メタデータ) (2022-07-13T16:40:02Z) - Domain-invariant Similarity Activation Map Contrastive Learning for
Retrieval-based Long-term Visual Localization [30.203072945001136]
本研究では,多領域画像変換による領域不変特徴抽出のために,確率論的に一般アーキテクチャを定式化する。
そして、より精密な局所化のために、新しい勾配重み付き類似性活性化写像損失(Grad-SAM)を組み込んだ。
CMUSeasonsデータセットにおける提案手法の有効性を検証するために大規模な実験が行われた。
我々の性能は、最先端のイメージベースのローカライゼーションベースラインを中あるいは高精度で上回るか、あるいは上回る。
論文 参考訳(メタデータ) (2020-09-16T14:43:22Z) - Perceptual underwater image enhancement with deep learning and physical
priors [35.37760003463292]
本稿では,2つの知覚強調モデルを提案する。
トレーニングデータの欠如により, 物理的先行とデータ駆動的手がかりを融合したハイブリッド水中画像合成モデルが提案され, トレーニングデータを合成する。
実験結果から,提案手法は実環境および合成水中データセット上でのいくつかの最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-08-21T22:11:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。