論文の概要: An Attention-Based Deep Learning Architecture for Real-Time Monocular Visual Odometry: Applications to GPS-free Drone Navigation
- arxiv url: http://arxiv.org/abs/2404.17745v1
- Date: Sat, 27 Apr 2024 01:22:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 19:30:48.522835
- Title: An Attention-Based Deep Learning Architecture for Real-Time Monocular Visual Odometry: Applications to GPS-free Drone Navigation
- Title(参考訳): リアルタイム単眼視画像計測のための注意型ディープラーニングアーキテクチャ:GPSのないドローンナビゲーションへの応用
- Authors: Olivier Brochu Dufour, Abolfazl Mohebbi, Sofiane Achiche,
- Abstract要約: 視覚計測の研究は進歩しており、GPSのないナビゲーションの問題を解決する可能性がある。
近年、ディープニューラルネットワーク(DNN)を用いた研究により、性能が向上している。
本稿では,無人機のための一眼一眼視計測モデルを提案する。
- 参考スコア(独自算出の注目度): 0.9558392439655012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Drones are increasingly used in fields like industry, medicine, research, disaster relief, defense, and security. Technical challenges, such as navigation in GPS-denied environments, hinder further adoption. Research in visual odometry is advancing, potentially solving GPS-free navigation issues. Traditional visual odometry methods use geometry-based pipelines which, while popular, often suffer from error accumulation and high computational demands. Recent studies utilizing deep neural networks (DNNs) have shown improved performance, addressing these drawbacks. Deep visual odometry typically employs convolutional neural networks (CNNs) and sequence modeling networks like recurrent neural networks (RNNs) to interpret scenes and deduce visual odometry from video sequences. This paper presents a novel real-time monocular visual odometry model for drones, using a deep neural architecture with a self-attention module. It estimates the ego-motion of a camera on a drone, using consecutive video frames. An inference utility processes the live video feed, employing deep learning to estimate the drone's trajectory. The architecture combines a CNN for image feature extraction and a long short-term memory (LSTM) network with a multi-head attention module for video sequence modeling. Tested on two visual odometry datasets, this model converged 48% faster than a previous RNN model and showed a 22% reduction in mean translational drift and a 12% improvement in mean translational absolute trajectory error, demonstrating enhanced robustness to noise.
- Abstract(参考訳): ドローンは、産業、医療、研究、災害救助、防衛、セキュリティなどの分野でますます使われている。
GPSを内蔵した環境でのナビゲーションのような技術的な課題は、さらなる採用を妨げる。
視覚計測の研究は進歩しており、GPSのないナビゲーションの問題を解決する可能性がある。
従来のビジュアル・オドメトリー法では幾何学に基づくパイプラインが用いられており、一般的には誤りの蓄積や高い計算要求に悩まされる。
ディープニューラルネットワーク(DNN)を用いた最近の研究は、これらの欠点に対処しながら、パフォーマンスを改善した。
ディープビジュアルオドメトリは通常、畳み込みニューラルネットワーク(CNN)と、リカレントニューラルネットワーク(RNN)のようなシーケンスモデリングネットワークを使用して、シーンを解釈し、ビデオシーケンスから視覚オドメトリを推論する。
本稿では,自律型モジュールを用いた深部ニューラルネットワークを用いて,ドローンのリアルタイムモノクロ視覚計測モデルを提案する。
ドローン上のカメラのエゴモーションを、連続したビデオフレームを使って推定する。
推論ユーティリティはライブビデオフィードを処理し、ディープラーニングを使用してドローンの軌道を推定する。
このアーキテクチャは、画像特徴抽出のためのCNNと、長寿命メモリ(LSTM)ネットワークと、ビデオシーケンスモデリングのためのマルチヘッドアテンションモジュールを組み合わせたものである。
従来のRNNモデルよりも48%早く収束し,平均翻訳速度が22%減少し,平均翻訳絶対軌道誤差が12%改善し,ノイズに対する頑健性が向上した。
関連論文リスト
- Robot Localization and Mapping Final Report -- Sequential Adversarial
Learning for Self-Supervised Deep Visual Odometry [2.512491726995032]
VO(Visual odometry)とSLAM(SLAM)は、何十年にもわたって動きから局所的な構造を通して多視点幾何を用いてきた。
高レベルの特徴を抽出するディープニューラルネットワークは、コンピュータビジョンにおいてユビキタスである。
この研究の目標は、過去のアプローチのこれらの制限に対処し、より良い深さを提供し、見積もりを示す方法を開発することである。
論文 参考訳(メタデータ) (2023-09-08T06:24:17Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Lost Vibration Test Data Recovery Using Convolutional Neural Network: A
Case Study [0.0]
本稿では,アラモサキャニオン橋のCNNアルゴリズムを実構造として提案する。
3つの異なるCNNモデルは、1つと2つの故障したセンサーを予測するものとされた。
畳み込み層を追加することによりモデルの精度が向上した。
論文 参考訳(メタデータ) (2022-04-11T23:24:03Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Spatial-Temporal Map Vehicle Trajectory Detection Using Dynamic Mode
Decomposition and Res-UNet+ Neural Networks [0.0]
本稿では,高角交通カメラから車両軌跡を抽出する,機械学習による縦走査法を提案する。
空間時間マップ(STMap)をスパースフォアグラウンドおよびローランク背景に分解することにより,車両ストランドの抽出に動的モード分解(DMD)法を適用した。
Res-UNet+という名前のディープニューラルネットワークは、2つの一般的なディープラーニングアーキテクチャを適用することでセマンティックセグメンテーションタスクのために設計された。
論文 参考訳(メタデータ) (2022-01-13T00:49:24Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Automatic Extraction of Road Networks from Satellite Images by using
Adaptive Structural Deep Belief Network [0.0]
本研究では,ロードトラッカーと呼ばれる道路網の自動認識手法に適用する。
RoadTracerは航空写真データから地上の道路地図を生成することができる。
精度と計算時間を改善するため,我々のAdaptive DBNはCNNの代わりにRoadTracer上に実装された。
論文 参考訳(メタデータ) (2021-10-25T07:06:10Z) - Training Feedback Spiking Neural Networks by Implicit Differentiation on
the Equilibrium State [66.2457134675891]
スパイキングニューラルネットワーク(英: Spiking Neural Network、SNN)は、ニューロモルフィックハードウェア上でエネルギー効率の高い実装を可能にする脳にインスパイアされたモデルである。
既存のほとんどの手法は、人工ニューラルネットワークのバックプロパゲーションフレームワークとフィードフォワードアーキテクチャを模倣している。
本稿では,フォワード計算の正逆性に依存しない新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T07:46:54Z) - UAV-AdNet: Unsupervised Anomaly Detection using Deep Neural Networks for
Aerial Surveillance [20.318367304051176]
本稿では,重要なインフラの監視のために,ディープニューラルネットワークを用いた全体的異常検出システムを提案する。
まず,鳥視画像中の物体の空間配置を明示的に表現する手法を提案する。
次に、教師なし異常検出(UAV-AdNet)のためのディープニューラルネットワークアーキテクチャを提案する。
文献研究とは異なり、GPSと画像データを組み合わせて異常な観察を予測する。
論文 参考訳(メタデータ) (2020-11-05T14:26:29Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey [77.99182201815763]
ディープニューラルネットワーク(DNN)は多くの異なる問題設定において最先端の結果を達成する。
DNNはしばしばブラックボックスシステムとして扱われ、評価と検証が複雑になる。
コンピュータビジョンタスクにおける畳み込みニューラルネットワーク(CNN)の成功に触発された、有望な分野のひとつは、対称幾何学的変換に関する知識を取り入れることである。
論文 参考訳(メタデータ) (2020-06-30T14:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。