論文の概要: Attention-SLAM: A Visual Monocular SLAM Learning from Human Gaze
- arxiv url: http://arxiv.org/abs/2009.06886v1
- Date: Tue, 15 Sep 2020 06:59:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 06:44:24.562495
- Title: Attention-SLAM: A Visual Monocular SLAM Learning from Human Gaze
- Title(参考訳): Attention-SLAM:人間の視線から学ぶ視覚単眼のSLAM
- Authors: Jinquan Li, Ling Pei, Danping Zou, Songpengcheng Xia, Qi Wu, Tao Li,
Zhen Sun, Wenxian Yu
- Abstract要約: 本稿では,新しいSLAMアプローチ,すなわちAttention-SLAMを提案する。
SalNavNet(ビジュアル・サリエンシ・モデル)と従来のモノラル・ビジュアル・SLAMを組み合わせている。
Attention-SLAMは、DSO(Direct Sparse Odometry)、ORB-SLAM(ORB-SLAM)、Salient DSO(Salient DSO)などのベンチマークよりも優れていた。
- 参考スコア(独自算出の注目度): 19.99938539199779
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel simultaneous localization and mapping (SLAM)
approach, namely Attention-SLAM, which simulates human navigation mode by
combining a visual saliency model (SalNavNet) with traditional monocular visual
SLAM. Most SLAM methods treat all the features extracted from the images as
equal importance during the optimization process. However, the salient feature
points in scenes have more significant influence during the human navigation
process. Therefore, we first propose a visual saliency model called SalVavNet
in which we introduce a correlation module and propose an adaptive Exponential
Moving Average (EMA) module. These modules mitigate the center bias to enable
the saliency maps generated by SalNavNet to pay more attention to the same
salient object. Moreover, the saliency maps simulate the human behavior for the
refinement of SLAM results. The feature points extracted from the salient
regions have greater importance in optimization process. We add semantic
saliency information to the Euroc dataset to generate an open-source saliency
SLAM dataset. Comprehensive test results prove that Attention-SLAM outperforms
benchmarks such as Direct Sparse Odometry (DSO), ORB-SLAM, and Salient DSO in
terms of efficiency, accuracy, and robustness in most test cases.
- Abstract(参考訳): 本稿では,視覚サリエンシーモデル (salnavnet) と従来の単眼視覚スラムを組み合わせることにより,人間のナビゲーションモードをシミュレートする,新しい同時局所化マッピング (slam) 手法を提案する。
ほとんどのslamメソッドは、画像から抽出された全ての機能を最適化プロセスにおいて等しく重要視している。
しかし、人間のナビゲーション過程において、シーンの健全な特徴点がより大きな影響を及ぼす。
そこで我々はまず,相関モジュールを導入し,適応型指数移動平均(EMA)モジュールを提案するSalVavNetというビジュアル・サリエンシ・モデルを提案する。
これらのモジュールは中心バイアスを緩和し、SalNavNetが生成したサリアントマップが同じサリアントオブジェクトにより多くの注意を払うことができる。
さらに,サリエンシーマップは,slam結果の精細化のために人間の行動をシミュレートする。
サリエント領域から抽出された特徴点は最適化プロセスにおいてより重要である。
セマンティック・サリエンシ情報をEurocデータセットに追加し、オープンソースのサリエンシSLAMデータセットを生成します。
総合的なテスト結果から、Attention-SLAMは直接スパースオドメトリー(DSO)、ORB-SLAM、Salient DSOなどのベンチマークよりも効率、正確性、堅牢性が高いことが証明された。
関連論文リスト
- Unleashing Network Potentials for Semantic Scene Completion [50.95486458217653]
本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。
AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。
AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2024-03-12T11:48:49Z) - DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing [13.50980509878613]
公開されているデータセットに対する実験的評価は、DK-SLAMが従来のSLAMシステムと学習ベースのSLAMシステムより優れていることを示している。
本システムでは,キーポイント抽出ネットワークの学習を最適化するために,モデル非依存メタラーニング(MAML)戦略を採用している。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
論文 参考訳(メタデータ) (2024-01-17T12:08:30Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - DVI-SLAM: A Dual Visual Inertial SLAM Network [31.067716365926845]
本稿では2つの視覚的要素を持つ新しいディープSLAMネットワークを提案する。
提案するネットワークは,両視覚要因の信頼度マップを動的に学習し,調整する。
大規模な実験により,提案手法はいくつかの公開データセットにおいて,最先端の手法を著しく上回っていることが確認された。
論文 参考訳(メタデータ) (2023-09-25T01:42:54Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Depth Completion with Multiple Balanced Bases and Confidence for Dense
Monocular SLAM [34.78726455243436]
本稿では,軽量深度補完網をスパースSLAMシステムに統合する新しい手法を提案する。
具体的には,BBC-Netと呼ばれる,高度に最適化されたマルチバス深度補完ネットワークを提案する。
BBC-Netは、オフザシェルキーポイントベースのSLAMシステムによって生成されたスパースポイントを持つ単眼画像から、複数のバランスの取れたベースと信頼マップを予測できる。
論文 参考訳(メタデータ) (2023-09-08T06:15:27Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - NICE-SLAM: Neural Implicit Scalable Encoding for SLAM [112.6093688226293]
NICE-SLAMは階層的なシーン表現を導入することでマルチレベルローカル情報を組み込んだ高密度SLAMシステムである。
最近の暗黙的SLAMシステムと比較して、私たちのアプローチはよりスケーラブルで効率的で堅牢です。
論文 参考訳(メタデータ) (2021-12-22T18:45:44Z) - Accurate Visual-Inertial SLAM by Feature Re-identification [4.263022790692934]
空間時空間感度サブグローバルマップから既存の特徴を再同定し,効率的なドリフトレスSLAM法を提案する。
本手法は67.3%,87.5%の絶対翻訳誤差を最小の計算コストで削減する。
論文 参考訳(メタデータ) (2021-02-26T12:54:33Z) - A Hybrid Learner for Simultaneous Localization and Mapping [2.1041384320978267]
同時ローカライゼーション・マッピング(slam)は、移動プラットフォームの動的運動経路を予測するために用いられる。
本研究は,機能融合を超えたハイブリッド学習モデルを提案する。
それは異なった深いネットワークの上の層の突然変異によってSLAMのフロントエンドの特徴の抽出器の重量の増強を遂行します。
独立に訓練されたモデルからの軌道予測は、位置の詳細を洗練するために集約される。
論文 参考訳(メタデータ) (2021-01-04T18:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。