論文の概要: RGB-D SLAM Using Attention Guided Frame Association
- arxiv url: http://arxiv.org/abs/2201.12047v1
- Date: Fri, 28 Jan 2022 11:23:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-31 15:46:56.413964
- Title: RGB-D SLAM Using Attention Guided Frame Association
- Title(参考訳): 注意誘導フレームアソシエーションを用いたRGB-D SLAM
- Authors: Ali Caglayan, Nevrez Imamoglu, Oguzhan Guclu, Ali Osman Serhatoglu,
Weimin Wang, Ahmet Burak Can, Ryosuke Nakamura
- Abstract要約: RGB-D屋内SLAMにおけるタスク特化ネットワークアテンションの利用を提案する。
我々は,CNN層表現とレイヤワイドオブジェクトアテンション情報(層勾配)を統合し,フレームアソシエーション性能を向上させる。
実験では、パフォーマンスを改善した有望な初期結果が示されている。
- 参考スコア(独自算出の注目度): 11.484398586420067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models as an emerging topic have shown great progress in
various fields. Especially, visualization tools such as class activation
mapping methods provided visual explanation on the reasoning of convolutional
neural networks (CNNs). By using the gradients of the network layers, it is
possible to demonstrate where the networks pay attention during a specific
image recognition task. Moreover, these gradients can be integrated with CNN
features for localizing more generalized task dependent attentive (salient)
objects in scenes. Despite this progress, there is not much explicit usage of
this gradient (network attention) information to integrate with CNN
representations for object semantics. This can be very useful for visual tasks
such as simultaneous localization and mapping (SLAM) where CNN representations
of spatially attentive object locations may lead to improved performance.
Therefore, in this work, we propose the use of task specific network attention
for RGB-D indoor SLAM. To do so, we integrate layer-wise object attention
information (layer gradients) with CNN layer representations to improve frame
association performance in a state-of-the-art RGB-D indoor SLAM method.
Experiments show promising initial results with improved performance.
- Abstract(参考訳): 新たなトピックとしてのディープラーニングモデルは、さまざまな分野で大きな進歩を見せている。
特に、クラスアクティベーションマッピング法のような可視化ツールは、畳み込みニューラルネットワーク(CNN)の推論に関する視覚的な説明を提供する。
ネットワーク層の勾配を用いることで、特定の画像認識タスク中にネットワークがどこに注意を払っているかを示すことができる。
さらに、これらの勾配はcnnの機能と統合でき、シーン内のより一般化されたタスク依存注意(salient)オブジェクトをローカライズすることができる。
この進歩にもかかわらず、オブジェクトセマンティクスのcnn表現と統合するために、この勾配(ネットワークの注意)情報はあまり明確には使われていない。
これは、空間的に注意すべき物体位置のCNN表現が性能改善につながるような、同時局所化とマッピング(SLAM)のような視覚的タスクに非常に有用である。
そこで本研究では,RGB-D屋内SLAMにおけるタスク固有ネットワークアテンションの利用を提案する。
そこで我々は,最新のRGB-D屋内SLAM法において,CNN層表現とレイヤワイドオブジェクトアテンション情報(レイヤ勾配)を統合し,フレームアソシエーション性能を向上させる。
実験はパフォーマンスを向上して有望な初期結果を示す。
関連論文リスト
- DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - Point-SLAM: Dense Neural Point Cloud-based SLAM [61.96492935210654]
本稿では,モノクラーRGBD入力に対する高密度ニューラルネットワークの局所化とマッピング(SLAM)手法を提案する。
トラッキングとマッピングの両方が、同じポイントベースのニューラルシーン表現で実行可能であることを実証する。
論文 参考訳(メタデータ) (2023-04-09T16:48:26Z) - Variational Structured Attention Networks for Deep Visual Representation
Learning [49.80498066480928]
空間的注意マップとチャネル的注意の両方を原則的に共同学習するための統合的深層フレームワークを提案する。
具体的には,確率的表現学習フレームワークに注目度の推定と相互作用を統合する。
ニューラルネットワーク内で推論ルールを実装し,確率パラメータとcnnフロントエンドパラメータのエンドツーエンド学習を可能にする。
論文 参考訳(メタデータ) (2021-03-05T07:37:24Z) - Contextually Guided Convolutional Neural Networks for Learning Most
Transferable Representations [1.160208922584163]
新たなタスクに転送可能な汎用表現を開発するための効率的なアルゴリズムをトレーニングなしで提案する。
コンテキストガイド付きCNN(CG-CNN)は、データセット内のランダムな画像位置で選択された近隣画像パッチのグループに基づいて訓練される。
自然画像への適用では、CG-CNNの機能は、最初のCNNレイヤーの同等の転送可能な機能と同じ、高い場合でも、転送ユーティリティと分類精度を示しています。
論文 参考訳(メタデータ) (2021-03-02T08:41:12Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - How Convolutional Neural Network Architecture Biases Learned Opponency
and Colour Tuning [1.0742675209112622]
最近の研究は、第2層にボトルネックを導入して畳み込みニューラルネットワーク(CNN)アーキテクチャを変更することで、学習機能の変化をもたらすことを示唆している。
この関係を完全に理解するには、訓練されたネットワークを定量的に比較する方法が必要である。
畳み込みニューロンに対する空間的および色調曲線を得るためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-10-06T11:33:48Z) - Decoding CNN based Object Classifier Using Visualization [6.666597301197889]
CNNのさまざまな畳み込み層で抽出される特徴の種類を視覚化する。
アクティベーションのヒートマップを可視化することは、CNNが画像内の異なるオブジェクトを分類し、ローカライズする方法を理解するのに役立ちます。
論文 参考訳(メタデータ) (2020-07-15T05:01:27Z) - When CNNs Meet Random RNNs: Towards Multi-Level Analysis for RGB-D
Object and Scene Recognition [10.796613905980609]
オブジェクトおよびシーン認識タスクのための多モードRGB-D画像から識別的特徴表現を抽出する新しいフレームワークを提案する。
CNNアクティベーションの高次元性に対応するため、ランダムな重み付けプール方式が提案されている。
実験では、RNNステージにおける完全ランダム化構造がCNNアクティベーションを符号化し、識別的ソリッドな特徴を成功させることを確認した。
論文 参考訳(メタデータ) (2020-04-26T10:58:27Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。