論文の概要: Exploring Object-Aware Attention Guided Frame Association for RGB-D SLAM
- arxiv url: http://arxiv.org/abs/2510.26131v1
- Date: Thu, 30 Oct 2025 04:31:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.6609
- Title: Exploring Object-Aware Attention Guided Frame Association for RGB-D SLAM
- Title(参考訳): RGB-D SLAMのためのオブジェクト指向注意誘導フレームアソシエーションの探索
- Authors: Ali Caglayan, Nevrez Imamoglu, Oguzhan Guclu, Ali Osman Serhatoglu, Ahmet Burak Can, Ryosuke Nakamura,
- Abstract要約: RGB-D屋内SLAMにおけるタスク固有ネットワークアテンションの利用を提案する。
我々はCNN特徴表現とネットワーク勾配から導かれるレイヤワイドアテンション情報を統合し、フレームアソシエーション性能を向上させる。
- 参考スコア(独自算出の注目度): 2.1325069168462303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Attention models have recently emerged as a powerful approach, demonstrating significant progress in various fields. Visualization techniques, such as class activation mapping, provide visual insights into the reasoning of convolutional neural networks (CNNs). Using network gradients, it is possible to identify regions where the network pays attention during image recognition tasks. Furthermore, these gradients can be combined with CNN features to localize more generalizable, task-specific attentive (salient) regions within scenes. However, explicit use of this gradient-based attention information integrated directly into CNN representations for semantic object understanding remains limited. Such integration is particularly beneficial for visual tasks like simultaneous localization and mapping (SLAM), where CNN representations enriched with spatially attentive object locations can enhance performance. In this work, we propose utilizing task-specific network attention for RGB-D indoor SLAM. Specifically, we integrate layer-wise attention information derived from network gradients with CNN feature representations to improve frame association performance. Experimental results indicate improved performance compared to baseline methods, particularly for large environments.
- Abstract(参考訳): 注意モデルは最近強力なアプローチとして登場し、様々な分野で大きな進歩を見せている。
クラスアクティベーションマッピングのような可視化技術は、畳み込みニューラルネットワーク(CNN)の推論に関する視覚的な洞察を提供する。
ネットワーク勾配を用いて、画像認識タスク中にネットワークが注意を払う領域を特定することができる。
さらに、これらの勾配はCNN機能と組み合わせて、シーン内のより一般化可能なタスク固有の注意領域(salient)をローカライズすることができる。
しかし、この勾配に基づく注意情報をCNN表現に直接統合して意味的オブジェクト理解に利用することは、依然として限られている。
このような統合は、CNN表現を空間的に注意されたオブジェクト位置で豊かにすることで、性能を高めることができる、同時ローカライゼーションやマッピング(SLAM)のような視覚的なタスクに特に有用である。
本研究では,RGB-D屋内SLAMにおけるタスク固有のネットワークアテンションを活用することを提案する。
具体的には,ネットワーク勾配から導出されるレイヤワイドアテンション情報をCNN特徴表現と統合し,フレームアソシエーション性能を向上させる。
実験結果から,特に大規模環境において,ベースライン法と比較して性能が向上したことが示唆された。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - Influencer Detection with Dynamic Graph Neural Networks [56.1837101824783]
インフルエンサー検出のための動的グラフニューラルネットワーク(GNN)の構成について検討する。
GNNにおける深層多面的注意と時間特性の符号化が性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2022-11-15T13:00:25Z) - RGB-D SLAM Using Attention Guided Frame Association [11.484398586420067]
RGB-D屋内SLAMにおけるタスク特化ネットワークアテンションの利用を提案する。
我々は,CNN層表現とレイヤワイドオブジェクトアテンション情報(層勾配)を統合し,フレームアソシエーション性能を向上させる。
実験では、パフォーマンスを改善した有望な初期結果が示されている。
論文 参考訳(メタデータ) (2022-01-28T11:23:29Z) - GCA-Net : Utilizing Gated Context Attention for Improving Image Forgery
Localization and Detection [0.9883261192383611]
本稿では,グローバルな文脈学習に非局所的注意ブロックを利用するGated Context Attention Network (GCA-Net)を提案する。
提案手法は,複数のベンチマークデータセットにおいて,平均4.2%-5.4%のAUCで最先端のネットワークより優れていることを示す。
論文 参考訳(メタデータ) (2021-12-08T14:13:14Z) - Variational Structured Attention Networks for Deep Visual Representation
Learning [49.80498066480928]
空間的注意マップとチャネル的注意の両方を原則的に共同学習するための統合的深層フレームワークを提案する。
具体的には,確率的表現学習フレームワークに注目度の推定と相互作用を統合する。
ニューラルネットワーク内で推論ルールを実装し,確率パラメータとcnnフロントエンドパラメータのエンドツーエンド学習を可能にする。
論文 参考訳(メタデータ) (2021-03-05T07:37:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。