論文の概要: SymbioLCD: Ensemble-Based Loop Closure Detection using CNN-Extracted
Objects and Visual Bag-of-Words
- arxiv url: http://arxiv.org/abs/2110.11491v1
- Date: Thu, 21 Oct 2021 21:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 15:29:55.183541
- Title: SymbioLCD: Ensemble-Based Loop Closure Detection using CNN-Extracted
Objects and Visual Bag-of-Words
- Title(参考訳): SymbioLCD:CNN抽出オブジェクトとビジュアルバグオブワードを用いたアンサンブルベースのループクロージャ検出
- Authors: Jonathan J.Y. Kim, Martin Urschler, Patricia J. Riddle, J\"org S.
Wicker
- Abstract要約: ループクロージャ検出は、その局在のドリフトを最小化するSLAMの重要なツールである。
多くの最先端ループクロージャ検出アルゴリズムは、ビジュアルバグ・オブ・ワード(vBoW)を使用している。
我々は,CNN抽出オブジェクトとvBoW特徴の両方を利用した新しいアンサンブルベースのLCDであるSymbioLCDを提案する。
- 参考スコア(独自算出の注目度): 2.924868086534434
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Loop closure detection is an essential tool of Simultaneous Localization and
Mapping (SLAM) to minimize drift in its localization. Many state-of-the-art
loop closure detection (LCD) algorithms use visual Bag-of-Words (vBoW), which
is robust against partial occlusions in a scene but cannot perceive the
semantics or spatial relationships between feature points. CNN object
extraction can address those issues, by providing semantic labels and spatial
relationships between objects in a scene. Previous work has mainly focused on
replacing vBoW with CNN-derived features. In this paper, we propose SymbioLCD,
a novel ensemble-based LCD that utilizes both CNN-extracted objects and vBoW
features for LCD candidate prediction. When used in tandem, the added elements
of object semantics and spatial-awareness create a more robust and symbiotic
loop closure detection system. The proposed SymbioLCD uses scale-invariant
spatial and semantic matching, Hausdorff distance with temporal constraints,
and a Random Forest that utilizes combined information from both CNN-extracted
objects and vBoW features for predicting accurate loop closure candidates.
Evaluation of the proposed method shows it outperforms other Machine Learning
(ML) algorithms - such as SVM, Decision Tree and Neural Network, and
demonstrates that there is a strong symbiosis between CNN-extracted object
information and vBoW features which assists accurate LCD candidate prediction.
Furthermore, it is able to perceive loop closure candidates earlier than
state-of-the-art SLAM algorithms, utilizing added spatial and semantic
information from CNN-extracted objects.
- Abstract(参考訳): ループクロージャ検出は、同時ローカライゼーションとマッピング(slam)の重要なツールであり、そのローカライゼーションにおけるドリフトを最小化する。
多くのLCDアルゴリズムは視覚的バグ・オブ・ワード(vBoW)を用いており、シーン内の部分的な閉塞に対して頑健であるが、特徴点間の意味や空間的関係を認識できない。
CNNオブジェクト抽出は、シーン内のオブジェクト間の意味ラベルと空間的関係を提供することによって、これらの問題に対処することができる。
これまでの作業は主に、vBoWをCNN由来の機能に置き換えることに重点を置いていた。
本稿では,CNN抽出オブジェクトとvBoW特徴を併用した新しいアンサンブルベースのLCDであるSymbioLCDを提案する。
タンデムで使用する場合、オブジェクトの意味論と空間認識の付加要素はより堅牢で共生的なループ閉鎖検知システムを生成する。
提案したSymbioLCDは,スケール不変の空間的および意味的マッチング,時間的制約を伴うハウスドルフ距離,およびCNN抽出対象とvBoW特徴を併用したランダムフォレストを用いて,正確なループ閉鎖候補の予測を行う。
提案手法の評価は,SVM,決定木,ニューラルネットワークなどの他の機械学習(ML)アルゴリズムよりも優れており,CNN抽出対象情報と正確なLCD候補予測を支援するvBoW特徴との間には強い共生が存在することを示す。
さらに,CNN抽出対象からの空間情報と意味情報を付加することで,最先端SLAMアルゴリズムよりも早くループ閉鎖候補を知覚することができる。
関連論文リスト
- Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.22197702626542]
本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。
線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。
その結果,本手法が最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-08-06T14:50:48Z) - Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - Spatio-Temporal-based Context Fusion for Video Anomaly Detection [1.7710335706046505]
ビデオ異常はビデオ内の異常な事象を発見することを目的としており、主な対象は人や車などの対象物である。
既存のほとんどの手法は、異常検出における空間的コンテキストの役割を無視して、時間的コンテキストのみに焦点を当てている。
本稿では,目標時間文脈融合に基づくビデオ異常検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-18T04:07:10Z) - Closing the Loop: Graph Networks to Unify Semantic Objects and Visual
Features for Multi-object Scenes [2.236663830879273]
ループクロージャ検出(LCD)は、以前に訪れた場所を認識する際に、ドリフトを最小限に抑えるために必要である。
Visual Bag-of-Words (vBoW)は、多くの最先端SLAMシステムで選択されたLCDアルゴリズムである。
本稿では,セマンティックオブジェクトと視覚的特徴を共生的に統合する統合グラフ構造を構築するSymbioLCD2を提案する。
論文 参考訳(メタデータ) (2022-09-24T00:42:33Z) - Self-Supervised Video Object Segmentation via Cutout Prediction and
Tagging [117.73967303377381]
本稿では, 自己教師型ビデオオブジェクト(VOS)アプローチを提案する。
本手法は,対象情報と背景情報の両方を考慮した識別学習損失の定式化に基づく。
提案手法であるCT-VOSは, DAVIS-2017 と Youtube-VOS の2つの挑戦的なベンチマークにおいて,最先端の結果を達成している。
論文 参考訳(メタデータ) (2022-04-22T17:53:27Z) - Location-Sensitive Visual Recognition with Cross-IOU Loss [177.86369890708457]
本稿では,オブジェクト検出,インスタンスセグメンテーション,ポーズ推定のための位置感知ネットワーク (LSNet) という統合ソリューションを提案する。
ディープニューラルネットワークをバックボーンとして、LSNetは、ターゲットオブジェクトの形状を一緒に定義するアンカーポイントとランドマークのセットを予測します。
論文 参考訳(メタデータ) (2021-04-11T02:17:14Z) - Extending Maps with Semantic and Contextual Object Information for Robot
Navigation: a Learning-Based Framework using Visual and Depth Cues [12.984393386954219]
本稿では,RGB-D画像からのセマンティック情報を用いて,シーンのメートル法表現を付加する問題に対処する。
オブジェクトレベルの情報を持つ環境の地図表現を拡張化するための完全なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T15:05:23Z) - Depth Based Semantic Scene Completion with Position Importance Aware
Loss [52.06051681324545]
PALNetはセマンティックシーン補完のための新しいハイブリッドネットワークである。
詳細な深度情報を用いて,多段階から2次元特徴と3次元特徴の両方を抽出する。
オブジェクトのバウンダリやシーンの隅といった重要な詳細を復元することは有益である。
論文 参考訳(メタデータ) (2020-01-29T07:05:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。