論文の概要: LSGDDN-LCD: An Appearance-based Loop Closure Detection using Local
Superpixel Grid Descriptors and Incremental Dynamic Nodes
- arxiv url: http://arxiv.org/abs/2304.03872v2
- Date: Sat, 24 Jun 2023 09:47:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 23:09:32.641058
- Title: LSGDDN-LCD: An Appearance-based Loop Closure Detection using Local
Superpixel Grid Descriptors and Incremental Dynamic Nodes
- Title(参考訳): lsgddn-lcd:ローカルスーパーピクセルグリッドディスクリプタとインクリメンタル動的ノードを用いたルックスベースのループクロージャ検出
- Authors: Baosheng Zhang
- Abstract要約: ループクロージャ検出(LCD)は、視覚的同時ローカライゼーションとマッピング(SLAM)システムにおいて欠かせない要素である。
本稿では,ローカルなスーパーピクセルグリッド記述子と動的ノードを用いたオンライン表示型LCDを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Loop Closure Detection (LCD) is an essential component of visual simultaneous
localization and mapping (SLAM) systems. It enables the recognition of
previously visited scenes to eliminate pose and map estimate drifts arising
from long-term exploration. However, current appearance-based LCD methods face
significant challenges, including high computational costs, viewpoint variance,
and dynamic objects in scenes. This paper introduced an online appearance based
LCD using local superpixel grids descriptor and dynamic node, i.e, LSGDDN-LCD,
to find similarities between scenes via hand-crafted features extracted from
LSGD. Unlike traditional Bag-of-Words (BoW) based LCD, which requires
pre-training, we proposed an adaptive mechanism to group similar images called
$\textbf{\textit{dynamic}}$ $\textbf{\textit{node}}$, which incrementally
adjusted the database in an online manner, allowing for efficient and online
retrieval of previously viewed images without need of the pre-training.
Experimental results confirmed that the LSGDDN-LCD significantly improved LCD
precision-recall and efficiency, and outperformed several state-of-the-art
(SOTA) approaches on multiple typical datasets, indicating its great potential
as a generic LCD framework.
- Abstract(参考訳): ループクロージャ検出(LCD)は、視覚的同時ローカライゼーションとマッピング(SLAM)システムにおいて欠かせない要素である。
これにより、以前訪れたシーンを認識でき、長期の探検から生じるポーズや地図の推定ドリフトを排除できる。
しかし、現在の外観に基づくLCD法は、高い計算コスト、視点分散、シーン内の動的オブジェクトなど、重大な課題に直面している。
本稿では,ローカル・スーパーピクセル・グリッドディスクリプタと動的ノード,すなわちlsgddn-lcdを用いて,lsgdから抽出した手作り特徴からシーン間の類似性を見出すオンライン表示型lcdについて紹介する。
事前トレーニングを必要とする従来のBag-of-Words (BoW) ベースのLCDとは異なり、我々は、事前トレーニングを必要とせずにデータベースをオンライン的に漸進的に調整する、$\textbf{\textit{dynamic}}$\textbf{\textit{node}}$と呼ばれる類似の画像をグループ化する適応メカニズムを提案した。
実験の結果、LSGDDN-LCDはLCDの精度と効率を著しく向上し、複数の典型的なデータセットに対するSOTA(State-of-the-art)アプローチよりも優れており、汎用LCDフレームワークとしての可能性を示している。
関連論文リスト
- LCD-Net: A Lightweight Remote Sensing Change Detection Network Combining Feature Fusion and Gating Mechanism [6.5655751924536006]
リモートセンシング画像変化検出(RSCD)は動的表面変化の監視に不可欠である。
従来のCNNベースの手法は、高い計算複雑性と大きなパラメータ数に悩まされている。
本稿では,高検出性能を維持しつつ,モデルサイズと計算コストを低減する軽量な変更検出ネットワーク(LCD-Net)を提案する。
論文 参考訳(メタデータ) (2024-10-14T10:33:30Z) - LiqD: A Dynamic Liquid Level Detection Model under Tricky Small
Containers [5.361320134021586]
本稿では,U2-Netに基づくコンテナ動的液位検出モデルを提案する。
実験結果から, 容器内の液体の動的液体レベル変化を効果的に検出できることが示唆された。
論文 参考訳(メタデータ) (2024-03-13T05:53:25Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - GridCLIP: One-Stage Object Detection by Grid-Level CLIP Representation
Learning [55.77244064907146]
一段階検出器GridCLIPはグリッドレベルの表現を学習し、一段階検出学習の本質的な原理に適応する。
実験により、学習したCLIPベースのグリッドレベル表現は、アンダーサンプリングされた(稀で新しい)カテゴリのパフォーマンスを高めることが示された。
論文 参考訳(メタデータ) (2023-03-16T12:06:02Z) - Closing the Loop: Graph Networks to Unify Semantic Objects and Visual
Features for Multi-object Scenes [2.236663830879273]
ループクロージャ検出(LCD)は、以前に訪れた場所を認識する際に、ドリフトを最小限に抑えるために必要である。
Visual Bag-of-Words (vBoW)は、多くの最先端SLAMシステムで選択されたLCDアルゴリズムである。
本稿では,セマンティックオブジェクトと視覚的特徴を共生的に統合する統合グラフ構造を構築するSymbioLCD2を提案する。
論文 参考訳(メタデータ) (2022-09-24T00:42:33Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Removing Diffraction Image Artifacts in Under-Display Camera via Dynamic
Skip Connection Network [80.67717076541956]
アンダーディスプレイカメラ(UDC)システムは、スマートフォン上で真のベゼルレスおよびノッチフリーの視聴体験を提供します。
典型的なUDCシステムでは、ピクセルアレイはカメラ上の入射光を減衰および回折し、画像品質の大幅な低下をもたらす。
本研究では,前述の劣化問題の解析と対処を目的とする。
論文 参考訳(メタデータ) (2021-04-19T18:41:45Z) - LCDNet: Deep Loop Closure Detection for LiDAR SLAM based on Unbalanced
Optimal Transport [8.21384946488751]
LiDAR ポイント クラウドのループ クロージャを効果的に検出する新しい LCDNet を紹介します。
LCDNetは、共有エンコーダ、グローバルディスクリプタを抽出する場所認識ヘッド、および2つの点雲間の変換を推定する相対ポーズヘッドで構成されています。
私たちのアプローチは、逆ループを扱う場合でも、最先端の技術を大きなマージンで上回る。
論文 参考訳(メタデータ) (2021-03-08T20:19:37Z) - Cognitive Visual Inspection Service for LCD Manufacturing Industry [80.63336968475889]
本論文では,現在FPD業界で主流となっている液晶ディスプレイ(LCD)の視覚検査システムについて述べる。
システムは、堅牢/高性能欠陥認識モデルと認知視覚検査サービスアーキテクチャの2つの基礎に基づいています。
論文 参考訳(メタデータ) (2021-01-11T08:14:35Z) - A Parallel Down-Up Fusion Network for Salient Object Detection in
Optical Remote Sensing Images [82.87122287748791]
光リモートセンシング画像(RSI)における有意な物体検出のための新しい並列ダウンアップフュージョンネットワーク(PDF-Net)を提案する。
In-pathの低レベル・高レベルな特徴とクロスパスの多解像度な特徴をフル活用して、多様なスケールのサルエントオブジェクトを識別し、散らかった背景を抑える。
ORSSDデータセットの実験により、提案したネットワークは定性的かつ定量的に最先端のアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T05:27:57Z) - LiPo-LCD: Combining Lines and Points for Appearance-based Loop Closure
Detection [1.6758573326215689]
LiPo-LCDは外観に基づく新しいループ閉鎖検出法である。
以前の画像は、後期融合戦略を用いて検索する。
島の概念に基づくシンプルだが効果的なメカニズムは、画像候補探索の労力を減らすために、時間とともに類似した画像をグループ化する。
論文 参考訳(メタデータ) (2020-09-03T10:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。