Fugu-MT 論文翻訳(概要): LSGDDN-LCD: An Appearance-based Loop Closure Detection using Local Superpixel Grid Descriptors and Incremental Dynamic Nodes

論文の概要: LSGDDN-LCD: An Appearance-based Loop Closure Detection using Local Superpixel Grid Descriptors and Incremental Dynamic Nodes

arxiv url: http://arxiv.org/abs/2304.03872v2
Date: Sat, 24 Jun 2023 09:47:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-27 23:09:32.641058
Title: LSGDDN-LCD: An Appearance-based Loop Closure Detection using Local Superpixel Grid Descriptors and Incremental Dynamic Nodes
Title（参考訳）: lsgddn-lcd:ローカルスーパーピクセルグリッドディスクリプタとインクリメンタル動的ノードを用いたルックスベースのループクロージャ検出
Authors: Baosheng Zhang
Abstract要約: ループクロージャ検出(LCD)は、視覚的同時ローカライゼーションとマッピング(SLAM)システムにおいて欠かせない要素である。本稿では,ローカルなスーパーピクセルグリッド記述子と動的ノードを用いたオンライン表示型LCDを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Loop Closure Detection (LCD) is an essential component of visual simultaneous localization and mapping (SLAM) systems. It enables the recognition of previously visited scenes to eliminate pose and map estimate drifts arising from long-term exploration. However, current appearance-based LCD methods face significant challenges, including high computational costs, viewpoint variance, and dynamic objects in scenes. This paper introduced an online appearance based LCD using local superpixel grids descriptor and dynamic node, i.e, LSGDDN-LCD, to find similarities between scenes via hand-crafted features extracted from LSGD. Unlike traditional Bag-of-Words (BoW) based LCD, which requires pre-training, we proposed an adaptive mechanism to group similar images called $\textbf{\textit{dynamic}}$ $\textbf{\textit{node}}$, which incrementally adjusted the database in an online manner, allowing for efficient and online retrieval of previously viewed images without need of the pre-training. Experimental results confirmed that the LSGDDN-LCD significantly improved LCD precision-recall and efficiency, and outperformed several state-of-the-art (SOTA) approaches on multiple typical datasets, indicating its great potential as a generic LCD framework.
Abstract（参考訳）: ループクロージャ検出(LCD)は、視覚的同時ローカライゼーションとマッピング(SLAM)システムにおいて欠かせない要素である。これにより、以前訪れたシーンを認識でき、長期の探検から生じるポーズや地図の推定ドリフトを排除できる。しかし、現在の外観に基づくLCD法は、高い計算コスト、視点分散、シーン内の動的オブジェクトなど、重大な課題に直面している。本稿では,ローカル・スーパーピクセル・グリッドディスクリプタと動的ノード,すなわちlsgddn-lcdを用いて,lsgdから抽出した手作り特徴からシーン間の類似性を見出すオンライン表示型lcdについて紹介する。事前トレーニングを必要とする従来のBag-of-Words (BoW) ベースのLCDとは異なり、我々は、事前トレーニングを必要とせずにデータベースをオンライン的に漸進的に調整する、$\textbf{\textit{dynamic}}$\textbf{\textit{node}}$と呼ばれる類似の画像をグループ化する適応メカニズムを提案した。実験の結果、LSGDDN-LCDはLCDの精度と効率を著しく向上し、複数の典型的なデータセットに対するSOTA(State-of-the-art)アプローチよりも優れており、汎用LCDフレームワークとしての可能性を示している。

関連論文リスト

LCD: Advancing Extreme Low-Bit Clustering for Large Language Models via Knowledge Distillation [18.648706577996595]
大規模言語モデル(LLM)は自然言語処理において大きな進歩を遂げているが、デプロイメントでは課題に直面している。重み量子化はこれらの問題に対処する一般的な手法であるが、効果的な低ビット圧縮を実現することは依然として困難である。本稿では,知識蒸留フレームワーク内でのクラスタリングに基づく量子化学習を統合するLCDを提案する。
論文参考訳（メタデータ） (2025-05-23T03:28:24Z)
Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining [67.87810796668981]
インフォメーション・インフォメーション・インフォメーション・クロッピング(ISC)と自己精製デュアルラーニング(SRDL) Irisは850KのGUIアノテーションだけで、複数のベンチマークで最先端のパフォーマンスを実現している。これらの改善は、WebとOSエージェントの両方の下流タスクで大幅に向上した。
論文参考訳（メタデータ） (2024-12-13T18:40:10Z)
LCD-Net: A Lightweight Remote Sensing Change Detection Network Combining Feature Fusion and Gating Mechanism [6.5655751924536006]
リモートセンシング画像変化検出(RSCD)は動的表面変化の監視に不可欠である。従来のCNNベースの手法は、高い計算複雑性と大きなパラメータ数に悩まされている。本稿では,高検出性能を維持しつつ,モデルサイズと計算コストを低減する軽量な変更検出ネットワーク(LCD-Net)を提案する。
論文参考訳（メタデータ） (2024-10-14T10:33:30Z)
LiqD: A Dynamic Liquid Level Detection Model under Tricky Small Containers [5.361320134021586]
本稿では,U2-Netに基づくコンテナ動的液位検出モデルを提案する。実験結果から, 容器内の液体の動的液体レベル変化を効果的に検出できることが示唆された。
論文参考訳（メタデータ） (2024-03-13T05:53:25Z)
Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文参考訳（メタデータ） (2023-09-30T02:54:51Z)
Differentiable Display Photometric Stereo [15.842538322034537]
光度ステレオは、照明条件の変化を利用して表面の正常を再構成する。本稿では、表示パターンの設計に対処する、微分可能な表示測光ステレオ(DDPS)を提案する。 DDPSは、ターゲットシステムに対して、エンドツーエンドで正確な正常な再構築をもたらす表示パターンを学習する。
論文参考訳（メタデータ） (2023-06-23T07:05:08Z)
GridCLIP: One-Stage Object Detection by Grid-Level CLIP Representation Learning [55.77244064907146]
一段階検出器GridCLIPはグリッドレベルの表現を学習し、一段階検出学習の本質的な原理に適応する。実験により、学習したCLIPベースのグリッドレベル表現は、アンダーサンプリングされた(稀で新しい)カテゴリのパフォーマンスを高めることが示された。
論文参考訳（メタデータ） (2023-03-16T12:06:02Z)
Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and Transformer-Based Method [51.30748775681917]
低照度画像強調(LLIE)の課題を考察し,4K解像度と8K解像度の画像からなる大規模データベースを導入する。我々は、系統的なベンチマーク研究を行い、現在のLLIEアルゴリズムと比較する。第2のコントリビューションとして,変換器をベースとした低照度化手法であるLLFormerを紹介する。
論文参考訳（メタデータ） (2022-12-22T09:05:07Z)
Closing the Loop: Graph Networks to Unify Semantic Objects and Visual Features for Multi-object Scenes [2.236663830879273]
ループクロージャ検出(LCD)は、以前に訪れた場所を認識する際に、ドリフトを最小限に抑えるために必要である。 Visual Bag-of-Words (vBoW)は、多くの最先端SLAMシステムで選択されたLCDアルゴリズムである。本稿では,セマンティックオブジェクトと視覚的特徴を共生的に統合する統合グラフ構造を構築するSymbioLCD2を提案する。
論文参考訳（メタデータ） (2022-09-24T00:42:33Z)
TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。 TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文参考訳（メタデータ） (2021-11-14T19:01:02Z)
Removing Diffraction Image Artifacts in Under-Display Camera via Dynamic Skip Connection Network [80.67717076541956]
アンダーディスプレイカメラ(UDC)システムは、スマートフォン上で真のベゼルレスおよびノッチフリーの視聴体験を提供します。典型的なUDCシステムでは、ピクセルアレイはカメラ上の入射光を減衰および回折し、画像品質の大幅な低下をもたらす。本研究では,前述の劣化問題の解析と対処を目的とする。
論文参考訳（メタデータ） (2021-04-19T18:41:45Z)
LCDNet: Deep Loop Closure Detection for LiDAR SLAM based on Unbalanced Optimal Transport [8.21384946488751]
LiDAR ポイントクラウドのループクロージャを効果的に検出する新しい LCDNet を紹介します。 LCDNetは、共有エンコーダ、グローバルディスクリプタを抽出する場所認識ヘッド、および2つの点雲間の変換を推定する相対ポーズヘッドで構成されています。私たちのアプローチは、逆ループを扱う場合でも、最先端の技術を大きなマージンで上回る。
論文参考訳（メタデータ） (2021-03-08T20:19:37Z)
Cognitive Visual Inspection Service for LCD Manufacturing Industry [80.63336968475889]
本論文では,現在FPD業界で主流となっている液晶ディスプレイ(LCD)の視覚検査システムについて述べる。システムは、堅牢/高性能欠陥認識モデルと認知視覚検査サービスアーキテクチャの2つの基礎に基づいています。
論文参考訳（メタデータ） (2021-01-11T08:14:35Z)
A Parallel Down-Up Fusion Network for Salient Object Detection in Optical Remote Sensing Images [82.87122287748791]
光リモートセンシング画像(RSI)における有意な物体検出のための新しい並列ダウンアップフュージョンネットワーク(PDF-Net)を提案する。 In-pathの低レベル・高レベルな特徴とクロスパスの多解像度な特徴をフル活用して、多様なスケールのサルエントオブジェクトを識別し、散らかった背景を抑える。 ORSSDデータセットの実験により、提案したネットワークは定性的かつ定量的に最先端のアプローチよりも優れていることが示された。
論文参考訳（メタデータ） (2020-10-02T05:27:57Z)
LiPo-LCD: Combining Lines and Points for Appearance-based Loop Closure Detection [1.6758573326215689]
LiPo-LCDは外観に基づく新しいループ閉鎖検出法である。以前の画像は、後期融合戦略を用いて検索する。島の概念に基づくシンプルだが効果的なメカニズムは、画像候補探索の労力を減らすために、時間とともに類似した画像をグループ化する。
論文参考訳（メタデータ） (2020-09-03T10:43:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。