論文の概要: Hierarchical Multi-Process Fusion for Visual Place Recognition
- arxiv url: http://arxiv.org/abs/2002.03895v1
- Date: Tue, 28 Jan 2020 00:34:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 02:50:54.203345
- Title: Hierarchical Multi-Process Fusion for Visual Place Recognition
- Title(参考訳): 視覚的位置認識のための階層的マルチプロセス融合
- Authors: Stephen Hausler and Michael Milford
- Abstract要約: 本稿では,3種類のローカライゼーション技術の特徴を活かした,新しい階層型ローカライゼーションシステムを提案する。
2つのテクニックが並列融合よりも階層的にどのように動作するかを示す。
局所化性能を段階的に向上する2層および3層階層構造を構築した。
- 参考スコア(独自算出の注目度): 28.32514927289933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Combining multiple complementary techniques together has long been regarded
as a way to improve performance. In visual localization, multi-sensor fusion,
multi-process fusion of a single sensing modality, and even combinations of
different localization techniques have been shown to result in improved
performance. However, merely fusing together different localization techniques
does not account for the varying performance characteristics of different
localization techniques. In this paper we present a novel, hierarchical
localization system that explicitly benefits from three varying characteristics
of localization techniques: the distribution of their localization hypotheses,
their appearance- and viewpoint-invariant properties, and the resulting
differences in where in an environment each system works well and fails. We
show how two techniques deployed hierarchically work better than in parallel
fusion, how combining two different techniques works better than two levels of
a single technique, even when the single technique has superior individual
performance, and develop two and three-tier hierarchical structures that
progressively improve localization performance. Finally, we develop a stacked
hierarchical framework where localization hypotheses from techniques with
complementary characteristics are concatenated at each layer, significantly
improving retention of the correct hypothesis through to the final localization
stage. Using two challenging datasets, we show the proposed system
outperforming state-of-the-art techniques.
- Abstract(参考訳): 複数の補完的なテクニックを組み合わせることは、パフォーマンスを改善する方法として長い間見なされてきた。
視覚ローカライズでは、マルチセンサー融合、単一センシングモードのマルチプロセス融合、さらには異なるローカライズ技術の組み合わせによってパフォーマンスが向上することが示されている。
しかし, 異なる局所化手法を組み合わせるだけでは, 異なる局所化手法の性能特性は説明できない。
本稿では, 局所化手法の3つの特性, 局所化仮説の分布, 外観・視点不変特性, および, それぞれのシステムがよく機能する環境における相違点を顕著に生かした, 階層的局所化システムについて述べる。
2つのテクニックが並列融合よりも階層的にどのように機能するか、一つのテクニックが個々のパフォーマンスに優れていても、2つの異なるテクニックの組み合わせが1つのテクニックの2レベルよりもうまく機能するかを示し、より段階的にローカライズ性能を改善する2層と3層階層構造を開発する。
最後に,各層に相補的特性を持つ手法から局所化仮説を導出する階層的階層的枠組みを構築し,最終的な局所化段階までの正しい仮説の維持を著しく改善する。
2つの挑戦的データセットを用いて,提案手法が最先端技術より優れていることを示す。
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Towards Differentiable Multilevel Optimization: A Gradient-Based Approach [1.6114012813668932]
本稿では,多レベル最適化のための新しい勾配に基づくアプローチを提案する。
本手法は解の精度と収束速度を両立させながら計算複雑性を著しく低減する。
私たちの知る限りでは、これは暗黙の微分の一般的なバージョンを提供する最初のアルゴリズムの1つである。
論文 参考訳(メタデータ) (2024-10-15T06:17:59Z) - Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling [48.78361527873024]
本稿では,2つの異なる手法の強みを組み込んだ手書き文字認識手法を提案する。
本稿では,アルゴリズムの収束を加速し,システム全体の性能を向上させるスペーシフィケーション手法を提案する。
論文 参考訳(メタデータ) (2024-09-09T15:12:28Z) - Understanding and Constructing Latent Modality Structures in Multi-modal
Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。
具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文 参考訳(メタデータ) (2023-03-10T14:38:49Z) - Learning Deep Multimodal Feature Representation with Asymmetric
Multi-layer Fusion [63.72912507445662]
本稿では,マルチモーダルな特徴を複数の層に融合する,コンパクトで効果的なフレームワークを提案する。
我々は、エンコーダ内のモダリティ固有のバッチ正規化層を単に維持するだけで、共有シングルネットワーク内でマルチモーダル機能を学習できることを検証する。
次に,マルチモーダルな特徴を段階的に活用できる双方向多層融合方式を提案する。
論文 参考訳(メタデータ) (2021-08-11T03:42:13Z) - Probabilistic Visual Place Recognition for Hierarchical Localization [22.703331060822862]
視覚的位置認識に用いる画像検索手法をベイズ状態推定法に適応させる2つの手法を提案する。
本手法を用いて粗局在化ステージの局在化精度を大幅に向上させ、厳しい外観変化下における最新性能を保ちます。
論文 参考訳(メタデータ) (2021-05-07T07:39:14Z) - Domain Adaptive Person Re-Identification via Coupling Optimization [58.567492812339566]
ドメイン適応型人物再識別(ReID)は、ドメインのギャップとターゲットシナリオに対するアノテーションの不足のために困難である。
本稿では,ドメイン不変写像 (DIM) 法とグローバル局所距離最適化 (GLO) を含む結合最適化手法を提案する。
GLOはターゲットドメインの教師なし設定でReIDモデルをトレーニングするために設計されている。
論文 参考訳(メタデータ) (2020-11-06T14:01:03Z) - Multifaceted Context Representation using Dual Attention for Ontology
Alignment [6.445605125467574]
オントロジーアライメントは、データ統合、データ転送、データ準備など、さまざまな分野に適用できる重要な研究課題である。
We propose VeeAlign, a Deep Learning based model that using a dual-attention mechanism to compute the contextualized representation of a concept to learn alignments。
我々は、異なるドメインや多言語設定の様々なデータセットに対するアプローチを検証するとともに、SOTA法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-16T18:28:38Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。