論文の概要: Tightly Coupled Learning Strategy for Weakly Supervised Hierarchical
Place Recognition
- arxiv url: http://arxiv.org/abs/2202.06470v1
- Date: Mon, 14 Feb 2022 03:20:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-16 04:39:38.191743
- Title: Tightly Coupled Learning Strategy for Weakly Supervised Hierarchical
Place Recognition
- Title(参考訳): 弱教師付き階層的位置認識のための密結合学習戦略
- Authors: Y. Shen, R. Wang, W. Zuo, N. Zheng
- Abstract要約: 本稿では,三重項モデルを学習するための密結合学習(TCL)戦略を提案する。
グローバルデクリプタとローカルデクリプタを組み合わせて、共同最適化を行う。
我々の軽量統一モデルは、いくつかの最先端手法よりも優れている。
- 参考スコア(独自算出の注目度): 0.09558392439655011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual place recognition (VPR) is a key issue for robotics and autonomous
systems. For the trade-off between time and performance, most of methods use
the coarse-to-fine hierarchical architecture, which consists of retrieving
top-N candidates using global features, and re-ranking top-N with local
features. However, since the two types of features are usually processed
independently, re-ranking may harm global retrieval, termed re-ranking
confusion. Moreover, re-ranking is limited by global retrieval. In this paper,
we propose a tightly coupled learning (TCL) strategy to train triplet models.
Different from original triplet learning (OTL) strategy, it combines global and
local descriptors for joint optimization. In addition, a bidirectional search
dynamic time warping (BS-DTW) algorithm is also proposed to mine locally
spatial information tailored to VPR in re-ranking. The experimental results on
public benchmarks show that the models using TCL outperform the models using
OTL, and TCL can be used as a general strategy to improve performance for
weakly supervised ranking tasks. Further, our lightweight unified model is
better than several state-of-the-art methods and has over an order of magnitude
of computational efficiency to meet the real-time requirements of robots.
- Abstract(参考訳): 視覚的位置認識(VPR)は、ロボット工学と自律システムにとって重要な問題である。
時間とパフォーマンスのトレードオフとして、ほとんどのメソッドは、グローバル機能を使用してトップN候補を検索し、ローカル機能を備えたトップNを再ランク付けする、粗大な階層アーキテクチャを使用する。
しかし、2種類の特徴は通常独立して処理されるため、再ランク付けはグローバル検索を損なう可能性がある。
さらに、グローバル検索によって再ランク付けが制限される。
本稿では,三重項モデルを学習するための密結合学習(TCL)戦略を提案する。
元の三重項学習(OTL)戦略とは異なり、グローバルとローカルの記述子を組み合わせて共同最適化を行う。
さらに,vprに調整された局所空間情報を探索するために,bs-dtw(bidirectional search dynamic time warping)アルゴリズムも提案されている。
公開ベンチマークにおける実験結果から,tclを用いたモデルはotlを用いたモデルよりも優れており,tclは弱い教師付きランキングタスクのパフォーマンス向上のための一般的な戦略として使用することができる。
さらに、軽量統一モデルは最先端の手法よりも優れており、ロボットのリアルタイム要求を満たすために計算効率が桁違いに向上している。
関連論文リスト
- Submodel Partitioning in Hierarchical Federated Learning: Algorithm
Design and Convergence Analysis [15.311309249848739]
階層学習(FL)は、従来の「星のトポロジー」アーキテクチャに基づく連合学習(FL)よりも有望なスケーラビリティを実証している。
本稿では,IoT(Internet of Things)の独立したサブトレーニングを提案する。
HISTの背景にある主要なアイデアは、モデル計算のグローバルバージョンであり、グローバルモデルを各ラウンドの非結合サブモデルに分割し、異なるセルに分散する。
論文 参考訳(メタデータ) (2023-10-27T04:42:59Z) - AANet: Aggregation and Alignment Network with Semi-hard Positive Sample
Mining for Hierarchical Place Recognition [48.043749855085025]
視覚的位置認識(VPR)はロボット工学におけるホットスポットの一つで、視覚情報を用いてロボットの位置を特定する。
本稿では,アグリゲーションモジュールを介して候補を検索するためのグローバルな特徴を抽出できる統一ネットワークを提案する。
また、より堅牢なVPRネットワークをトレーニングするために、適切なハード正のイメージを選択するためのセミハード正のサンプルマイニング(ShPSM)戦略を提案する。
論文 参考訳(メタデータ) (2023-10-08T14:46:11Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z) - A Faster, Lighter and Stronger Deep Learning-Based Approach for Place
Recognition [7.9400442516053475]
より速く、より軽く、より強力なアプローチを提案し、より少ないパラメータでモデルを生成でき、推論段階での時間を短縮できる。
本稿では,RepVG-liteをアーキテクチャのバックボーンネットワークとして設計する。
提案システムは,Patch-NetVLADの14倍,理論的FLOPの6.8倍,特徴抽出と特徴マッチングの21倍,33倍の高速化を実現している。
論文 参考訳(メタデータ) (2022-11-27T15:46:53Z) - Residual Local Feature Network for Efficient Super-Resolution [20.62809970985125]
本研究では,Residual Local Feature Network (RLFN)を提案する。
主なアイデアは、3つの畳み込みレイヤを局所的な特徴学習に使用して、機能の集約を単純化することだ。
さらに,NTIRE 2022の高効率超解像問題において,第1位を獲得した。
論文 参考訳(メタデータ) (2022-05-16T08:46:34Z) - AutoBERT-Zero: Evolving BERT Backbone from Scratch [94.89102524181986]
そこで本稿では,提案するハイブリッドバックボーンアーキテクチャを自動検索するOP-NASアルゴリズムを提案する。
提案するOP-NASの効率を向上させるために,探索アルゴリズムと候補モデルの評価を最適化する。
実験の結果、検索されたアーキテクチャ(AutoBERT-Zero)は、様々な下流タスクにおいてBERTとそのバリエーションの異なるモデル容量を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-07-15T16:46:01Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - FedPD: A Federated Learning Framework with Optimal Rates and Adaptivity
to Non-IID Data [59.50904660420082]
フェデレートラーニング(FL)は、分散データから学ぶための一般的なパラダイムになっています。
クラウドに移行することなく、さまざまなデバイスのデータを効果的に活用するために、Federated Averaging(FedAvg)などのアルゴリズムでは、"Computation then aggregate"(CTA)モデルを採用している。
論文 参考訳(メタデータ) (2020-05-22T23:07:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。