論文の概要: Learning to Localize in New Environments from Synthetic Training Data
- arxiv url: http://arxiv.org/abs/2011.04539v2
- Date: Mon, 21 Jun 2021 08:34:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:01:27.344996
- Title: Learning to Localize in New Environments from Synthetic Training Data
- Title(参考訳): 合成学習データから新しい環境にローカライズするための学習
- Authors: Dominik Winkelbauer, Maximilian Denninger, Rudolph Triebel
- Abstract要約: モデルアーキテクチャに特定の変更を適用することで、新しいシーンに一般化できるアプローチを提案する。
提案手法は, SIFT特徴量を用いた5点アルゴリズムを等大画像上で高速化する。
- 参考スコア(独自算出の注目度): 26.194505911908585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing approaches for visual localization either need a detailed 3D
model of the environment or, in the case of learning-based methods, must be
retrained for each new scene. This can either be very expensive or simply
impossible for large, unknown environments, for example in search-and-rescue
scenarios. Although there are learning-based approaches that operate
scene-agnostically, the generalization capability of these methods is still
outperformed by classical approaches. In this paper, we present an approach
that can generalize to new scenes by applying specific changes to the model
architecture, including an extended regression part, the use of hierarchical
correlation layers, and the exploitation of scale and uncertainty information.
Our approach outperforms the 5-point algorithm using SIFT features on equally
big images and additionally surpasses all previous learning-based approaches
that were trained on different data. It is also superior to most of the
approaches that were specifically trained on the respective scenes. We also
evaluate our approach in a scenario where only very few reference images are
available, showing that under such more realistic conditions our learning-based
approach considerably exceeds both existing learning-based and classical
methods.
- Abstract(参考訳): 既存のビジュアルローカライゼーションのアプローチのほとんどは、環境の詳細な3dモデルを必要とするか、学習ベースの方法の場合、新しいシーンごとに再トレーニングする必要がある。
これは、例えば検索と救助のシナリオのように、大規模で未知の環境では非常に高価または単純に不可能である可能性がある。
シーンに依存しない学習ベースのアプローチは存在するが、これらの手法の一般化能力は古典的アプローチではまだ優れている。
本稿では,拡張回帰部分,階層的相関層の利用,スケール情報や不確実性情報の活用など,モデルアーキテクチャに具体的変化を適用することにより,新たな場面に一般化する手法を提案する。
提案手法は、SIFT機能を用いた5点アルゴリズムを等大画像で上回り、さらに、異なるデータでトレーニングされた従来の学習ベースアプローチを上回ります。
また、各シーンで特別に訓練されたアプローチのほとんどよりも優れている。
また,このような現実的条件下では,学習ベースアプローチが既存の学習ベース手法と古典的手法をはるかに上回ることを示すため,参照画像がほとんど存在しないシナリオにおいて,このアプローチを評価した。
関連論文リスト
- A Practitioner's Guide to Continual Multimodal Pretraining [83.63894495064855]
マルチモーダル・ファンデーション・モデルは視覚と言語を交わす多くのアプリケーションに役立っている。
モデルを更新し続けるために、継続事前トレーニングの研究は主に、大規模な新しいデータに対する頻度の低い、差別的な更新、あるいは頻繁に行われるサンプルレベルの更新のシナリオを探求する。
本稿では,FoMo-in-Flux(FoMo-in-Flux)について紹介する。
論文 参考訳(メタデータ) (2024-08-26T17:59:01Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Making Look-Ahead Active Learning Strategies Feasible with Neural
Tangent Kernels [6.372625755672473]
本稿では,仮説的ラベル付き候補データを用いた再学習に基づく,能動的学習獲得戦略の近似手法を提案する。
通常、これはディープ・ネットワークでは実現できないが、我々はニューラル・タンジェント・カーネルを用いて再トレーニングの結果を近似する。
論文 参考訳(メタデータ) (2022-06-25T06:13:27Z) - Model-Based Deep Learning: On the Intersection of Deep Learning and
Optimization [101.32332941117271]
決定アルゴリズムは様々なアプリケーションで使われている。
数理モデルに頼らずにデータから調整された高度パラメトリックアーキテクチャを使用するディープラーニングアプローチが、ますます人気が高まっている。
モデルに基づく最適化とデータ中心のディープラーニングは、しばしば異なる規律とみなされる。
論文 参考訳(メタデータ) (2022-05-05T13:40:08Z) - EASY: Ensemble Augmented-Shot Y-shaped Learning: State-Of-The-Art
Few-Shot Classification with Simple Ingredients [2.0935101589828244]
1つ以上のディープラーニングモデルで学習した知識を活用することを目的として,新しい問題に対する優れた分類性能を得る。
フィールドの標準化された複数のベンチマークで、アートパフォーマンスの状態を達成または打ち負かすような、シンプルな手法を提案する。
論文 参考訳(メタデータ) (2022-01-24T14:08:23Z) - Why-So-Deep: Towards Boosting Previously Trained Models for Visual Place
Recognition [12.807343105549409]
画像のリコールを改善するために,事前学習モデルのパワーを増幅する知的手法MAQBOOLを提案する。
我々は,最先端手法の高記述次元 (4096-D) と比較して,低記述次元 (512-D) で画像検索結果に匹敵する結果を得た。
論文 参考訳(メタデータ) (2022-01-10T08:39:06Z) - Learning to Generalize Unseen Domains via Memory-based Multi-Source
Meta-Learning for Person Re-Identification [59.326456778057384]
本稿では,メモリベースのマルチソースメタラーニングフレームワークを提案する。
また,メタテスト機能を多様化するメタバッチ正規化層(MetaBN)を提案する。
実験により、M$3$Lは、目に見えない領域に対するモデルの一般化能力を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2020-12-01T11:38:16Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Move-to-Data: A new Continual Learning approach with Deep CNNs,
Application for image-class recognition [0.0]
トレーニング記録フェーズ」でモデルを事前トレーニングし、新しいデータに調整する必要がある。
本稿では,ニューラルネットワークの終端における高速連続学習層を提案する。
論文 参考訳(メタデータ) (2020-06-12T13:04:58Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。