論文の概要: What you see is what you get: Experience ranking with deep neural
dataset-to-dataset similarity for topological localisation
- arxiv url: http://arxiv.org/abs/2310.13622v1
- Date: Fri, 20 Oct 2023 16:13:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 21:51:43.954305
- Title: What you see is what you get: Experience ranking with deep neural
dataset-to-dataset similarity for topological localisation
- Title(参考訳): ご覧の通り: トポロジカルローカライズのためのdeep neural dataset-to-dataset similarityによるランキング
- Authors: Matthew Gadd, Benjamin Ramtoula, Daniele De Martini, Paul Newman
- Abstract要約: 本稿では,画像のデータセットを比較するための高度にスケーラブルなツールとして,最近開発されたVisual DNAを適用することを提案する。
ローカライゼーションの場合、パフォーマンスに影響を与える重要なデータセットの違いは、天気、照明、季節など、外観の変化のモードである。
これらの統計の相違は、過去の経験と同一の出現ギャップを用いたローカライズにおける性能と相関することがわかった。
- 参考スコア(独自算出の注目度): 19.000718685399935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recalling the most relevant visual memories for localisation or understanding
a priori the likely outcome of localisation effort against a particular visual
memory is useful for efficient and robust visual navigation. Solutions to this
problem should be divorced from performance appraisal against ground truth - as
this is not available at run-time - and should ideally be based on
generalisable environmental observations. For this, we propose applying the
recently developed Visual DNA as a highly scalable tool for comparing datasets
of images - in this work, sequences of map and live experiences. In the case of
localisation, important dataset differences impacting performance are modes of
appearance change, including weather, lighting, and season. Specifically, for
any deep architecture which is used for place recognition by matching feature
volumes at a particular layer, we use distribution measures to compare
neuron-wise activation statistics between live images and multiple previously
recorded past experiences, with a potentially large seasonal (winter/summer) or
time of day (day/night) shift. We find that differences in these statistics
correlate to performance when localising using a past experience with the same
appearance gap. We validate our approach over the Nordland cross-season dataset
as well as data from Oxford's University Parks with lighting and mild seasonal
change, showing excellent ability of our system to rank actual localisation
performance across candidate experiences.
- Abstract(参考訳): ローカライズや事前理解のために最も関連する視覚記憶を思い出すと、特定の視覚記憶に対するローカライズ努力の結果は効率的で堅牢な視覚ナビゲーションに有用である。
この問題に対する解決策は、実行時に利用できないため、根本的真実に対するパフォーマンス評価から分離されるべきであり、理想的には、一般的な環境観測に基づいているべきである。
そこで本研究では,画像のデータセットを高度にスケーラブルに比較するためのツールとして,最近開発されたビジュアルdnaを適用することを提案する。
ローカライゼーションの場合、パフォーマンスに影響を与える重要なデータセットの違いは、天気、照明、季節など、外観の変化のモードである。
具体的には、特定の層で特徴量とマッチングして場所認識に使用される任意の深層アーキテクチャにおいて、実際の画像と過去に記録された複数の過去の経験と、潜在的に大きな季節(冬/夏)または昼(昼/夜)シフトとのニューロン毎の活性化統計を比較するために分布尺度を用いる。
これらの統計値の違いは、同じ外観ギャップを持つ過去の経験を用いて局所化すると、パフォーマンスに相関することがわかった。
nordlandのクロスシーズンデータセットに対するアプローチと、オックスフォード大学の大学公園の光沢と穏やかな季節変化に関するデータを検証することで、システムの実際のローカライズパフォーマンスを候補者エクスペリエンス全体でランク付けする優れた能力を示しました。
関連論文リスト
- Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - Localization Is All You Evaluate: Data Leakage in Online Mapping Datasets and How to Fix It [2.1665407462280446]
State-of-the-artメソッドは主にnuScenesとArgoverse 2データセットを使用してトレーニングされている。
nuScenesの80ドル以上、Argoverse 2のバリデーションとテストサンプルの40ドル以上は、トレーニングサンプルから5ドル以下である。
本研究では,地理的に不連続なデータ分割を提案し,未知の環境における真の性能を明らかにする。
論文 参考訳(メタデータ) (2023-12-11T14:43:23Z) - Long-Term Invariant Local Features via Implicit Cross-Domain
Correspondences [79.21515035128832]
我々は、様々なドメイン変更の下で、現在の最先端特徴抽出ネットワークの性能を徹底的に分析する。
我々は、新しいデータ中心方式、Implicit Cross-Domain Correspondences (iCDC)を提案する。
iCDCは複数のニューラル・ラジアンス・フィールドで同じ環境を表し、それぞれが個々の視覚領域の下にシーンを適合させる。
論文 参考訳(メタデータ) (2023-11-06T18:53:01Z) - 4Seasons: Benchmarking Visual SLAM and Long-Term Localization for
Autonomous Driving in Challenging Conditions [54.59279160621111]
大規模4Seasonsデータセットに基づく課題条件下での自律運転のための新しい視覚的SLAMと長期局所化ベンチマークを提案する。
提案したベンチマークでは,季節変化や天候,照明条件の変動による劇的な外見の変化が報告されている。
本稿では,視覚計測,大域的位置認識,および地図に基づく視覚的位置決め性能を共同評価するための統合ベンチマークを提案する。
論文 参考訳(メタデータ) (2022-12-31T13:52:36Z) - Location-aware Adaptive Normalization: A Deep Learning Approach For
Wildfire Danger Forecasting [17.25189382307337]
本稿では、位置認識型適応正規化層(LOAN)を備えた2D/3D二分岐畳み込みニューラルネットワーク(CNN)を提案する。
LOANをビルディングブロックとして使用することにより、地理的な位置を条件に動的特徴を変調することができる。
その結果,位置対応型特徴正規化は動的変数と地理的位置の関係を学習する上で有望な手法であることが示唆された。
論文 参考訳(メタデータ) (2022-12-16T00:32:38Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - CrowdDriven: A New Challenging Dataset for Outdoor Visual Localization [44.97567243883994]
クラウドソースデータを用いた屋外シーンにおける視覚的位置推定のための新しいベンチマークを提案する。
私たちのデータセットは非常に困難で、評価されたすべてのメソッドが最も難しい部分で失敗していることが示されています。
データセットリリースの一部として、私たちはそれを生成するために使用されるツールを提供し、効率的で効果的な2D対応アノテーションを可能にします。
論文 参考訳(メタデータ) (2021-09-09T19:25:48Z) - Domain-invariant Similarity Activation Map Contrastive Learning for
Retrieval-based Long-term Visual Localization [30.203072945001136]
本研究では,多領域画像変換による領域不変特徴抽出のために,確率論的に一般アーキテクチャを定式化する。
そして、より精密な局所化のために、新しい勾配重み付き類似性活性化写像損失(Grad-SAM)を組み込んだ。
CMUSeasonsデータセットにおける提案手法の有効性を検証するために大規模な実験が行われた。
我々の性能は、最先端のイメージベースのローカライゼーションベースラインを中あるいは高精度で上回るか、あるいは上回る。
論文 参考訳(メタデータ) (2020-09-16T14:43:22Z) - Domain Adaptation of Learned Features for Visual Localization [60.6817896667435]
日時,天気,季節などの変化条件下での視覚的局所化の問題に対処する。
近年の深層ニューラルネットワークに基づく学習された局所的特徴は、古典的な手作りの局所的特徴よりも優れた性能を示している。
ドメインギャップを減らすために、いくつかの例しか必要としない、斬新で実践的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-21T05:17:32Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。