論文の概要: Self-Supervised Domain Mismatch Estimation for Autonomous Perception
- arxiv url: http://arxiv.org/abs/2006.08613v1
- Date: Mon, 15 Jun 2020 09:22:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 04:36:14.758105
- Title: Self-Supervised Domain Mismatch Estimation for Autonomous Perception
- Title(参考訳): 自律認識のための自己監督型ドメインミスマッチ推定
- Authors: Jonas L\"ohdefink, Justin Fehrling, Marvin Klingner, Fabian H\"uger,
Peter Schlicht, Nico M. Schmidt, Tim Fingscheidt
- Abstract要約: 本稿では,自己教師型で訓練されたオートエンコーダを,監視対象のセマンティックセグメンテーションと同じトレーニングデータに基づいて提案する。
オンライン推論におけるオートエンコーダのイメージ再構成性能(PSNR)は,すでに高い予測力を示す。
DM測度が機能範囲内の意味的セグメンテーションと強いランク順序相関を持つことを実験により示すことができる。
- 参考スコア(独自算出の注目度): 34.87508643573168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous driving requires self awareness of its perception functions.
Technically spoken, this can be realized by observers, which monitor the
performance indicators of various perception modules. In this work we choose,
exemplarily, a semantic segmentation to be monitored, and propose an
autoencoder, trained in a self-supervised fashion on the very same training
data as the semantic segmentation to be monitored. While the autoencoder's
image reconstruction performance (PSNR) during online inference shows already a
good predictive power w.r.t. semantic segmentation performance, we propose a
novel domain mismatch metric DM as the earth mover's distance between a
pre-stored PSNR distribution on training (source) data, and an online-acquired
PSNR distribution on any inference (target) data. We are able to show by
experiments that the DM metric has a strong rank order correlation with the
semantic segmentation within its functional scope. We also propose a training
domain-dependent threshold for the DM metric to define this functional scope.
- Abstract(参考訳): 自律運転は認知機能の自己認識を必要とする。
技術的に言えば、様々な知覚モジュールのパフォーマンス指標を監視するオブザーバによって実現可能である。
本研究では、例えば、監視対象のセマンティックセグメンテーションを選択し、監視対象のセマンティックセグメンテーションと全く同じトレーニングデータに基づいて自己教師付きでトレーニングされたオートエンコーダを提案する。
オンライン推論における自動エンコーダの画像再構成性能(PSNR)は, セマンティックセマンティックセグメンテーション性能においてすでに優れた予測力を示しているが, トレーニング(ソース)データ上の事前記憶PSNR分布と任意の推論(ターゲット)データ上のオンライン取得PSNR分布との間の地球移動量として, 新たなドメインミスマッチ距離DMを提案する。
DM測度が機能範囲内の意味的セグメンテーションと強いランク順序相関を持つことを実験により示すことができる。
また、DMメトリックに対して、この機能範囲を定義するためのトレーニングドメイン依存しきい値を提案する。
関連論文リスト
- Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax [73.03684002513218]
我々はDeep InfoMax(DIM)を拡張し、学習した表現を選択された事前分布に自動マッチングできるようにする。
このような修正により、一様かつ通常に分散した表現を学習できることを示す。
その結果,下流作業における性能とDMの品質の中間的なトレードオフが示唆された。
論文 参考訳(メタデータ) (2024-10-09T15:40:04Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Masked Momentum Contrastive Learning for Zero-shot Semantic
Understanding [39.424931953675994]
自己教師付き事前学習(SSP)は、ラベル付きデータなしで有意義な特徴表現を抽出できる機械学習の一般的な手法として登場した。
本研究は、コンピュータビジョンタスクにおける純粋な自己教師付き学習(SSL)技術の有効性を評価する。
論文 参考訳(メタデータ) (2023-08-22T13:55:57Z) - Manifold-Aware Self-Training for Unsupervised Domain Adaptation on
Regressing 6D Object Pose [69.14556386954325]
視覚的回帰における合成データと実データとのドメインギャップは,グローバルな特徴アライメントと局所的な改善によって橋渡しされる。
提案手法は明示的な自己教師付き多様体正規化を取り入れ,領域間の一貫した累積的対象依存性を明らかにする。
暗黙的ニューラルファンクションを学習して、最も近いクラスビンへの相対的な方向と目標の距離を推定し、ターゲット分類予測を洗練することを目的としている。
論文 参考訳(メタデータ) (2023-05-18T08:42:41Z) - IDA: Informed Domain Adaptive Semantic Segmentation [51.12107564372869]
クラスレベルのセグメンテーション性能に基づいてデータを混合する自己学習フレームワークであるDomain Informed Adaptation (IDA) モデルを提案する。
IDAモデルでは、クラスレベルの性能を期待信頼スコア(ECS)によって追跡し、動的スケジュールを用いて異なる領域のデータに対する混合比を決定する。
提案手法は,GTA-Vの都市景観への適応において1.1 mIoU,SynTHIAの都市への適応において0.9 mIoUのマージンで,最先端のUDA-SS法よりも優れる。
論文 参考訳(メタデータ) (2023-03-05T18:16:34Z) - Self-supervised Pre-training for Semantic Segmentation in an Indoor
Scene [8.357801312689622]
本稿ではセグメンテーションモデルの自己教師型事前学習手法であるRegConsistを提案する。
我々は,対象環境におけるRGBビューからのセマンティックセグメンテーションを予測するために,コントラスト学習の変種を用いてDCNNモデルを訓練する。
提案手法は、ImageNetで事前訓練されたモデルよりも優れており、全く同じタスクでトレーニングされたモデルと異なるデータセットでトレーニングされたモデルを使用する場合の競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-04T20:10:14Z) - Prior Knowledge-Guided Attention in Self-Supervised Vision Transformers [79.60022233109397]
本研究では、未ラベル画像データセットにおける一貫した空間的・意味的構造を利用するフレームワークである空間的事前注意(SPAN)を提案する。
SPANは、アテンションマスクを別個のトランスフォーマーヘッドから正規化し、セマンティック領域の様々な先導に従う。
その結果,アテンションマスクは,ドメインに依存しない事前学習から得られるマスクよりも解釈可能であることが判明した。
論文 参考訳(メタデータ) (2022-09-07T02:30:36Z) - Unsupervised Speech Representation Learning for Behavior Modeling using
Triplet Enhanced Contextualized Networks [28.957236790411585]
本研究では,対話における人間の行動の定常的特性を利用して,音声から行動情報を抽出する表現学習手法を提案する。
本稿では,エンコーダ・デコーダをベースとしたDeep Contextualized Network (DCN) と,動作コンテキストをキャプチャするTriplet-Enhanced DCN (TE-DCN) フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-01T22:44:23Z) - Unsupervised Domain Adaptation with Multiple Domain Discriminators and
Adaptive Self-Training [22.366638308792734]
Unsupervised Domain Adaptation (UDA)は、ソースドメインでトレーニングされたモデルの一般化能力を改善し、ラベル付きデータが使用できないターゲットドメインでうまく機能することを目的としている。
本稿では、合成データに基づいて訓練されたディープニューラルネットワークを、2つの異なるデータ分布間のドメインシフトに対処する実シーンに適用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-27T11:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。