論文の概要: Self-Supervised Representation Learning from Temporal Ordering of
Automated Driving Sequences
- arxiv url: http://arxiv.org/abs/2302.09043v1
- Date: Fri, 17 Feb 2023 18:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-20 13:48:18.826522
- Title: Self-Supervised Representation Learning from Temporal Ordering of
Automated Driving Sequences
- Title(参考訳): 自動走行系列の時間順序からの自己教師あり表現学習
- Authors: Christopher Lang, Alexander Braun, Lars Schillingmann, Karsten Haug,
Abhinav Valada
- Abstract要約: 本研究では、認識タスクのための地域レベルの特徴表現を事前学習するための時間順述前文タスクであるTempOを提案する。
それぞれのフレームを、インスタンスレベルの知覚アーキテクチャにおいて自然な、順序のない特徴ベクトルのセットで埋め込む。
変換器をベースとしたマルチフレームアーキテクチャにおいて,特徴ベクトルの集合間の類似性を比較することで,逐次順序付け予測を定式化する。
- 参考スコア(独自算出の注目度): 64.95619174577966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised feature learning enables perception systems to benefit from
the vast amount of raw data being recorded by vehicle fleets all over the
world. However, their potential to learn dense representations from sequential
data has been relatively unexplored. In this work, we propose TempO, a temporal
ordering pretext task for pre-training region-level feature representations for
perception tasks. We embed each frame by an unordered set of proposal feature
vectors, a representation that is natural for instance-level perception
architectures, and formulate the sequential ordering prediction by comparing
similarities between sets of feature vectors in a transformer-based multi-frame
architecture. Extensive evaluation in automated driving domains on the BDD100K
and MOT17 datasets shows that our TempO approach outperforms existing
self-supervised single-frame pre-training methods as well as supervised
transfer learning initialization strategies on standard object detection and
multi-object tracking benchmarks.
- Abstract(参考訳): 自己監督型特徴学習により、知覚システムは世界中の車両が記録する膨大な量の生データから恩恵を受けることができる。
しかし、逐次データから密接な表現を学ぶ可能性は比較的未解明である。
本研究では,認識タスクのための領域レベルの特徴表現を事前学習するための時間順述文タスクであるTempOを提案する。
我々は,各フレームを,インスタンスレベルの知覚アーキテクチャに固有な表現である不順序特徴ベクトルの集合で埋め込んで,特徴ベクトルの集合間の類似性を比較することで,逐次順序予測を定式化する。
bdd100kおよびmot17データセットにおける自動駆動ドメインの広範な評価により、当社のtempoアプローチは、標準オブジェクト検出およびマルチオブジェクトトラッキングベンチマークにおける転送学習初期化戦略だけでなく、既存の自己教師付きシングルフレーム事前学習手法よりも優れています。
関連論文リスト
- Learning a Neural Association Network for Self-supervised Multi-Object Tracking [34.07776597698471]
本稿では,多目的追跡のためのデータアソシエーションを自己管理的に学習するための新しいフレームワークを提案する。
実世界のシナリオでは、オブジェクトの動きが通常マルコフプロセスで表現できるという事実により、我々は、トラッキングのための検出を関連付けるためにニューラルネットワークをトレーニングする新しい期待(EM)アルゴリズムを提案する。
我々は,挑戦的なMOT17とMOT20データセットに対するアプローチを評価し,自己教師付きトラッカーと比較して最先端の結果を得る。
論文 参考訳(メタデータ) (2024-11-18T12:22:29Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Self-Supervised Multi-Object Tracking For Autonomous Driving From
Consistency Across Timescales [53.55369862746357]
自己管理型マルチオブジェクトトラッカーは、生のドメイン固有データから学習できるという大きな可能性を秘めている。
しかし、その再識別精度は、監督対象よりも低い。
本稿では,複数の連続フレームから再同定特徴を自己教師付きで学習できる学習目標を提案する。
論文 参考訳(メタデータ) (2023-04-25T20:47:29Z) - Towards Sequence-Level Training for Visual Tracking [60.95799261482857]
本研究は、強化学習に基づく視覚追跡のためのシーケンスレベルのトレーニング戦略を導入する。
4つの代表的な追跡モデル、SiamRPN++、SiamAttn、TransT、TrDiMPは、提案手法をトレーニングに取り入れることで一貫して改善されている。
論文 参考訳(メタデータ) (2022-08-11T13:15:36Z) - Hierarchically Self-Supervised Transformer for Human Skeleton
Representation Learning [45.13060970066485]
階層型トランスフォーマーベーススケルトンシーケンスエンコーダ(Hi-TRS)に組み込まれた自己教師型階層型事前学習方式を提案する。
教師付き評価プロトコルと半教師付き評価プロトコルの両方で,本手法は最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-20T04:21:05Z) - SeCo: Exploring Sequence Supervision for Unsupervised Representation
Learning [114.58986229852489]
本稿では,空間的,シーケンシャル,時間的観点から,シーケンスの基本的および汎用的な監視について検討する。
私たちはContrastive Learning(SeCo)という特定の形式を導き出します。
SeCoは、アクション認識、未トリムアクティビティ認識、オブジェクト追跡に関する線形プロトコルにおいて、優れた結果を示す。
論文 参考訳(メタデータ) (2020-08-03T15:51:35Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。