論文の概要: Exploiting map information for self-supervised learning in motion
forecasting
- arxiv url: http://arxiv.org/abs/2210.04672v1
- Date: Mon, 10 Oct 2022 13:23:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 18:04:03.811878
- Title: Exploiting map information for self-supervised learning in motion
forecasting
- Title(参考訳): 運動予測における自己教師付き学習における地図情報の利用
- Authors: Caio Azevedo, Thomas Gilles, Stefano Sabatini, Dzmitry Tsishkou
- Abstract要約: マルチタスクと事前学習という2つのフレームワークを通じて,この補助タスクを適用します。
どちらのフレームワークでも、$mathrmminFDE_6$(最大20.3%)や$mathrmMissRate_6$(最大33.3%)といったメトリクスにおけるベースラインの大幅な改善を観察します。
また、新しい事前トレーニングされたモデルの結果をInteractionチャレンジに送信し、$mathrmminFDE_6$と$mathrmminADE_6$に関して$textit1st$placeを達成する。
- 参考スコア(独自算出の注目度): 0.5898893619901381
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inspired by recent developments regarding the application of self-supervised
learning (SSL), we devise an auxiliary task for trajectory prediction that
takes advantage of map-only information such as graph connectivity with the
intent of improving map comprehension and generalization. We apply this
auxiliary task through two frameworks - multitasking and pretraining. In either
framework we observe significant improvement of our baseline in metrics such as
$\mathrm{minFDE}_6$ (as much as 20.3%) and $\mathrm{MissRate}_6$ (as much as
33.3%), as well as a richer comprehension of map features demonstrated by
different training configurations. The results obtained were consistent in all
three data sets used for experiments: Argoverse, Interaction and NuScenes. We
also submit our new pretrained model's results to the Interaction challenge and
achieve $\textit{1st}$ place with respect to $\mathrm{minFDE}_6$ and
$\mathrm{minADE}_6$.
- Abstract(参考訳): 自己教師付き学習(SSL)の適用に関する最近の進展に触発されて,地図理解と一般化の改善を目的としたグラフ接続などの地図のみの情報を活用するトラジェクトリ予測補助タスクを考案した。
この補助タスクは、マルチタスクとプリトレーニングという2つのフレームワークを通じて適用します。
どちらのフレームワークでも、$\mathrm{minfde}_6$(最大20.3%)や$\mathrm{missrate}_6$(最大33.3%)といったメトリクスにおけるベースラインの大幅な改善と、異なるトレーニング構成で示されるマップ機能のより豊かな理解が観察されています。
得られた結果は、Argoverse、Interaction、NuScenesという3つのデータセットで一致していた。
また、新しい事前トレーニングされたモデルの結果をInteraction Challengeに送信し、$\mathrm{minFDE}_6$と$\mathrm{minADE}_6$に対して$\textit{1st}$placeを達成する。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - Localization Is All You Evaluate: Data Leakage in Online Mapping Datasets and How to Fix It [2.1665407462280446]
State-of-the-artメソッドは主にnuScenesとArgoverse 2データセットを使用してトレーニングされている。
nuScenesの80ドル以上、Argoverse 2のバリデーションとテストサンプルの40ドル以上は、トレーニングサンプルから5ドル以下である。
本研究では,地理的に不連続なデータ分割を提案し,未知の環境における真の性能を明らかにする。
論文 参考訳(メタデータ) (2023-12-11T14:43:23Z) - Towards Understanding Clean Generalization and Robust Overfitting in Adversarial Training [38.44734564565478]
対人訓練におけるtextitClean Generalization と Robust Overfitting 現象について検討した。
学習プロセス中に3段階の位相遷移が起こり,ネットワークは頑健な記憶体制に収束することを示す。
また,実画像認識実験による理論的解析を実証的に検証した。
論文 参考訳(メタデータ) (2023-06-02T05:07:42Z) - Multi-Level Contrastive Learning for Dense Prediction Task [59.591755258395594]
本稿では,高密度予測タスクのための領域レベルの特徴表現を効率よく学習するための,MCL(Multi-Level Contrastive Learning for Dense Prediction Task)を提案する。
本手法は, 局所化, スケールの整合性, 認識の3つの要因に動機付けられている。
提案手法は,様々なデータセットにおける最近の最先端の手法よりも有意なマージンを有する。
論文 参考訳(メタデータ) (2023-04-04T17:59:04Z) - Multi-Task Imitation Learning for Linear Dynamical Systems [50.124394757116605]
線形システム上での効率的な模倣学習のための表現学習について検討する。
学習対象ポリシーによって生成された軌道上の模倣ギャップは、$tildeOleft(frack n_xHN_mathrmshared + frack n_uN_mathrmtargetright)$で制限されている。
論文 参考訳(メタデータ) (2022-12-01T00:14:35Z) - S$^2$Contact: Graph-based Network for 3D Hand-Object Contact Estimation
with Semi-Supervised Learning [70.72037296392642]
モノクロ画像から接触を学習できる新しい半教師付きフレームワークを提案する。
具体的には、大規模データセットにおける視覚的および幾何学的整合性制約を利用して擬似ラベルを生成する。
より正確な再構築を行うために手動インタラクションを規定するコンタクトマップを使用することの利点を示す。
論文 参考訳(メタデータ) (2022-08-01T14:05:23Z) - Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by
Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。
このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。
各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文 参考訳(メタデータ) (2022-03-02T14:49:51Z) - Active Learning for Bayesian 3D Hand Pose Estimation [53.99104862192055]
本稿では3次元ポーズ推定のためのディープラーニングアーキテクチャに対するベイズ近似を提案する。
この枠組みを通じて、データや学習能力に影響される2種類の不確実性を調査し、分析する。
論文 参考訳(メタデータ) (2020-10-01T21:36:26Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。