論文の概要: MS-Net: A Multi-Path Sparse Model for Motion Prediction in Multi-Scenes
- arxiv url: http://arxiv.org/abs/2403.00353v1
- Date: Fri, 1 Mar 2024 08:32:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 17:57:12.017758
- Title: MS-Net: A Multi-Path Sparse Model for Motion Prediction in Multi-Scenes
- Title(参考訳): ms-net:マルチシーン動作予測のためのマルチパススパースモデル
- Authors: Xiaqiang Tang, Weigao Sun, Siyuan Hu, Yiyang Sun, Yafeng Guo
- Abstract要約: マルチシーンネットワーク(Multi-Scenes Network、別名MS-Net)は、進化過程によって訓練されたマルチパススパースモデルである。
MS-Netは、推論段階でパラメータのサブセットを選択的に活性化し、各シーンの予測結果を生成する。
実験の結果,MS-Netは既存の歩行者行動予測データセットの最先端手法よりも優れていた。
- 参考スコア(独自算出の注目度): 1.4451387915783602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The multi-modality and stochastic characteristics of human behavior make
motion prediction a highly challenging task, which is critical for autonomous
driving. While deep learning approaches have demonstrated their great potential
in this area, it still remains unsolved to establish a connection between
multiple driving scenes (e.g., merging, roundabout, intersection) and the
design of deep learning models. Current learning-based methods typically use
one unified model to predict trajectories in different scenarios, which may
result in sub-optimal results for one individual scene. To address this issue,
we propose Multi-Scenes Network (aka. MS-Net), which is a multi-path sparse
model trained by an evolutionary process. MS-Net selectively activates a subset
of its parameters during the inference stage to produce prediction results for
each scene. In the training stage, the motion prediction task under
differentiated scenes is abstracted as a multi-task learning problem, an
evolutionary algorithm is designed to encourage the network search of the
optimal parameters for each scene while sharing common knowledge between
different scenes. Our experiment results show that with substantially reduced
parameters, MS-Net outperforms existing state-of-the-art methods on
well-established pedestrian motion prediction datasets, e.g., ETH and UCY, and
ranks the 2nd place on the INTERACTION challenge.
- Abstract(参考訳): 人間の行動のマルチモーダル性や確率的特性は、自律運転に欠かせない動作予測を極めて困難にしている。
ディープラーニングアプローチはこの分野で大きな可能性を証明しているが、複数の駆動シーン(例えば、マージ、ラウンドアバウンド、交差点)とディープラーニングモデルの設計との接続を確立することは未だに未解決である。
現在の学習ベースの手法では、通常、1つの統一モデルを使用して異なるシナリオの軌跡を予測する。
この問題を解決するために,進化過程によって訓練されたマルチパススパースモデルであるMulti-Scenes Network(MS-Net)を提案する。
ms-netは推論段階でパラメータのサブセットを選択的に活性化し、各シーンの予測結果を生成する。
トレーニング段階では、異なるシーン間の共通知識を共有しながら、各シーンの最適パラメータのネットワーク探索を促進する進化的アルゴリズムを設計し、異なるシーンの動作予測タスクをマルチタスク学習問題として抽象化する。
実験の結果,MS-Netはパラメータを大幅に削減し,既存の歩行者行動予測データセット(例えばETHやUCY)の最先端手法よりも優れており,インターアクションチャレンジでは2位であることがわかった。
関連論文リスト
- Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.87010221355223]
マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。
提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文 参考訳(メタデータ) (2024-11-04T23:15:21Z) - Joint Depth Prediction and Semantic Segmentation with Multi-View SAM [59.99496827912684]
我々は,Segment Anything Model(SAM)のリッチなセマンティック特徴を利用した深度予測のためのマルチビューステレオ(MVS)手法を提案する。
この拡張深度予測は、Transformerベースのセマンティックセグメンテーションデコーダのプロンプトとして役立ちます。
論文 参考訳(メタデータ) (2023-10-31T20:15:40Z) - EUCLID: Towards Efficient Unsupervised Reinforcement Learning with
Multi-choice Dynamics Model [46.99510778097286]
教師なし強化学習(URL)は,タスクに依存しない環境で有用な行動を学ぶための,有望なパラダイムである。
本研究では,事前学習フェーズにおける動的モデルと教師なし探索ポリシーを協調的に事前学習するための,新しいモデル融合パラダイムを提案する。
本研究では,EUCLIDが高サンプリング効率で最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2022-10-02T12:11:44Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Pedestrian Behavior Prediction via Multitask Learning and Categorical
Interaction Modeling [13.936894582450734]
マルチモーダルデータに頼って歩行者の軌跡や行動を同時に予測するマルチタスク学習フレームワークを提案する。
本モデルでは, トラジェクティブと動作予測を最大22%, 6%向上させる。
論文 参考訳(メタデータ) (2020-12-06T15:57:11Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - MultiXNet: Multiclass Multistage Multimodal Motion Prediction [27.046311751308775]
MultiXNetはライダーセンサデータに基づく検出と動作予測のためのエンドツーエンドのアプローチである。
本手法は,複数の都市でSDV群が収集した大規模実世界のデータを用いて評価した。
論文 参考訳(メタデータ) (2020-06-03T01:01:48Z) - Multi-Task Learning for Dense Prediction Tasks: A Survey [87.66280582034838]
マルチタスク学習(MTL)技術は、性能、計算、メモリフットプリントに関する有望な結果を示している。
我々は、コンピュータビジョンにおけるMLLのための最先端のディープラーニングアプローチについて、よく理解された視点を提供する。
論文 参考訳(メタデータ) (2020-04-28T09:15:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。