論文の概要: STEP: Structured Training and Evaluation Platform for benchmarking trajectory prediction models
- arxiv url: http://arxiv.org/abs/2509.14801v1
- Date: Thu, 18 Sep 2025 09:56:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.156969
- Title: STEP: Structured Training and Evaluation Platform for benchmarking trajectory prediction models
- Title(参考訳): STEP:軌道予測モデルのベンチマークのための構造化トレーニングと評価プラットフォーム
- Authors: Julian F. Schumann, Anna Mészáros, Jens Kober, Arkady Zgonnikov,
- Abstract要約: 複数のデータセットに統一されたインターフェースを提供することで制限に対処する新しいベンチマークフレームワークであるSTEPを紹介します。
筆者らは,1)広く利用されている試験手順の限界,2) 相互作用予測のためのエージェントの協調モデリングの重要性,3) 分散シフトおよび敵エージェントによる標的攻撃に対する現在の最先端モデルの脆弱性を明らかにする実験でSTEPの能力を実証した。
- 参考スコア(独自算出の注目度): 7.927039780654076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While trajectory prediction plays a critical role in enabling safe and effective path-planning in automated vehicles, standardized practices for evaluating such models remain underdeveloped. Recent efforts have aimed to unify dataset formats and model interfaces for easier comparisons, yet existing frameworks often fall short in supporting heterogeneous traffic scenarios, joint prediction models, or user documentation. In this work, we introduce STEP -- a new benchmarking framework that addresses these limitations by providing a unified interface for multiple datasets, enforcing consistent training and evaluation conditions, and supporting a wide range of prediction models. We demonstrate the capabilities of STEP in a number of experiments which reveal 1) the limitations of widely-used testing procedures, 2) the importance of joint modeling of agents for better predictions of interactions, and 3) the vulnerability of current state-of-the-art models against both distribution shifts and targeted attacks by adversarial agents. With STEP, we aim to shift the focus from the ``leaderboard'' approach to deeper insights about model behavior and generalization in complex multi-agent settings.
- Abstract(参考訳): 軌道予測は、自動運転車の安全かつ効果的な経路計画を可能にする上で重要な役割を担っているが、そのようなモデルを評価するための標準化されたプラクティスは未開発のままである。
最近の取り組みは、比較を容易にするためにデータセットフォーマットとモデルインターフェースを統合することを目的としているが、既存のフレームワークは、異種トラフィックシナリオ、共同予測モデル、ユーザドキュメントのサポートに不足していることが多い。
本稿では,複数のデータセットの統一インターフェースを提供し,一貫したトレーニングと評価条件を適用し,幅広い予測モデルをサポートすることによって,これらの制約に対処する新しいベンチマークフレームワークSTEPを紹介する。
多数の実験においてSTEPの能力を実証する。
1) 広く使用されている試験方法の限界
2【相互作用予測の精度向上のためのエージェントの協調モデリングの重要性】
3) 敵エージェントによる分散シフトと標的攻撃に対する現在の最先端モデルの脆弱性。
STEPでは、「リーダーボード」アプローチから、複雑なマルチエージェント設定におけるモデル行動と一般化に関する深い洞察へと焦点を移すことを目標としている。
関連論文リスト
- A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文 参考訳(メタデータ) (2024-11-20T20:38:56Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - PerturBench: Benchmarking Machine Learning Models for Cellular Perturbation Analysis [14.298235969992877]
単一細胞における摂動応答モデリングのための包括的フレームワークを提案する。
私たちのアプローチには、モジュラーでユーザフレンドリなモデル開発と評価プラットフォームが含まれています。
モード崩壊など、広く使われているモデルの限界を強調します。
論文 参考訳(メタデータ) (2024-08-20T07:40:20Z) - Enhanced Prediction of Multi-Agent Trajectories via Control Inference and State-Space Dynamics [14.694200929205975]
本稿では,状態空間動的システムモデリングに基づく軌道予測の新しい手法を提案する。
動的システムにおける状態推定の精度を高めるために,制御変数に対する新しいモデリング手法を提案する。
提案手法は,グラフニューラルネットワークと状態空間モデルを統合し,マルチエージェント相互作用の複雑さを効果的に捉える。
論文 参考訳(メタデータ) (2024-08-08T08:33:02Z) - Predictive Churn with the Set of Good Models [61.00058053669447]
本稿では,予測的不整合という2つの無関係な概念の関連性について考察する。
予測多重性(英: predictive multiplicity)は、個々のサンプルに対して矛盾する予測を生成するモデルである。
2つ目の概念である予測チャーン(英: predictive churn)は、モデル更新前後の個々の予測の違いを調べるものである。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。
提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文 参考訳(メタデータ) (2022-07-11T21:17:41Z) - LatentFormer: Multi-Agent Transformer-Based Interaction Modeling and
Trajectory Prediction [12.84508682310717]
将来の車両軌道予測のためのトランスフォーマーモデルであるLatentFormerを提案する。
提案手法をnuScenesベンチマークデータセット上で評価し,提案手法が最先端性能を実現し,トラジェクトリ指標を最大40%向上することを示す。
論文 参考訳(メタデータ) (2022-03-03T17:44:58Z) - Collaborative Uncertainty in Multi-Agent Trajectory Forecasting [35.013892666040846]
本稿では,対話モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、将来の軌跡とそれに対応する不確実性を学ぶための予測モデルを構築するための一般的なCUベースのフレームワークを構築した。
いずれの場合も、2つの合成データセットと2つの大規模軌跡予測ベンチマークについて広範な実験を行う。
論文 参考訳(メタデータ) (2021-10-26T18:27:22Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。