論文の概要: TrajMoE: Scene-Adaptive Trajectory Planning with Mixture of Experts and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.07135v1
- Date: Mon, 08 Dec 2025 03:40:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.700259
- Title: TrajMoE: Scene-Adaptive Trajectory Planning with Mixture of Experts and Reinforcement Learning
- Title(参考訳): TrajMoE: エキスパートと強化学習の混在によるシーン適応型軌道計画
- Authors: Zebin Xing, Pengxuan Yang, Linbo Wang, Yichen Zhang, Yiming Hu, Yupeng Zheng, Junli Wang, Yinfeng Gao, Guang Li, Kun Ma, Long Chen, Zhongpu Xia, Qichao Zhang, Hangjun Ye, Dongbin Zhao,
- Abstract要約: 現在の自律運転システムは、画像のようなセンサー入力を受け取り、ニューラルネットワークを介して軌跡空間にマッピングすることを学ぶエンドツーエンドのフレームワークを好んでいることが多い。
従来の研究は、モデルに軌道の事前分布を与えると、より良い計画性能が得られることを示した。
- 参考スコア(独自算出の注目度): 24.158051656957166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current autonomous driving systems often favor end-to-end frameworks, which take sensor inputs like images and learn to map them into trajectory space via neural networks. Previous work has demonstrated that models can achieve better planning performance when provided with a prior distribution of possible trajectories. However, these approaches often overlook two critical aspects: 1) The appropriate trajectory prior can vary significantly across different driving scenarios. 2) Their trajectory evaluation mechanism lacks policy-driven refinement, remaining constrained by the limitations of one-stage supervised training. To address these issues, we explore improvements in two key areas. For problem 1, we employ MoE to apply different trajectory priors tailored to different scenarios. For problem 2, we utilize Reinforcement Learning to fine-tune the trajectory scoring mechanism. Additionally, we integrate models with different perception backbones to enhance perceptual features. Our integrated model achieved a score of 51.08 on the navsim ICCV benchmark, securing third place.
- Abstract(参考訳): 現在の自律運転システムは、画像のようなセンサー入力を受け取り、ニューラルネットワークを介して軌跡空間にマッピングすることを学ぶエンドツーエンドのフレームワークを好んでいることが多い。
従来の研究は、モデルに軌道の事前分布を与えると、より良い計画性能が得られることを示した。
しかし、これらのアプローチはしばしば2つの重要な側面を見落としている。
1) 適切な軌跡は, 運転シナリオによって大きく異なる。
2) 軌道評価機構は, 1段階指導訓練の限界に拘束され, 政策主導の洗練が欠如している。
これらの問題に対処するために,2つの重要な領域の改善について検討する。
問題1では、異なるシナリオに合わせて異なる軌道先例を適用するためにMoEを使用します。
問題2では、強化学習を用いて軌道スコアリング機構を微調整する。
さらに、知覚的特徴を高めるために、異なる知覚的バックボーンを持つモデルを統合する。
統合モデルは,navsim ICCVベンチマークで51.08のスコアを達成し,第3位となった。
関連論文リスト
- End-to-end Deep Reinforcement Learning for Stochastic Multi-objective Optimization in C-VRPTW [15.392818864851654]
本研究は,本質性と複数の目的を特徴とする車両変種を解決するためのルーティングにおける学習ベースの応用について考察する。
我々は、特に旅行時間の不確実性について検討し、また、作業効率とシフト長の労働規制を共同で目標とする、総走行時間とルートメースパンという2つの目的についても検討する。
本稿では,本モデルの真面目性と多目的性を同時に扱うモデルを提案する。
論文 参考訳(メタデータ) (2025-12-01T10:43:27Z) - Detect Anything via Next Point Prediction [51.55967987350882]
Rex-Omniは最先端の物体認識性能を実現する3BスケールのMLLMである。
COCOやLVISのようなベンチマークでは、Rex-Omniは回帰ベースのモデルに匹敵するパフォーマンスを得る。
論文 参考訳(メタデータ) (2025-10-14T17:59:54Z) - Fully Unified Motion Planning for End-to-End Autonomous Driving [14.45403574889677]
現在のエンドツーエンドの自動運転方法は、単一のエゴ車から収集された専門家の計画データからのみ学習する。
あらゆる運転シナリオにおいて、他の車両からの複数の高品質な軌道は、特定のエゴ車両の軌道と共存する。
本稿では,新しい2段階軌道生成フレームワークFUMPを提案する。
論文 参考訳(メタデータ) (2025-04-17T05:52:35Z) - StreamMOTP: Streaming and Unified Framework for Joint 3D Multi-Object Tracking and Trajectory Prediction [22.29257945966914]
我々は3次元多目的追跡・軌道予測(StreamMOTP)のためのストリーミング統合フレームワークを提案する。
ストリーミング方式でモデルを構築し、メモリバンクを利用して、追跡対象の長期潜伏機能をより効果的に保存し、活用する。
また,予測トラジェクタの品質と一貫性を2ストリーム予測器で改善する。
論文 参考訳(メタデータ) (2024-06-28T11:35:35Z) - CCF: Cross Correcting Framework for Pedestrian Trajectory Prediction [7.9449756510822915]
歩行者軌道の表現をより良く学習するためのクロスコレクション・フレームワーク(CCF)を提案する。
CCFは、時間的損失と軌道的予測損失の両方で訓練された2つの予測モデルで構成されている。
トランスをベースとしたエンコーダ・デコーダ・アーキテクチャを用いて歩行者間の動きや社会的相互作用を捉える。
論文 参考訳(メタデータ) (2024-06-02T14:07:13Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。
本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文 参考訳(メタデータ) (2022-04-28T07:37:21Z) - Adaptive Trajectory Prediction via Transferable GNN [74.09424229172781]
本稿では,トランジタブルグラフニューラルネットワーク(Transferable Graph Neural Network, T-GNN)フレームワークを提案する。
具体的には、ドメイン固有知識が減少する構造運動知識を探索するために、ドメイン不変GNNを提案する。
さらに,注目に基づく適応的知識学習モジュールを提案し,知識伝達のための詳細な個別レベルの特徴表現について検討した。
論文 参考訳(メタデータ) (2022-03-09T21:08:47Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。