Fugu-MT 論文翻訳(概要): Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories

論文の概要: Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories

arxiv url: http://arxiv.org/abs/2412.05717v1
Date: Sat, 07 Dec 2024 18:29:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-10 23:11:43.983172
Title: Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories
Title（参考訳）: エキスパート軌道を省略したベクトル的シーン埋め込みからソフトドライブの制約を学習する
Authors: Niloufar Saeidi Mobarakeh, Behzad Khamidehi, Chunlin Li, Hamidreza Mirkhani, Fazel Arasteh, Mohammed Elmahgiubi, Weize Zhang, Kasra Rezaee, Pascal Poupart,
Abstract要約: 運動計画の第一の目的は、車両の安全で効率的な軌道を生成することである。伝統的に、運動計画モデルは、人間の専門家の行動を模倣するために模倣学習を用いて訓練される。本研究では,制約学習を模倣学習に統合する手法を提案する。
参考スコア（独自算出の注目度）: 16.666811573117613
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The primary goal of motion planning is to generate safe and efficient trajectories for vehicles. Traditionally, motion planning models are trained using imitation learning to mimic the behavior of human experts. However, these models often lack interpretability and fail to provide clear justifications for their decisions. We propose a method that integrates constraint learning into imitation learning by extracting driving constraints from expert trajectories. Our approach utilizes vectorized scene embeddings that capture critical spatial and temporal features, enabling the model to identify and generalize constraints across various driving scenarios. We formulate the constraint learning problem using a maximum entropy model, which scores the motion planner's trajectories based on their similarity to the expert trajectory. By separating the scoring process into distinct reward and constraint streams, we improve both the interpretability of the planner's behavior and its attention to relevant scene components. Unlike existing constraint learning methods that rely on simulators and are typically embedded in reinforcement learning (RL) or inverse reinforcement learning (IRL) frameworks, our method operates without simulators, making it applicable to a wider range of datasets and real-world scenarios. Experimental results on the InD and TrafficJams datasets demonstrate that incorporating driving constraints enhances model interpretability and improves closed-loop performance.
Abstract（参考訳）: 運動計画の第一の目的は、車両の安全で効率的な軌道を生成することである。伝統的に、運動計画モデルは、人間の専門家の行動を模倣するために模倣学習を用いて訓練される。しかしながら、これらのモデルは解釈可能性に欠けることが多く、その決定に対する明確な正当化を提供していない。本研究では,制約学習を模倣学習に統合する手法を提案する。提案手法では,重要な空間的特徴や時間的特徴を捉えたベクトル化されたシーン埋め込みを用いて,様々な運転シナリオの制約を特定し,一般化する。最大エントロピーモデルを用いて制約学習問題を定式化し、専門家の軌跡との類似性に基づいて運動プランナーの軌跡をスコアする。スコアリングプロセスを異なる報酬と制約ストリームに分離することにより、プランナーの振る舞いの解釈可能性と、関連するシーンコンポーネントへの注意の両方を改善します。シミュレータに頼って強化学習(RL)や逆強化学習(IRL)フレームワークに埋め込まれる既存の制約学習手法とは異なり,本手法はシミュレータなしで動作し,より広い範囲のデータセットや実世界のシナリオに適用できる。 InDおよびTrafficJamsデータセットの実験結果は、駆動制約を組み込むことでモデルの解釈性が向上し、クローズドループ性能が向上することを示している。

関連論文リスト

PILOT: Planning via Internalized Latent Optimization Trajectories for Large Language Models [51.43746425777865]
大規模言語モデル(LLM)は、しばしばグローバル戦略を定式化する能力に欠けており、長い水平タスクにおけるエラーの伝播につながる。 PILOTは,大規模モデルの戦略的監視を本質的な潜伏誘導に内部化するためのフレームワークである。
論文参考訳（メタデータ） (2026-01-07T12:38:56Z)
Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文参考訳（メタデータ） (2025-09-24T13:35:15Z)
Action-Constrained Imitation Learning [12.316546911223263]
行動制約下での政策学習は、様々なロボット制御や資源配分アプリケーションにおいて、安全な行動を保証する上で中心的な役割を果たす。本稿では,行動制約付き模倣者がより広い行動空間を持つ実証的専門家から学習することを目的とした,行動制約付き模倣学習(ACIL)と呼ばれる新たな課題について検討する。我々は、このミスマッチをテキストトラジェクトリアライメント(textittrajectory alignment)を通じて解決し、従来の専門家によるデモンストレーションを、アクション制約に固執しながら、同様の状態軌跡に従うサロゲートデータセットに置き換えるDTWILを提案する。
論文参考訳（メタデータ） (2025-08-20T03:19:07Z)
DRIVE: Dynamic Rule Inference and Verified Evaluation for Constraint-Aware Autonomous Driving [37.24058519921229]
本稿では,動的ルール推論と検証評価のための新しいフレームワークDRIVEを紹介する。 D DRIVEは、ソフト制約違反率0.0%、スムーズな軌道、様々な運転シナリオにおけるより強力な一般化を実現している。検証された評価は、現実世界のデプロイメントにおけるフレームワークの効率性、説明可能性、堅牢性をさらに示す。
論文参考訳（メタデータ） (2025-08-06T03:56:06Z)
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.07731497951963]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文参考訳（メタデータ） (2025-06-09T03:14:04Z)
RIFT: Group-Relative RL Fine-Tuning for Realistic and Controllable Traffic Simulation [13.319344167881383]
データ駆動シミュレーターにおいて、模擬学習事前学習を行う2段階のAV中心シミュレーションフレームワークを導入する。次に、物理に基づくシミュレータで微調整を学習し、スタイルレベルの制御性を向上する。微調整段階において,新しいグループ関連RL微調整戦略であるRIFTを提案する。
論文参考訳（メタデータ） (2025-05-06T09:12:37Z)
Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文参考訳（メタデータ） (2025-04-23T17:53:34Z)
Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [93.58897637077001]
本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文参考訳（メタデータ） (2025-03-11T13:50:22Z)
A Framework for Learning Scoring Rules in Autonomous Driving Planning Systems [2.4578723416255754]
FLoRAは、時間論理で表される解釈可能なスコアリングルールを学ぶフレームワークである。本手法は,学習データに肯定的な例しか含まれていないにもかかわらず,運転行動の評価を効果的に学習する。クローズドループ計画シミュレーションの評価は、学習したスコアリングルールが既存の手法より優れていることを示す。
論文参考訳（メタデータ） (2025-02-17T02:06:57Z)
Hybrid Machine Learning Model with a Constrained Action Space for Trajectory Prediction [44.99833362998488]
この研究は、ディープラーニングと運動モデルを組み合わせた新しいハイブリッドモデルを導入する。加速度やヨーレートなどのオブジェクト属性を予測し、それに基づいて軌道を生成することができる。
論文参考訳（メタデータ） (2025-01-07T10:06:59Z)
Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。 DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文参考訳（メタデータ） (2024-12-12T15:10:22Z)
End-to-end Driving in High-Interaction Traffic Scenarios with Reinforcement Learning [24.578178308010912]
これらの問題に対処するために,Ranmble というエンドツーエンドモデルベース RL アルゴリズムを提案する。環境のダイナミックスモデルを学ぶことで、Rambleは今後のトラフィックイベントを予測し、より情報に富んだ戦略的決定を下すことができる。 Rambleは、CARLA Leaderboard 2.0におけるルート完了率と運転スコアに関する最先端のパフォーマンスを達成し、複雑でダイナミックな交通状況を管理する上での有効性を示している。
論文参考訳（メタデータ） (2024-10-03T06:45:59Z)
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。 nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文参考訳（メタデータ） (2024-09-15T15:55:24Z)
Probing Multimodal LLMs as World Models for Driving [72.18727651074563]
自律運転におけるMLLM(Multimodal Large Language Models)の適用について検討する。 GPT-4oのようなモデルの開発は進んでいるが、複雑な運転環境における性能は未解明のままである。
論文参考訳（メタデータ） (2024-05-09T17:52:42Z)
TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3292387742640415]
本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文参考訳（メタデータ） (2024-04-18T23:12:46Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文参考訳（メタデータ） (2023-09-27T07:57:37Z)
Kinematics-aware Trajectory Generation and Prediction with Latent Stochastic Differential Modeling [12.338614299403305]
軌道生成と軌道予測は自動運転における重要な課題である。深層学習に基づく手法は、様々な交通シナリオを学習する上で、これらの2つのタスクに大きな可能性を示してきた。しかし、生成/予測された軌道が物理的に現実的であることを保証するためには、これらの手法が依然として難しい問題である。
論文参考訳（メタデータ） (2023-09-17T16:06:38Z)
DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文参考訳（メタデータ） (2023-09-09T04:40:01Z)
Distribution-aware Goal Prediction and Conformant Model-based Planning for Safe Autonomous Driving [16.654299927694716]
本研究では,学習から学習までのタスクを,障害物認識と接地,分布認識の目標予測,モデルベース計画として再構築する。 CARLAシミュレータでは,CARNOVELベンチマークの最先端結果を報告する。
論文参考訳（メタデータ） (2022-12-16T21:51:51Z)
How To Not Drive: Learning Driving Constraints from Demonstration [0.0]
本研究では,人間の運転軌跡から運動計画制約を学習するための新しい手法を提案する。行動計画は、交通規則に従うために要求される高いレベルの意思決定に責任を負う。運動プランナーの役割は、自動運転車が従うための実用的で安全な軌道を作り出すことである。
論文参考訳（メタデータ） (2021-10-01T20:47:04Z)
Congestion-aware Multi-agent Trajectory Prediction for Collision Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文参考訳（メタデータ） (2021-03-26T02:42:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。