論文の概要: Reasoning About Traversability: Language-Guided Off-Road 3D Trajectory Planning
- arxiv url: http://arxiv.org/abs/2604.21249v1
- Date: Thu, 23 Apr 2026 03:26:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.280864
- Title: Reasoning About Traversability: Language-Guided Off-Road 3D Trajectory Planning
- Title(参考訳): トラバーサビリティに関する推論:言語ガイドによるオフロード3次元軌道計画
- Authors: Byounggun Park, Soonmin Hwang,
- Abstract要約: VLM(Vision-Language Models)は、エンドツーエンドの自動運転のための高度なセマンティック推論を可能にする。
既存のオフロードデータセットは、車両の動作や地形と弱い整合性を持つ言語アノテーションに悩まされている。
本稿では,アノテーションをアクション整合ペアに再構成する言語改良フレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.6983657949644717
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While Vision-Language Models (VLMs) enable high-level semantic reasoning for end-to-end autonomous driving, particularly in unstructured environments, existing off-road datasets suffer from language annotations that are weakly aligned with vehicle actions and terrain geometry. To address this misalignment, we propose a language refinement framework that restructures annotations into action-aligned pairs, enabling a VLM to generate refined scene descriptions and 3D future trajectories directly from a single image. To further encourage terrain-aware planning, we introduce a preference optimization strategy that constructs geometry-aware hard negatives and explicitly penalizes trajectories inconsistent with local elevation profiles. Furthermore, we propose off-road-specific metrics to quantify traversability compliance and elevation consistency, addressing the limitations of conventional on-road evaluation. Experiments on the ORAD-3D benchmark demonstrate that our approach reduces average trajectory error from 1.01m to 0.97m, improves traversability compliance from 0.621 to 0.644, and decreases elevation inconsistency from 0.428 to 0.322, highlighting the efficacy of action-aligned supervision and terrain-aware optimization for robust off-road driving.
- Abstract(参考訳): VLM(Vision-Language Models)は、特に非構造環境において、エンドツーエンドの自動運転のための高レベルなセマンティック推論を可能にする一方で、既存のオフロードデータセットは、車両の動作や地形に弱い整合性を持つ言語アノテーションに悩まされている。
そこで本研究では,アノテーションをアクション整合ペアに再構成する言語改良フレームワークを提案する。これにより,VLMは1つの画像から直接,洗練されたシーン記述と3次元将来の軌跡を生成できる。
地形対応計画をさらに促進するため,地形対応のハードネガティブを構築し,局地的標高プロファイルと矛盾しない軌道を明示的にペナルティ化する優先最適化戦略を導入する。
さらに、従来のオンロード評価の限界に対処するため、トラバーサビリティコンプライアンスと高架整合性を定量化するオフロード特化指標を提案する。
ORAD-3Dベンチマークを用いた実験により,提案手法は平均軌道誤差を1.01mから0.97mに低減し,トラバーサビリティコンプライアンスを0.621から0.644に改善し,高度不整合を0.428から0.322に低減し,ロバストオフロード駆動における行動整合性制御と地形認識最適化の有効性を強調した。
関連論文リスト
- Spatially-Aware Adaptive Trajectory Optimization with Controller-Guided Feedback for Autonomous Racing [74.83272587893508]
本稿では,NURBSに基づく軌道表現,CMA-ESグローバル軌道最適化,コントローラ誘導空間フィードバックを組み合わせた自律レースライン最適化フレームワークを提案する。
シミュレーションでは,最大静的加速度をパラメータ化したコントローラと比較して17.38%のラップタイム短縮を実現している。
高摩擦から低摩擦まで様々なタイヤ化合物で試験された実ハードウェアでは、摩擦を明示的にパラメータ化することなく、7.60%のラップタイムの改善が得られる。
論文 参考訳(メタデータ) (2026-02-17T15:10:44Z) - A Vision-Language-Action Model with Visual Prompt for OFF-Road Autonomous Driving [14.778856339414455]
オフロード地形における効率的な軌道計画は、自動運転車にとって非常に困難な課題である。
本稿では,空間認識の不十分さと不安定な推論を克服する,新しいエンドツーエンドマルチモーダルフレームワークOF-EMMAを提案する。
RELLIS-3Dオフロードデータセットの実験結果から、OF-EMMAは既存の手法よりもかなり優れていることが示された。
論文 参考訳(メタデータ) (2026-01-07T02:08:18Z) - Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail [85.47497935739936]
Alpamayo-R1 (AR1) は、因果推論の連鎖と軌道計画を統合する視覚言語モデルである。
また,AR1は,軌道のみのベースラインに比べて,難問の計画精度が12%向上することを示した。
今後のアップデートで、AR1モデルとCoCのサブセットをリリースする予定です。
論文 参考訳(メタデータ) (2025-10-30T01:25:34Z) - Boundary-Guided Trajectory Prediction for Road Aware and Physically Feasible Autonomous Driving [11.436186697804835]
本稿では,軌道予測を許容駆動方向とその境界によって導かれる制約付き回帰として定式化する新しい枠組みを提案する。
我々は,HPTRベースラインに対するArgoverse-2データセットに対するアプローチを評価する。
論文 参考訳(メタデータ) (2025-05-10T19:21:00Z) - 3DTTNet: Multimodal Fusion-Based 3D Traversable Terrain Modeling for Off-Road Environments [10.521569910467072]
オフロード環境は、自動運転車にとって重要な課題である。
本稿では,セマンティックシーンの完了によって,横断可能な領域認識を実現する。
3DTTNetと呼ばれる新しいマルチモーダル手法が提案されている。
論文 参考訳(メタデータ) (2024-12-11T08:36:36Z) - A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses [68.68514648185828]
軌道予測は、自動運転車における計画の安全性と効率に不可欠である。
現在のモデルでは、複雑な交通規則と潜在的な車両の動きを完全に捉えることができないことが多い。
本研究は, オフロード損失, 方向整合誤差, ダイバーシティ損失の3つの新しい損失関数を紹介する。
論文 参考訳(メタデータ) (2024-11-29T14:47:08Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.84996994779443]
本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。
我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。
挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2024-07-08T12:52:46Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - Integrating Higher-Order Dynamics and Roadway-Compliance into
Constrained ILQR-based Trajectory Planning for Autonomous Vehicles [3.200238632208686]
軌道計画は、自動運転車のグローバルな最適ルートを作成することを目的としている。
既存の自転車キネマティックモデルを用いた実装では、制御可能な軌道は保証できない。
このモデルを、曲率と長手ジャークの1階および2階微分を含む高階項で拡張する。
論文 参考訳(メタデータ) (2023-09-25T22:30:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。