論文の概要: METDrive: Multi-modal End-to-end Autonomous Driving with Temporal Guidance
- arxiv url: http://arxiv.org/abs/2409.12667v1
- Date: Thu, 19 Sep 2024 11:27:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 13:56:59.088647
- Title: METDrive: Multi-modal End-to-end Autonomous Driving with Temporal Guidance
- Title(参考訳): METDrive: 一時誘導型マルチモーダルエンドツーエンド自動運転
- Authors: Ziang Guo, Xinhao Lin, Zakhar Yagudin, Artem Lykov, Yong Wang, Yanqiang Li, Dzmitry Tsetserukou,
- Abstract要約: 我々は,ego状態の組込み時系列特徴から時間的ガイダンスを利用する,エンド・ツー・エンドのMETDriveを紹介する。
CARLAリーダボードのLongest6ベンチマークでMETDriveを評価し,運転スコア70%,経路完了スコア94%,屈折スコア0.78を達成した。
- 参考スコア(独自算出の注目度): 5.059262206188673
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-modal end-to-end autonomous driving has shown promising advancements in recent work. By embedding more modalities into end-to-end networks, the system's understanding of both static and dynamic aspects of the driving environment is enhanced, thereby improving the safety of autonomous driving. In this paper, we introduce METDrive, an end-to-end system that leverages temporal guidance from the embedded time series features of ego states, including rotation angles, steering, throttle signals, and waypoint vectors. The geometric features derived from perception sensor data and the time series features of ego state data jointly guide the waypoint prediction with the proposed temporal guidance loss function. We evaluated METDrive on the CARLA leaderboard's Longest6 benchmark, achieving a driving score of 70%, a route completion score of 94%, and an infraction score of 0.78.
- Abstract(参考訳): マルチモーダルなエンドツーエンド自動運転は、最近の研究で有望な進歩を見せている。
エンド・ツー・エンド・ネットワークにより多くのモダリティを組み込むことで、運転環境の静的および動的側面の理解が向上し、自動運転の安全性が向上する。
本稿では, 回転角, ステアリング, スロットル信号, ウェイポイントベクトルを含む, エゴ状態の組込み時系列特徴から時間的ガイダンスを利用する, エンドツーエンドシステムMETDriveを紹介する。
知覚センサデータとエゴ状態データの時系列特徴から得られる幾何学的特徴は、提案した時間的誘導損失関数と共に経路ポイント予測を共同で導く。
CARLAリーダボードのLongest6ベンチマークでMETDriveを評価し,運転スコア70%,経路完了スコア94%,屈折スコア0.78を達成した。
関連論文リスト
- Enhancing End-to-End Autonomous Driving with Latent World Model [78.22157677787239]
コストのかかるラベルを必要とせずにエンドツーエンドの運転を改善するための,新しい自己管理手法を提案する。
フレームワーク textbfLAW は LAtent World モデルを用いて,予測エゴアクションと現在のフレームの潜在機能に基づいて,今後の潜在機能を予測する。
その結果,オープンループベンチマークとクローズループベンチマークの両方において,コストのかかるアノテーションを使わずに最先端のパフォーマンスを実現することができた。
論文 参考訳(メタデータ) (2024-06-12T17:59:21Z) - DriveCoT: Integrating Chain-of-Thought Reasoning with End-to-End Driving [81.04174379726251]
本稿では,DriveCoTというエンド・ツー・エンドの運転データセットを総合的に収集する。
センサーデータ、制御決定、および推論プロセスを示すチェーン・オブ・シークレット・ラベルが含まれている。
我々は,私たちのデータセットに基づいてトレーニングされたDriveCoT-Agentと呼ばれるベースラインモデルを提案し,連鎖予測と最終決定を生成する。
論文 参考訳(メタデータ) (2024-03-25T17:59:01Z) - G-MEMP: Gaze-Enhanced Multimodal Ego-Motion Prediction in Driving [71.9040410238973]
我々は、視線データを用いて、運転者の車両のエゴ軌道を推定することに集中する。
次に、GPSとビデオ入力と視線データを組み合わせた新しいマルチモーダルエゴ軌道予測ネットワークであるG-MEMPを開発する。
その結果,G-MEMPは両ベンチマークにおいて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - What Matters to Enhance Traffic Rule Compliance of Imitation Learning for End-to-End Autonomous Driving [10.191916541924813]
そこで我々は,P-CSGを提案する。P-CSG,P-CSG,P-CSG,P-CSG,P-CSG,P-CSG,P-CSG。
本稿では,赤信号,停止標識,曲率速度ペナルティという3つの罰則を導入し,エージェントが交通規則に敏感になるようにした。
FGSMやDot攻撃などの敵攻撃に対するロバストネス評価を行ったところ,他のベースラインモデルと比較してロバストネスが著しく増加した。
論文 参考訳(メタデータ) (2023-09-14T15:54:56Z) - End-to-end Autonomous Driving: Challenges and Frontiers [45.391430626264764]
エンドツーエンドの自動運転におけるモチベーション、ロードマップ、方法論、課題、今後のトレンドについて、270以上の論文を包括的に分析する。
マルチモダリティ、解釈可能性、因果的混乱、堅牢性、世界モデルなど、いくつかの重要な課題を掘り下げます。
基礎モデルと視覚前訓練の現在の進歩と、これらの技術をエンドツーエンドの駆動フレームワークに組み込む方法について論じる。
論文 参考訳(メタデータ) (2023-06-29T14:17:24Z) - Exploring Contextual Representation and Multi-Modality for End-to-End
Autonomous Driving [58.879758550901364]
最近の知覚システムは、センサー融合による空間理解を高めるが、しばしば完全な環境コンテキストを欠いている。
我々は,3台のカメラを統合し,人間の視野をエミュレートするフレームワークを導入し,トップダウンのバードアイビューセマンティックデータと組み合わせて文脈表現を強化する。
提案手法は, オープンループ設定において0.67mの変位誤差を達成し, nuScenesデータセットでは6.9%の精度で現在の手法を上回っている。
論文 参考訳(メタデータ) (2022-10-13T05:56:20Z) - Fully End-to-end Autonomous Driving with Semantic Depth Cloud Mapping
and Multi-Agent [2.512827436728378]
本稿では,エンド・ツー・エンドとマルチタスクの学習方法を用いて学習した新しいディープラーニングモデルを提案する。
このモデルは,CARLAシミュレータ上で,現実の環境を模倣するために,通常の状況と異なる天候のシナリオを用いて評価する。
論文 参考訳(メタデータ) (2022-04-12T03:57:01Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - IntentNet: Learning to Predict Intention from Raw Sensor Data [86.74403297781039]
本論文では,LiDARセンサが生成する3次元点群と,環境の動的なマップの両方を利用するワンステージ検出器と予測器を開発した。
当社のマルチタスクモデルは、それぞれの別々のモジュールよりも高い精度を実現し、計算を節約します。
論文 参考訳(メタデータ) (2021-01-20T00:31:52Z) - Multi-lane Detection Using Instance Segmentation and Attentive Voting [0.0]
本稿では,精度と速度の両面で技術手法の状態を上回り,マルチレーン検出のための新しい手法を提案する。
54.53 fps(平均)で走行する車線分割精度99.87%を得ることができる。
論文 参考訳(メタデータ) (2020-01-01T16:48:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。