論文の概要: CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2511.13297v1
- Date: Mon, 17 Nov 2025 12:21:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.204316
- Title: CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving
- Title(参考訳): CorrectAD: 自動運転におけるエンドツーエンド計画改善のための自己修正エージェントシステム
- Authors: Enhui Ma, Lijun Zhou, Tao Tang, Jiahuan Zhang, Junpeng Jiang, Zhan Zhang, Dong Han, Kun Zhan, Xueyang Zhang, XianPeng Lang, Haiyang Sun, Xia Zhou, Di Lin, Kaicheng Yu,
- Abstract要約: 我々はPM-Agentを導入し、データ要求を定式化し、障害ケースと同様のデータを集める。
次に、データ収集とアノテーションの両方をシミュレートできる生成モデルを使用します。
そこで本研究では,PM-Agentが要求する3Dアノテーションに沿った一貫したビデオを生成するDriveSoraを提案する。
これらのコンポーネントを自己修正エージェントであるSystem CorrectADに統合します。
- 参考スコア(独自算出の注目度): 32.564440450582346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end planning methods are the de facto standard of the current autonomous driving system, while the robustness of the data-driven approaches suffers due to the notorious long-tail problem (i.e., rare but safety-critical failure cases). In this work, we explore whether recent diffusion-based video generation methods (a.k.a. world models), paired with structured 3D layouts, can enable a fully automated pipeline to self-correct such failure cases. We first introduce an agent to simulate the role of product manager, dubbed PM-Agent, which formulates data requirements to collect data similar to the failure cases. Then, we use a generative model that can simulate both data collection and annotation. However, existing generative models struggle to generate high-fidelity data conditioned on 3D layouts. To address this, we propose DriveSora, which can generate spatiotemporally consistent videos aligned with the 3D annotations requested by PM-Agent. We integrate these components into our self-correcting agentic system, CorrectAD. Importantly, our pipeline is an end-to-end model-agnostic and can be applied to improve any end-to-end planner. Evaluated on both nuScenes and a more challenging in-house dataset across multiple end-to-end planners, CorrectAD corrects 62.5% and 49.8% of failure cases, reducing collision rates by 39% and 27%, respectively.
- Abstract(参考訳): エンドツーエンドの計画手法は、現在の自動運転システムのデファクトスタンダードであり、一方、データ駆動方式の堅牢性は、悪名高いロングテール問題(まれだが安全に重要な障害)に悩まされている。
本研究では,近年の拡散型ビデオ生成手法(つまり世界モデル)と構造化3次元レイアウトの組み合わせにより,完全自動パイプラインによる自動故障事例の自己修正が可能かどうかを考察する。
まず、PM-Agentと呼ばれるプロダクトマネージャの役割をシミュレートするエージェントを紹介します。
そして、データ収集とアノテーションの両方をシミュレートできる生成モデルを使用する。
しかし、既存の生成モデルは、3次元レイアウトで条件付けられた高忠実度データを生成するのに苦労している。
そこで本研究では,PM-Agentが要求する3Dアノテーションに沿った時空間的に一貫したビデオを生成するDriveSoraを提案する。
これらのコンポーネントを自己修正エージェントシステムであるCorrectADに統合します。
重要なことは、パイプラインはエンドツーエンドのモデルに依存しず、エンドツーエンドのプランナを改善するために適用できます。
nuSceneと、複数のエンドツーエンドプランナにまたがるより困難な社内データセットに基づいて評価されたCorrectADは、障害ケースの62.5%と49.8%を修正し、それぞれ39%と27%の衝突率を削減している。
関連論文リスト
- Adaptive Data Flywheel: Applying MAPE Control Loops to AI Agent Improvement [8.230420096371407]
我々は、NVIDIAのMixture-of-Experts (MoE) Knowledge AssistantであるNVInfo AIにおけるデータフライホイールの実践的な実装について述べる。
我々は、検索強化世代(RAG)パイプラインの障害に対処し、継続的な学習を可能にするクローズドループシステムを構築した。
ルーティングでは、Llama 3.1Bモデルを微調整8Bモデルに置き換え、96%の精度、モデルサイズ10倍の削減、70%のレイテンシ改善を実現した。
論文 参考訳(メタデータ) (2025-10-30T23:41:06Z) - A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.1526688475023]
現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文 参考訳(メタデータ) (2025-10-27T17:54:07Z) - Real-time Accident Anticipation for Autonomous Driving Through Monocular Depth-Enhanced 3D Modeling [18.071748815365005]
我々は、現在のSOTA(State-of-the-art)2Dベースの手法を超えて予測能力を著しく向上させる革新的なフレームワークであるAccNetを導入する。
本稿では,交通事故データセットにおけるスキュードデータ分散の課題に対処するため,早期予測のためのバイナリ適応損失(BA-LEA)を提案する。
論文 参考訳(メタデータ) (2024-09-02T13:46:25Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Confidence Attention and Generalization Enhanced Distillation for
Continuous Video Domain Adaptation [62.458968086881555]
連続ビデオドメイン適応(CVDA、Continuous Video Domain Adaptation)は、ソースモデルが個々の変更対象ドメインに適応する必要があるシナリオである。
CVDAの課題に対処するため,遺伝子組み換え型自己知識解離(CART)を用いた信頼性保証ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-18T16:40:10Z) - DeepFT: Fault-Tolerant Edge Computing using a Self-Supervised Deep
Surrogate Model [12.335763358698564]
本稿では,システム過負荷とその悪影響を積極的に回避するためにDeepFTを提案する。
DeepFTは、システム内の障害を正確に予測し、診断するために、ディープサロゲートモデルを使用している。
モデルのサイズが1ユニットあたりわずか3~1%のスケールで、アクティブなタスクやホストの数が増えるため、非常にスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2022-12-02T16:51:58Z) - Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。
代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文 参考訳(メタデータ) (2022-07-07T17:14:10Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。