論文の概要: SCOUT: A Lightweight Framework for Scenario Coverage Assessment in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2510.24949v1
- Date: Tue, 28 Oct 2025 20:31:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.782766
- Title: SCOUT: A Lightweight Framework for Scenario Coverage Assessment in Autonomous Driving
- Title(参考訳): SCOUT: 自動運転におけるシナリオカバレッジアセスメントのための軽量フレームワーク
- Authors: Anil Yildiz, Sarah M. Thornton, Carl Hildebrandt, Sreeja Roy-Singh, Mykel J. Kochenderfer,
- Abstract要約: SCOUTはエージェントの潜在センサー表現から直接シナリオカバレッジラベルを予測するために設計されたサロゲートモデルである。
SCOUTは冗長な計算を避け、高速でスケーラブルなシナリオカバレッジ推定を可能にする。
その結果,SCOUTは大規模カバレッジ分析に有効な代替手段であることがわかった。
- 参考スコア(独自算出の注目度): 21.55306402455096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Assessing scenario coverage is crucial for evaluating the robustness of autonomous agents, yet existing methods rely on expensive human annotations or computationally intensive Large Vision-Language Models (LVLMs). These approaches are impractical for large-scale deployment due to cost and efficiency constraints. To address these shortcomings, we propose SCOUT (Scenario Coverage Oversight and Understanding Tool), a lightweight surrogate model designed to predict scenario coverage labels directly from an agent's latent sensor representations. SCOUT is trained through a distillation process, learning to approximate LVLM-generated coverage labels while eliminating the need for continuous LVLM inference or human annotation. By leveraging precomputed perception features, SCOUT avoids redundant computations and enables fast, scalable scenario coverage estimation. We evaluate our method across a large dataset of real-life autonomous navigation scenarios, demonstrating that it maintains high accuracy while significantly reducing computational cost. Our results show that SCOUT provides an effective and practical alternative for large-scale coverage analysis. While its performance depends on the quality of LVLM-generated training labels, SCOUT represents a major step toward efficient scenario coverage oversight in autonomous systems.
- Abstract(参考訳): シナリオカバレッジを評価することは自律エージェントの堅牢性を評価する上で重要であるが、既存の手法は高価な人間のアノテーションや計算集約的なLVLM(Large Vision-Language Models)に依存している。
これらのアプローチは、コストと効率の制約のため、大規模なデプロイメントには実用的ではない。
これらの欠点に対処するため,エージェントの潜在センサ表現から直接シナリオカバレッジラベルを予測する軽量サロゲートモデルであるSCOUT(Scenario Coverage Oversight and Understanding Tool)を提案する。
SCOUTは蒸留プロセスを通じて訓練され、連続的なLVLM推論や人間のアノテーションの必要性を排除しつつ、LVLMの生成するカバレッジラベルを近似することを学ぶ。
事前計算された知覚機能を活用することで、SCOUTは冗長な計算を回避し、高速でスケーラブルなシナリオカバレッジ推定を可能にする。
提案手法を実生活における自律ナビゲーションシナリオの大規模データセットにわたって評価し,高い精度を維持しつつ,計算コストを大幅に削減できることを実証した。
その結果,SCOUTは大規模カバレッジ分析に有効な代替手段であることがわかった。
その性能はLVLM生成トレーニングラベルの品質に依存するが、SCOUTは自律システムにおける効率的なシナリオカバレッジ監視に向けた大きな一歩である。
関連論文リスト
- Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models [7.802379200026965]
認識状態の複雑さに基づいてVLA実行を動的にルーティングする適応型フレームワークを提案する。
我々のアプローチは、VLAの視覚言語バックボーンを、パラメトリックおよび非パラメトリック推定器のアンサンブルに潜伏埋め込みを投影することにより、アクティブな検出ツールに変換する。
論文 参考訳(メタデータ) (2026-03-05T13:14:41Z) - Streaming Real-Time Trajectory Prediction Using Endpoint-Aware Modeling [54.94692733670454]
近隣の交通機関の将来の軌道は、自動運転車の経路計画と意思決定に大きな影響を与えている。
本稿では,軽量かつ高精度なストリーミングベース軌道予測手法を提案する。
当社のアプローチは推論遅延を大幅に低減し、現実のデプロイメントに適しています。
論文 参考訳(メタデータ) (2026-03-02T13:44:23Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - Improving Zero-shot ADL Recognition with Large Language Models through Event-based Context and Confidence [1.2599533416395765]
スマートホームにおける日常生活活動のセンサベース認識は、医療、安全、エネルギー管理などのアプリケーションをサポートする。
近年,Large Language Models (LLMs) に基づくゼロショット法では,ラベル付きADLセンサデータへの依存を取り除く利点がある。
本稿では,イベントベースセグメンテーションによるゼロショットADL認識の改善と,予測信頼度を推定するための新しい手法を提案する。
論文 参考訳(メタデータ) (2026-01-13T05:58:24Z) - Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach [78.4812458793128]
動作チャンクの高忠実度検証に軽量な擬数推定器を適用したテスト時間スケーリングフレームワークである textbfTACO を提案する。
我々の手法は、オフライン強化学習(RL)における古典的な反探索原理に似ており、勾配のないため、計算上の大きな恩恵をもたらす。
論文 参考訳(メタデータ) (2025-12-02T14:42:54Z) - Stabilizing Policy Gradients for Sample-Efficient Reinforcement Learning in LLM Reasoning [77.92320830700797]
強化学習は、大規模言語モデルの推論機能を実現する上で中心的な役割を果たしてきた。
本稿では,ポリシー更新時の曲率情報を追跡し,活用するトラクタブルな計算フレームワークを提案する。
アルゴリズムであるCurvature-Aware Policy Optimization (CAPO)は、不安定な更新に寄与するサンプルを特定し、それらをマスクアウトする。
論文 参考訳(メタデータ) (2025-10-01T12:29:32Z) - Efficient Uncertainty Estimation for LLM-based Entity Linking in Tabular Data [0.3593955557310285]
トークンレベルの特徴量を用いて単発出力から不確実性を推定するための自己教師型アプローチについて検討する。
得られた不確実性推定は,低精度出力の検出に極めて有効であることを示す。
これは計算コストのごく一部で達成され、不確実性対策をEntity Linkingに費用対効果で統合するのをサポートする。
論文 参考訳(メタデータ) (2025-09-24T10:44:16Z) - Beyond Naïve Prompting: Strategies for Improved Zero-shot Context-aided Forecasting with LLMs [57.82819770709032]
大規模言語モデル (LLM) は、na "ive direct prompting" を通じて効果的な文脈支援予測を行うことができる。
ReDPは、明確な推論トレースを抽出することで、解釈可能性を改善し、コンテキスト上でモデルの推論を評価することができる。
CorDPはLLMを活用して、既存の予測をコンテキストで洗練し、現実の予測パイプラインにおける適用性を高める。
IC-DPは、文脈支援予測タスクの歴史的例を即時に組み込むことを提案し、大規模モデルにおいても精度を大幅に向上させる。
論文 参考訳(メタデータ) (2025-08-13T16:02:55Z) - AGENTS-LLM: Augmentative GENeration of Challenging Traffic Scenarios with an Agentic LLM Framework [29.10278896946722]
本稿では,自然言語記述を用いた実世界の交通シナリオを拡張するためのLLM-agentベースのフレームワークを提案する。
重要な革新はエージェント設計を使用することで、出力のきめ細かい制御を可能にすることである。
論文 参考訳(メタデータ) (2025-07-18T08:20:16Z) - DARS: Dynamic Action Re-Sampling to Enhance Coding Agent Performance by Adaptive Tree Traversal [55.13854171147104]
大規模言語モデル(LLM)は、自然言語処理、データ分析、ソフトウェア開発など、さまざまな領域に革命をもたらした。
符号化エージェントのための新しい推論時間計算スケーリングアプローチである動的アクション再サンプリング(DARS)を提案する。
我々は、SWE-Bench Liteベンチマークに対する我々のアプローチを評価し、このスケーリング戦略がClude 3.5 Sonnet V2で55%のパス@kスコアを達成したことを実証した。
論文 参考訳(メタデータ) (2025-03-18T14:02:59Z) - Cost-Aware Query Policies in Active Learning for Efficient Autonomous Robotic Exploration [0.0]
本稿では,動作コストを考慮しつつ,ガウス過程回帰のためのALアルゴリズムを解析する。
距離制約を持つ伝統的な不確実性計量は、軌道距離上のルート平均二乗誤差を最小化する。
論文 参考訳(メタデータ) (2024-10-31T18:35:03Z) - Sample Complexity of Offline Distributionally Robust Linear Markov Decision Processes [37.15580574143281]
オフライン強化学習(RL)
本稿では、オフラインデータを用いた全変動距離を特徴とする不確実性を伴う分布安定線形マルコフ決定過程(MDP)のサンプル複雑性について考察する。
我々は悲観的なモデルに基づくアルゴリズムを開発し、最小限のデータカバレッジ仮定の下でそのサンプルの複雑さを確立する。
論文 参考訳(メタデータ) (2024-03-19T17:48:42Z) - Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Learning Uncertainty For Safety-Oriented Semantic Segmentation In
Autonomous Driving [77.39239190539871]
自律運転における安全クリティカル画像セグメンテーションを実現するために、不確実性推定をどのように活用できるかを示す。
相似性関数によって測定された不一致予測に基づく新しい不確実性尺度を導入する。
本研究では,提案手法が競合手法よりも推論時間において計算集約性が低いことを示す。
論文 参考訳(メタデータ) (2021-05-28T09:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。