論文の概要: LLM-Generated Fault Scenarios for Evaluating Perception-Driven Lane Following in Autonomous Edge Systems
- arxiv url: http://arxiv.org/abs/2604.07362v1
- Date: Wed, 01 Apr 2026 09:27:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.416068
- Title: LLM-Generated Fault Scenarios for Evaluating Perception-Driven Lane Following in Autonomous Edge Systems
- Title(参考訳): 自律エッジシステムにおける知覚駆動車線追従評価のためのLLM生成故障シナリオ
- Authors: Faezeh Pasandideh, Achim Rettberg,
- Abstract要約: 本稿では,エッジデバイス上での自律型視覚システムのためのオフラインオフライン障害注入フレームワークについて紹介する。
このアーキテクチャは検証プロセスを,計算集約的なオフラインフェーズと軽量オンラインフェーズという,2つの異なるフェーズに分割する。
我々は460の障害シナリオにわたるResNet18レーンフォローモデルでこのフレームワークを広範囲に検証した。
- 参考スコア(独自算出の注目度): 0.5046831208137847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying autonomous vision systems on edge devices faces a critical challenge: resource constraints prevent real-time and predictable execution of comprehensive safety tests. Existing validation methods depend on static datasets or manual fault injection, failing to capture the diverse environmental hazards encountered in real-world deployment. To address this, we introduce a decoupled offline-online fault injection framework. This architecture separates the validation process into two distinct phases: a computationally intensive Offline Phase and a lightweight Online Phase. In the offline phase, we employ Large Language Models (LLMs) to semantically generate structured fault scenarios and Latent Diffusion Models (LDMs) to synthesize high-fidelity sensor degradations. These complex fault dynamics are distilled into a pre-computed lookup table, enabling the edge device to perform real-time fault-aware inference without running heavy AI models locally. We extensively validated this framework on a ResNet18 lane-following model across 460 fault scenarios. Results show that while the model achieves a baseline R^2 of approximately 0.85 on clean data, our generated faults expose significant robustness degradation, with RMSE increasing by up to 99% and within-0.10 localization accuracy dropping to as low as 31.0% under fog conditions, demonstrating the inadequacy of normal-data evaluation for real-world edge AI deployment.
- Abstract(参考訳): エッジデバイスに自律的なビジョンシステムをデプロイすることは、重要な課題に直面している。リソース制約は、包括的な安全テストのリアルタイムかつ予測可能な実行を防止する。
既存のバリデーション手法は静的なデータセットや手動の障害注入に依存しており、実際のデプロイメントで発生する多様な環境リスクを捕捉できない。
これを解決するために、分離されたオフラインのフォールトインジェクションフレームワークを導入します。
このアーキテクチャは検証プロセスを,計算集約的なオフラインフェーズと軽量オンラインフェーズという,2つの異なるフェーズに分割する。
オフラインフェーズでは,大規模言語モデル(LLM)を用いて,構造的故障シナリオを意味的に生成し,遅延拡散モデル(LDM)を用いて高忠実度センサ劣化を合成する。
これらの複雑なフォールトダイナミクスは、事前に計算されたルックアップテーブルに蒸留されるため、エッジデバイスは、重いAIモデルをローカルに実行することなく、リアルタイムのフォールトアウェア推論を実行することができる。
我々は460の障害シナリオにわたるResNet18レーンフォローモデルでこのフレームワークを広範囲に検証した。
その結果, クリーンデータ上で約0.85のベースラインR^2を達成する一方で, 我々の生成した断層は, RMSEが最大99%増加し, 霧条件下では31.0%以内の局所化精度が低下し, 実世界のエッジAI展開における正規データ評価の不十分さが示された。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Cross-Scenario Deraining Adaptation with Unpaired Data: Superpixel Structural Priors and Multi-Stage Pseudo-Rain Synthesis [48.809049043865905]
低レベルのコンピュータビジョンでは,イメージデライン化が重要な役割を担っている。
ディープラーニングのパラダイムは、目に見えないアウト・オブ・ディストリビューションシナリオに一般化された場合、厳しいパフォーマンス劣化に悩まされることが多い。
本稿では,クロスシナリオ・デライニング適応フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-23T07:38:55Z) - Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment [1.5124107808802705]
本稿では,地下欠陥のエンドツーエンド要約のための新しい2段階パイプラインを提案する。
私たちの軽量なRAPID-SCANセグメンテーションモデルと、エッジコンピューティングプラットフォームにデプロイされた微調整されたビジョンランゲージモデルを組み合わせています。
この結果から,自動欠陥検出とインフラストラクチャ保守のための実用的な洞察とのギャップを埋めるために,エッジデプロイ可能な統合AIシステムの可能性が示唆された。
論文 参考訳(メタデータ) (2026-02-03T17:03:46Z) - SAVANT: Semantic Analysis with Vision-Augmented Anomaly deTection [6.806105013817923]
SAVANTは、異常運転シナリオの検出において高精度なリコールを実現する構造化推論フレームワークである。
9,640以上の実世界の画像を高精度にラベル付けすることで、SAVANTは異常検出における重要なデータ不足問題に対処する。
論文 参考訳(メタデータ) (2025-10-20T19:14:29Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning [2.918225266151982]
AVIATORはAIによる最初の脆弱性注入ワークフローである。
高忠実で多様な大規模な脆弱性データセット生成のために、現実的でカテゴリ固有の脆弱性を自動的に注入する。
セマンティック分析、LoRAベースのファインチューニングとRetrieval-Augmented Generationで強化されたインジェクション合成、静的解析とLLMベースの識別器によるインジェクション後の検証を組み合わせる。
論文 参考訳(メタデータ) (2025-08-28T14:59:39Z) - Offline Robotic World Model: Learning Robotic Policies without a Physics Simulator [50.191655141020505]
強化学習(Reinforcement Learning, RL)は、ロボット制御において目覚ましい能力を示してきたが、高いサンプルの複雑さ、安全性の懸念、そしてシム・トゥ・リアルのギャップのため、依然として困難である。
物理シミュレータに頼らずに政策学習を改善するために不確実性を明示的に推定するモデルベースアプローチであるオフラインロボット世界モデル(RWM-O)を導入する。
論文 参考訳(メタデータ) (2025-04-23T12:58:15Z) - Resilience of Vision Transformers for Domain Generalisation in the Presence of Out-of-Distribution Noisy Images [2.2124795371148616]
マスク付き画像モデリング(MIM)で事前訓練した視覚トラスフォーマーを,OODベンチマークと比較した。
実験では、BEITの既知の堅牢性を実証し、PACSでは94%、Office-Homeでは87%の精度を維持した。
これらの洞察は、実験室で訓練されたモデルと、不確実性の下で確実に一般化するAIシステムを構築するための青写真を提供する現実世界のデプロイメントのギャップを埋めるものだ。
論文 参考訳(メタデータ) (2025-04-05T16:25:34Z) - DeepFT: Fault-Tolerant Edge Computing using a Self-Supervised Deep
Surrogate Model [12.335763358698564]
本稿では,システム過負荷とその悪影響を積極的に回避するためにDeepFTを提案する。
DeepFTは、システム内の障害を正確に予測し、診断するために、ディープサロゲートモデルを使用している。
モデルのサイズが1ユニットあたりわずか3~1%のスケールで、アクティブなタスクやホストの数が増えるため、非常にスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2022-12-02T16:51:58Z) - Fast and Accurate Error Simulation for CNNs against Soft Errors [64.54260986994163]
本稿では,誤りシミュレーションエンジンを用いて,コナールニューラルネットワーク(CNN)の信頼性解析のためのフレームワークを提案する。
これらの誤差モデルは、故障によって誘導されるCNN演算子の出力の破損パターンに基づいて定義される。
提案手法は,SASSIFIの欠陥効果の約99%の精度と,限定的なエラーモデルのみを実装した44倍から63倍までのスピードアップを実現する。
論文 参考訳(メタデータ) (2022-06-04T19:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。