Fugu-MT 論文翻訳(概要): Evaluating Decision Optimality of Autonomous Driving via Metamorphic Testing

論文の概要: Evaluating Decision Optimality of Autonomous Driving via Metamorphic Testing

arxiv url: http://arxiv.org/abs/2402.18393v1
Date: Wed, 28 Feb 2024 15:13:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-29 14:37:00.197337
Title: Evaluating Decision Optimality of Autonomous Driving via Metamorphic Testing
Title（参考訳）: 変成試験による自律運転の意思決定最適性の評価
Authors: Mingfei Cheng, Yuan Zhou, Xiaofei Xie, Junjie Wang, Guozhu Meng, Kairui Yang
Abstract要約: 自律運転システム(ADS)の意思決定品質の評価に焦点をあてる。非最適決定シナリオ(NoDS)を検出するための最初の方法を提案する。我々は,NoDSを効率的に生成するための新しいフレームワークであるDecictorを開発した。
参考スコア（独自算出の注目度）: 27.79913561898762
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Autonomous Driving System (ADS) testing is crucial in ADS development, with the current primary focus being on safety. However, the evaluation of non-safety-critical performance, particularly the ADS's ability to make optimal decisions and produce optimal paths for autonomous vehicles (AVs), is equally vital to ensure the intelligence and reduce risks of AVs. Currently, there is little work dedicated to assessing ADSs' optimal decision-making performance due to the lack of corresponding oracles and the difficulty in generating scenarios with non-optimal decisions. In this paper, we focus on evaluating the decision-making quality of an ADS and propose the first method for detecting non-optimal decision scenarios (NoDSs), where the ADS does not compute optimal paths for AVs. Firstly, to deal with the oracle problem, we propose a novel metamorphic relation (MR) aimed at exposing violations of optimal decisions. The MR identifies the property that the ADS should retain optimal decisions when the optimal path remains unaffected by non-invasive changes. Subsequently, we develop a new framework, Decictor, designed to generate NoDSs efficiently. Decictor comprises three main components: Non-invasive Mutation, MR Check, and Feedback. The Non-invasive Mutation ensures that the original optimal path in the mutated scenarios is not affected, while the MR Check is responsible for determining whether non-optimal decisions are made. To enhance the effectiveness of identifying NoDSs, we design a feedback metric that combines both spatial and temporal aspects of the AV's movement. We evaluate Decictor on Baidu Apollo, an open-source and production-grade ADS. The experimental results validate the effectiveness of Decictor in detecting non-optimal decisions of ADSs. Our work provides valuable and original insights into evaluating the non-safety-critical performance of ADSs.
Abstract（参考訳）: 自動運転システム(ads)テストは、広告開発において不可欠であり、現在の主な焦点は安全性である。しかしながら、安全でない性能の評価、特にADSが最適な判断を下し、自動運転車(AV)の最適経路を創出する能力は、AIVのインテリジェンスを確保し、リスクを減らすために等しく不可欠である。現在、対応するオラクルの欠如や、最適でない決定を伴うシナリオを生成するのに困難があるため、ADSの最適意思決定性能を評価する作業はほとんど行われていない。本稿では,ADSの意思決定品質を評価することに集中し,ADSがAVの最適経路を計算しない非最適決定シナリオ(NoDS)を検出するための最初の方法を提案する。まず, オラクル問題に対処するために, 最適決定の違反を明らかにすることを目的とした新しいメタモルフィック関係(MR)を提案する。 MRは、非侵襲的な変化によって最適な経路が影響を受けない場合、ADSが最適決定を維持すべきであるという特性を特定する。その後,nodsを効率的に生成するための新しいフレームワークdecictorを開発した。 decictorは、非侵襲突然変異、mrチェック、フィードバックの3つの主成分からなる。非侵襲的変異は、変異したシナリオにおける元の最適経路が影響を受けないことを保証するが、mrチェックは非最適決定が行われるかどうかを決定する責任がある。 nodssを識別する効果を高めるために,av動作の空間的側面と時間的側面の両方を組み合わせたフィードバックメトリックを設計する。我々は、オープンソースおよびプロダクショングレードのADSであるBaidu Apollo上でDecictorを評価する。その結果, ADSの非最適判定におけるDecictorの有効性が検証された。我々の研究は、ADSの非安全クリティカルな性能を評価する上で、価値ある独自の洞察を提供する。

関連論文リスト

ADReFT: Adaptive Decision Repair for Safe Autonomous Driving via Reinforcement Fine-Tuning [22.803044962152878]
自律運転システムに対する適応決定修復(ADreFT)を提案する。 ADReFTは、失敗するテストからのオフライン学習を通じて安全クリティカルな状態を識別し、適切な緩和アクションを生成する。評価結果から,ADReFTによる補修性能の向上が示唆された。
論文参考訳（メタデータ） (2025-06-30T15:29:36Z)
Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文参考訳（メタデータ） (2025-06-07T02:24:44Z)
Efficient Test-time Adaptive Object Detection via Sensitivity-Guided Pruning [73.40364018029673]
連続的なテスト時間適応オブジェクト検出(CTTA-OD)は、源となる事前訓練された検出器を常に変化する環境にオンライン適応させることを目的としている。私たちのモチベーションは、学習したすべての特徴が有益であるとは限らないという観察に起因しています。 FLOPの計算オーバヘッドを12%削減し,優れた適応性を実現する。
論文参考訳（メタデータ） (2025-06-03T05:27:56Z)
Token-Importance Guided Direct Preference Optimization [2.230951739798399]
本研究では,大規模言語モデルが人間の嗜好に沿った出力を生成することを保証するため,TI-DPO(Token-Importance Guided Direct Preference Optimization)を提案する。実験の結果,TI-DPOは高い精度とより強力な生成多様性を達成し,より安定かつ計算効率の良い解を提供することがわかった。
論文参考訳（メタデータ） (2025-05-26T08:11:24Z)
Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
Uncertainty-Penalized Direct Preference Optimization [52.387088396044206]
我々は、優先不確実性ペナル化スキームを導入し、DPOの悲観的な枠組みを開発する。ペナル化は、不確実なサンプルの損失勾配を減衰させる損失の補正として機能する。我々は,バニラDPOと比較して全体的な性能が向上し,高い不確実性選択/拒絶反応によるプロンプトの完成度も向上した。
論文参考訳（メタデータ） (2024-10-26T14:24:37Z)
Evaluating the Robustness of LiDAR-based 3D Obstacles Detection and Its Impacts on Autonomous Driving Systems [4.530172587010801]
我々は,LiDARセンサの組込み不正確さがLiDAR-3D障害物検出モデルに与える影響について検討した。 5つの古典的LiDAR-3D障害物検出モデルのロバスト性評価にETを適用した。点クラウドデータの微妙な変化さえも、検出性能の非自明な低下をもたらす可能性がある。
論文参考訳（メタデータ） (2024-08-24T19:10:07Z)
Improving Explainable Object-induced Model through Uncertainty for Automated Vehicles [13.514721609660521]
最近の説明可能な自動車両(AV)は、動作の説明を提供しながら、固有の不確実性に関連する重要な情報を無視している。本研究は、意思決定の場面におけるオブジェクトの役割を優先する「対象誘導型」モデルアプローチに基づく。また、不確実性によって導かれる先進的なトレーニング戦略についても検討する。
論文参考訳（メタデータ） (2024-02-23T19:14:57Z)
Safety Assessment of Vehicle Characteristics Variations in Autonomous Driving Systems [8.978712831628068]
本稿では,車載運転システム(ADS)の安全性に影響を与える車両特性設定の最小値を求める手法を提案する。 ADSを2台採用し,運転シミュレータを2台使用した。
論文参考訳（メタデータ） (2023-11-24T13:13:29Z)
A Counterfactual Safety Margin Perspective on the Scoring of Autonomous Vehicles' Riskiness [52.27309191283943]
本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文参考訳（メタデータ） (2023-08-02T09:48:08Z)
Integrated Sensing, Computation, and Communication for UAV-assisted Federated Edge Learning [52.7230652428711]
フェデレーションエッジ学習(FEEL)は、エッジデバイスとサーバ間の定期的な通信を通じて、プライバシ保護モデルトレーニングを可能にする。無人航空機(UAV)搭載エッジデバイスは、効率的なデータ収集における柔軟性と移動性のため、FEELにとって特に有利である。
論文参考訳（メタデータ） (2023-06-05T16:01:33Z)
RISE: Robust Individualized Decision Learning with Sensitive Variables [1.5293427903448025]
素直なベースラインは、決定規則を学習する際の繊細な変数を無視し、重大な不確実性と偏見をもたらすことである。本稿では、オフライントレーニング中に機密変数を組み込む決定学習フレームワークを提案するが、モデル展開中に学習された決定ルールの入力には含まない。
論文参考訳（メタデータ） (2022-11-12T04:31:38Z)
Feature Alignment by Uncertainty and Self-Training for Source-Free Unsupervised Domain Adaptation [1.6498361958317636]
ほとんどの教師なし領域適応(UDA)手法は、ラベル付きソースイメージがモデル適応中に利用できると仮定する。本稿では,事前学習したソースモデルと未ラベルのターゲット画像のみを用いる,ソースフリーなUDA手法を提案する。本手法は,データ拡張を取り入れ,特徴発生器を2つの整合性目標で訓練することにより,アレータリックな不確実性を捕捉する。
論文参考訳（メタデータ） (2022-08-31T14:28:36Z)
Uncertainty-Driven Action Quality Assessment [67.20617610820857]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文参考訳（メタデータ） (2022-07-29T07:21:15Z)
R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文参考訳（メタデータ） (2022-04-02T07:54:58Z)
Unsupervised Domain Adaptation for Speech Recognition via Uncertainty Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文参考訳（メタデータ） (2020-11-26T18:51:26Z)
Towards robust sensing for Autonomous Vehicles: An adversarial perspective [82.83630604517249]
結果として得られる決定が摂動に対して堅牢であることは、最も重要なことです。敵対的摂動は、意図的に環境や感覚測定の修正を施したものである。より安全なシステムの構築とデプロイには,センサーシステムの脆弱性を慎重に評価する必要がある。
論文参考訳（メタデータ） (2020-07-14T05:25:15Z)
Can Autonomous Vehicles Identify, Recover From, and Adapt to Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文参考訳（メタデータ） (2020-06-26T11:07:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。