Fugu-MT 論文翻訳(概要): Falsification of Learning-Based Controllers through Multi-Fidelity Bayesian Optimization

論文の概要: Falsification of Learning-Based Controllers through Multi-Fidelity Bayesian Optimization

arxiv url: http://arxiv.org/abs/2212.14118v1
Date: Wed, 28 Dec 2022 22:48:42 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-02 17:52:13.198636
Title: Falsification of Learning-Based Controllers through Multi-Fidelity Bayesian Optimization
Title（参考訳）: マルチフィデリティベイズ最適化による学習型制御系のファルシフィケーション
Authors: Zahra Shahrooei, Mykel J. Kochenderfer, Ali Baheri
Abstract要約: ベイズ最適化を用いた多要素ファリシフィケーションフレームワークを提案する。本手法では,低忠実度シミュレータからの安価な不正確な情報と高忠実度シミュレータからの高価で正確な情報とを自動的に切り替えることができる。
参考スコア（独自算出の注目度）: 34.71695000650056
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Simulation-based falsification is a practical testing method to increase confidence that the system will meet safety requirements. Because full-fidelity simulations can be computationally demanding, we investigate the use of simulators with different levels of fidelity. As a first step, we express the overall safety specification in terms of environmental parameters and structure this safety specification as an optimization problem. We propose a multi-fidelity falsification framework using Bayesian optimization, which is able to determine at which level of fidelity we should conduct a safety evaluation in addition to finding possible instances from the environment that cause the system to fail. This method allows us to automatically switch between inexpensive, inaccurate information from a low-fidelity simulator and expensive, accurate information from a high-fidelity simulator in a cost-effective way. Our experiments on various environments in simulation demonstrate that multi-fidelity Bayesian optimization has falsification performance comparable to single-fidelity Bayesian optimization but with much lower cost.
Abstract（参考訳）: シミュレーションベースのファルシフィケーションは、システムが安全要件を満たす自信を高めるための実用的なテスト手法である。忠実度シミュレーションは計算的に要求されるので,異なる忠実度レベルを持つシミュレータの利用について検討する。第1ステップとして,環境パラメータの観点から全体安全仕様を表現し,この安全仕様を最適化問題として構成する。我々は,システム障害の原因となる環境から可能なインスタンスを見つけることに加えて,どのレベルの忠実度で安全性評価を行うべきかを判断できるベイズ最適化を用いたマルチフィデリティ改ざんフレームワークを提案する。本手法により,低忠実度シミュレータからの安価な不正確な情報と高忠実度シミュレータからの高価な正確な情報とを,低コストで自動的に切り替えることができる。シミュレーションにおける各種環境に関する実験により,マルチフィデリティベイズ最適化は単一フィデリティベイズ最適化に匹敵するファルシフィケーション性能を持つが,はるかに低コストであることが示された。

関連論文リスト

G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文参考訳（メタデータ） (2025-06-10T22:14:34Z)
Neural Fidelity Calibration for Informative Sim-to-Real Adaptation [10.117298045153564]
深い強化学習は、アジャイルの移動とナビゲーションのスキルをシミュレータから現実世界にシームレスに移行することができる。しかし、ドメインのランダム化や敵対的手法とシム・トゥ・リアルのギャップを埋めることは、しばしば政策の堅牢性を保証するために専門家の物理学知識を必要とする。本研究では, 条件付きスコアベース拡散モデルを用いて, ロボットの動作中における物理係数と残留忠実度領域のキャリブレーションを行う新しいフレームワークであるNeural Fidelity(NFC)を提案する。
論文参考訳（メタデータ） (2025-04-11T15:12:12Z)
Byzantine-Resilient Over-the-Air Federated Learning under Zero-Trust Architecture [68.83934802584899]
我々は,セキュアな適応クラスタリング(FedSAC)を用いたフェデレーション学習(Federated Learning)と呼ばれる,無線通信のための新しいビザンチン・ロバストFLパラダイムを提案する。 FedSACは、デバイスの一部をゼロ信頼アーキテクチャ(ZTA)ベースのビザンティン識別と適応デバイスクラスタリングによる攻撃から保護することを目的としている。実験精度と収束率の両面から,提案手法よりもFedSACの方が優れていることを示す。
論文参考訳（メタデータ） (2025-03-24T01:56:30Z)
Optimizing Falsification for Learning-Based Control Systems: A Multi-Fidelity Bayesian Approach [40.58350379106314]
ファルシフィケーション問題はシステムの安全要件に反する反例を識別することです本稿では,様々な精度でシミュレータを利用する多要素ベイズ最適化ファルシフィケーションフレームワークを提案する。
論文参考訳（メタデータ） (2024-09-12T14:51:03Z)
Towards Safe Multi-Task Bayesian Optimization [1.3654846342364308]
システムの物理モデルを減らすことは最適化プロセスに組み込むことができ、それを加速することができる。これらのモデルは実際のシステムの近似を提供することができ、それらの評価は極めて安価である。安全はベイズ最適化のようなオンライン最適化手法にとって重要な基準である。
論文参考訳（メタデータ） (2023-12-12T13:59:26Z)
SAVME: Efficient Safety Validation for Autonomous Systems Using Meta-Learning [36.896695278624776]
メタ学習戦略とマルチアームバンディットフレームワークを統合したベイズ的手法を提案する。我々は,最先端の3D運転シミュレータを用いて,自律走行車スタックに16の忠実度設定を組み込んだ方法論を紹介した。従来の手法に比べて最大18倍の高速化を実現している。
論文参考訳（メタデータ） (2023-09-21T20:41:47Z)
Near-optimal Policy Identification in Active Reinforcement Learning [84.27592560211909]
AE-LSVI はカーネル化された最小二乗値 RL (LSVI) アルゴリズムの新しい変種であり、楽観主義と悲観主義を組み合わせて活発な探索を行う。 AE-LSVIは初期状態に対するロバスト性が必要な場合、様々な環境で他のアルゴリズムよりも優れていることを示す。
論文参考訳（メタデータ） (2022-12-19T14:46:57Z)
Falsification of Cyber-Physical Systems using Bayesian Optimization [0.5407319151576264]
シミュレーションに基づくCPSのファルシフィケーションは、システムの正確性に対する信頼性を高めるための実用的なテスト手法である。各シミュレーションは典型的に計算集約的であるため、仕様をファルシフィケーションするために必要なシミュレーションの数を減らすことが重要なステップである。本研究では,入力信号のパラメトリゼーションと仕様評価の関係を記述したサロゲートモデルを,サンプル効率で学習するベイズ最適化(BO)について検討する。
論文参考訳（メタデータ） (2022-09-14T15:52:19Z)
Log Barriers for Safe Black-box Optimization with Application to Safe Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。 LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文参考訳（メタデータ） (2022-07-21T11:14:47Z)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (2021-11-18T23:21:00Z)
Finding Failures in High-Fidelity Simulation using Adaptive Stress Testing and the Backward Algorithm [35.076062292062325]
適応ストレステスト(アダプティブストレステスト、英: Adaptive stress testing、AST)は、強化学習を用いてシステムの最も起こりそうな障害を見つける手法である。深い強化学習の解法を持つASTは、様々なシステムにまたがる障害を見つけるのに有効であることが示されている。効率を向上させるために,まず低忠実度シミュレータで故障を検知する手法を提案する。次に、単一の専門家によるデモンストレーションを使用してディープニューラルネットワークポリシーをトレーニングするバックワードアルゴリズムを使用して、低忠実度障害を高忠実度に適応させる。
論文参考訳（メタデータ） (2021-07-27T16:54:04Z)
AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文参考訳（メタデータ） (2020-08-16T11:36:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。