論文の概要: Preferential Bayesian Optimization with Crash Feedback
- arxiv url: http://arxiv.org/abs/2604.01776v1
- Date: Thu, 02 Apr 2026 08:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.623237
- Title: Preferential Bayesian Optimization with Crash Feedback
- Title(参考訳): クラッシュフィードバックを用いた優先ベイズ最適化
- Authors: Johanna Menn, David Stenger, Sebastian Trimpe,
- Abstract要約: CrashPBOは、ユーザが最適化プロセス中に好みを表現したり、クラッシュを報告したりできる、ユーザフレンドリーなメカニズムである。
合成関数のベンチマークは、このメカニズムがクラッシュを63%削減し、データの効率が向上することを示している。
- 参考スコア(独自算出の注目度): 10.61206107163781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian optimization is a popular black-box optimization method for parameter learning in control and robotics. It typically requires an objective function that reflects the user's optimization goal. However, in practical applications, this objective function is often inaccessible due to complex or unmeasurable performance metrics. Preferential Bayesian optimization (PBO) overcomes this limitation by leveraging human feedback through pairwise comparisons, eliminating the need for explicit performance quantification. When applying PBO to hardware systems, such as in quadcopter control, crashes can cause time-consuming experimental resets, wear and tear, or otherwise undesired outcomes. Standard PBO methods cannot incorporate feedback from such crashed experiments, resulting in the exploration of parameters that frequently lead to experimental crashes. We thus introduce CrashPBO, a user-friendly mechanism that enables users to both express preferences and report crashes during the optimization process. Benchmarking on synthetic functions shows that this mechanism reduces crashes by 63% and increases data efficiency. Through experiments on three robotics platforms, we demonstrate the wide applicability and transferability of CrashPBO, highlighting that it provides a flexible, user-friendly framework for parameter learning with human feedback on preferences and crashes.
- Abstract(参考訳): ベイズ最適化は、制御とロボット工学におけるパラメータ学習のための一般的なブラックボックス最適化手法である。
通常は、ユーザの最適化目標を反映した客観的関数が必要です。
しかし、実際的な応用では、この目的関数は複雑な、または測定不能なパフォーマンス指標のためにアクセスできないことが多い。
優先ベイズ最適化(PBO)は、ペア比較を通じて人間のフィードバックを活用することにより、明示的な性能定量化の必要性を排除し、この制限を克服する。
クアッドコプター制御などのハードウェアシステムにPBOを適用すると、クラッシュは時間を要する実験的なリセット、摩耗と涙、その他の望ましくない結果を引き起こす可能性がある。
標準的なPBO法はそのようなクラッシュした実験からのフィードバックを組み込むことができないため、しばしば実験的なクラッシュにつながるパラメータの探索に繋がる。
そこで我々は,最適化プロセス中にユーザの好みや報告のクラッシュを表現できる,ユーザフレンドリーなメカニズムであるCrashPBOを導入する。
合成関数のベンチマークは、このメカニズムがクラッシュを63%削減し、データの効率が向上することを示している。
3つのロボティクスプラットフォームの実験を通じて、CrashPBOの広範な適用性と転送性を示し、パラメータ学習のためのフレキシブルでユーザフレンドリなフレームワークと、人間の好みやクラッシュに対するフィードバックを提供することを強調した。
関連論文リスト
- Bayesian Preference Elicitation: Human-In-The-Loop Optimization of An Active Prosthesis [3.6494031371026323]
本稿では,標準4パラメータ補綴器を効率よくパーソナライズするためのHuman-in-the-loop Optimization (HILO)アプローチを提案する。
我々は, 効率的な収束, 堅牢な選好誘導, 測定可能な生体力学的改善を示す。
論文 参考訳(メタデータ) (2026-02-26T12:11:51Z) - Bayesian Optimization Parameter Tuning Framework for a Lyapunov Based Path Following Controller [7.212376559978978]
実世界の実験におけるチューニングは、ハードウェア上で利用可能な限られた評価予算によって制限される。
このフレームワークはホンダのAI-Formula三輪ロボットに実装されている。
その結果, BOは, 温度開始初期評価を含む32回の試験において, 制御性能を向上することがわかった。
論文 参考訳(メタデータ) (2025-12-14T11:35:53Z) - Exploiting Prior Knowledge in Preferential Learning of Individualized Autonomous Vehicle Driving Styles [41.94295877935867]
自動車両の軌道計画では、一般的に移動地平線上を最適化するモデル予測制御を用いる。
乗客に好まれる運転スタイルをもたらす適切なコスト関数を見つけることは、現在進行中の課題である。
我々は、乗客の好みを反復的にクエリすることでコスト関数の学習に優先的なベイズ最適化を用いる。
論文 参考訳(メタデータ) (2025-03-19T16:47:56Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Stability-informed Bayesian Optimization for MPC Cost Function Learning [5.643541009427271]
本研究では,不完全な情報の下での予測制御パラメータの閉ループ学習について検討する。
フィードフォワードニューラルネットワークとしてパラメータ化されたモデル予測制御器(MPC)コスト関数の学習には,制約付きベイズ最適化を用いる。
Lyapunov 候補として基礎となる MPC の最適値関数を利用して,学習した制御パラメータの安定性制約によってこの枠組みを拡張した。
論文 参考訳(メタデータ) (2024-04-18T13:49:09Z) - Poisson Process for Bayesian Optimization [126.51200593377739]
本稿では、Poissonプロセスに基づくランキングベースの代理モデルを提案し、Poisson Process Bayesian Optimization(PoPBO)と呼ばれる効率的なBOフレームワークを提案する。
従来のGP-BO法と比較すると,PoPBOはコストが低く,騒音に対する堅牢性も良好であり,十分な実験により検証できる。
論文 参考訳(メタデータ) (2024-02-05T02:54:50Z) - Provably Efficient Bayesian Optimization with Unknown Gaussian Process Hyperparameter Estimation [44.53678257757108]
目的関数の大域的最適値にサブ線形収束できる新しいBO法を提案する。
本手法では,BOプロセスにランダムなデータポイントを追加するために,マルチアームバンディット法 (EXP3) を用いる。
提案手法は, 様々な合成および実世界の問題に対して, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-12T03:35:45Z) - Tuning Particle Accelerators with Safety Constraints using Bayesian
Optimization [73.94660141019764]
粒子加速器の機械パラメータのチューニングは反復的で時間を要する作業である。
我々は、安全なベイズ最適化のステップサイズ制限版を提案し、評価する。
論文 参考訳(メタデータ) (2022-03-26T02:21:03Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z) - Scalable Constrained Bayesian Optimization [10.820024633762596]
ブラックボックス制約下での高次元ブラックボックス関数のグローバルな最適化は、機械学習、制御、科学コミュニティにおける普及的なタスクである。
本稿では,上記の課題を克服し,現状を推し進めるスケーラブルな制約付きベイズ最適化(SCBO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-20T01:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。