論文の概要: Regularized GLISp for sensor-guided human-in-the-loop optimization
- arxiv url: http://arxiv.org/abs/2511.04751v1
- Date: Thu, 06 Nov 2025 19:00:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.561909
- Title: Regularized GLISp for sensor-guided human-in-the-loop optimization
- Title(参考訳): センサ誘導型ヒューマン・イン・ザ・ループ最適化のための正規化GLISp
- Authors: Matteo Cercola, Michele Lomuscio, Dario Piga, Simone Formentin,
- Abstract要約: 我々は、測定可能な記述子を優先学習ループに統合するGLISpのセンサ誘導正規化拡張を導入する。
これにより、主観フィードバックと定量的センサー情報を組み合わせたグレーボックス構造が注入される。
解析的ベンチマークと人間の車載サスペンションチューニングタスクの数値評価は、より高速な収束と優れた最終解を示す。
- 参考スコア(独自算出の注目度): 0.769971486557519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human-in-the-loop calibration is often addressed via preference-based optimization, where algorithms learn from pairwise comparisons rather than explicit cost evaluations. While effective, methods such as Preferential Bayesian Optimization or Global optimization based on active preference learning with radial basis functions (GLISp) treat the system as a black box and ignore informative sensor measurements. In this work, we introduce a sensor-guided regularized extension of GLISp that integrates measurable descriptors into the preference-learning loop through a physics-informed hypothesis function and a least-squares regularization term. This injects grey-box structure, combining subjective feedback with quantitative sensor information while preserving the flexibility of preference-based search. Numerical evaluations on an analytical benchmark and on a human-in-the-loop vehicle suspension tuning task show faster convergence and superior final solutions compared to baseline GLISp.
- Abstract(参考訳): ヒューマン・イン・ザ・ループ・キャリブレーション(Human-in-the-loop calibration)は、アルゴリズムが明示的なコスト評価ではなく、ペア比較から学習する選好ベースの最適化によって対処されることが多い。
優先ベイズ最適化やグローバル最適化のような手法は、放射状基底関数(GLISp)を用いた能動優先学習(能動優先学習)に基づいて、システムをブラックボックスとして扱い、情報センサ測定を無視する。
本稿では,物理インフォームド仮説関数と最小二乗正規化項を用いて,測定可能な記述子を優先学習ループに統合するGLISpのセンサ誘導正規化拡張を提案する。
これにより、主観的フィードバックと定量的センサー情報を組み合わせたグレーボックス構造が注入され、好みに基づく探索の柔軟性が保たれる。
GLISpと比較して, 解析的ベンチマークと人間の車載サスペンションチューニングタスクの数値評価は, より高速に収束し, より優れた最終解が得られた。
関連論文リスト
- Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文 参考訳(メタデータ) (2024-06-12T16:58:41Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Optimizer's Information Criterion: Dissecting and Correcting Bias in Data-Driven Optimization [16.57676001669012]
データ駆動最適化では、得られた決定のサンプル性能は通常、真の性能に対して楽観的なバイアスを生じさせる。
クロスバリデーションのような、このバイアスを修正するための一般的なテクニックは、追加の最適化問題を繰り返し解決する必要があるため、コストがかかる。
我々は一階偏差を直接近似する一般バイアス補正手法を開発し、追加の最適化問題を解く必要はない。
論文 参考訳(メタデータ) (2023-06-16T07:07:58Z) - GLISp-r: A preference-based optimization algorithm with convergence
guarantees [2.517173388598129]
本稿では、GLISp-rと呼ばれる好みに基づく最適化手法の拡張を提案する。
GLISp-rでは、MSRSにインスパイアされた新しい候補サンプルを探す際に使用する異なる基準を提案する。
GLISpと比較すると、GLISp-rは好みに基づく最適化問題の局所最適化に悩まされる可能性が低い。
論文 参考訳(メタデータ) (2022-02-02T16:34:15Z) - An automatic differentiation system for the age of differential privacy [65.35244647521989]
Tritiumは、微分プライベート(DP)機械学習(ML)のための自動微分ベース感度分析フレームワークである
我々は、微分プライベート(DP)機械学習(ML)のための自動微分に基づく感度分析フレームワークTritiumを紹介する。
論文 参考訳(メタデータ) (2021-09-22T08:07:42Z) - Directed particle swarm optimization with Gaussian-process-based
function forecasting [15.733136147164032]
パーティクルスワム最適化 (PSO) は、探索空間を囲む一組の候補解を、ランダム化されたステップ長を持つ最もよく知られたグローバルおよびローカルな解へ移動させる反復探索法である。
本アルゴリズムは探索的・搾取的行動に対して望ましい特性が得られることを示す。
論文 参考訳(メタデータ) (2021-02-08T13:02:57Z) - Human Preference-Based Learning for High-dimensional Optimization of
Exoskeleton Walking Gaits [55.59198568303196]
この研究は、LineCoSparという、高次元でユーザの好みを学習するヒューマン・イン・ザ・ループの好みベースのフレームワークを提示する。
シミュレーションと人為的試行において,LineCoSparは高次元の選好最適化のためのサンプル効率のよい手法であることを実証的に検証した。
この結果はエキソ骨格の歩行合成に影響を及ぼし,臨床応用と患者のリハビリテーションに有効である。
論文 参考訳(メタデータ) (2020-03-13T22:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。