論文の概要: Preference Exploration for Efficient Bayesian Optimization with Multiple
Outcomes
- arxiv url: http://arxiv.org/abs/2203.11382v1
- Date: Mon, 21 Mar 2022 23:02:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 09:06:48.012784
- Title: Preference Exploration for Efficient Bayesian Optimization with Multiple
Outcomes
- Title(参考訳): 複数出力を用いた効率よいベイズ最適化のための優先探索
- Authors: Zhiyuan Jerry Lin, Raul Astudillo, Peter I. Frazier, Eytan Bakshy
- Abstract要約: 意思決定者が好むベクトル値結果を生成する実験の最適化を検討する。
これらの選好は、閉じた形では知られていないが、DMに結果ベクトルのペアよりも好みを表現するように求めることで推定できるユーティリティ関数によって符号化される。
我々は,インタラクティブなリアルタイム嗜好学習とDMを交互に行う新しいフレームワークを開発した。
- 参考スコア(独自算出の注目度): 17.300690315775572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider Bayesian optimization of expensive-to-evaluate experiments that
generate vector-valued outcomes over which a decision-maker (DM) has
preferences. These preferences are encoded by a utility function that is not
known in closed form but can be estimated by asking the DM to express
preferences over pairs of outcome vectors. To address this problem, we develop
Bayesian optimization with preference exploration, a novel framework that
alternates between interactive real-time preference learning with the DM via
pairwise comparisons between outcomes, and Bayesian optimization with a learned
compositional model of DM utility and outcomes. Within this framework, we
propose preference exploration strategies specifically designed for this task,
and demonstrate their performance via extensive simulation studies.
- Abstract(参考訳): 我々は,意思決定者(DM)が好むベクトル値結果を生成する,高価な評価実験のベイズ最適化を考える。
これらの選好は、閉じた形では知られていないが、DMに結果ベクトルのペアよりも好みを表現するように求めることで推定できるユーティリティ関数によって符号化される。
この問題に対処するために,対話型リアルタイム選好学習とDMのペア比較によるDMとを交互に交互に行う新しいフレームワークである選好探索を用いたベイズ最適化と,DMユーティリティと結果の学習構成モデルを用いたベイズ最適化を開発する。
本フレームワークでは,このタスク用に特別に設計された選好探索戦略を提案し,広範なシミュレーション研究を通じてその性能を実証する。
関連論文リスト
- Batched Bayesian optimization with correlated candidate uncertainties [44.38372821900645]
純粋に活用する qPO (multipoint of Optimality) による離散最適化のための獲得戦略を提案する。
本研究では, 大規模化学ライブラリのモデル誘導探索に適用し, バッチ化ベイズ最適化における最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2024-10-08T20:13:12Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1240295759264]
本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文 参考訳(メタデータ) (2024-08-14T11:29:47Z) - Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文 参考訳(メタデータ) (2024-06-12T16:58:41Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Enhanced Bayesian Optimization via Preferential Modeling of Abstract
Properties [49.351577714596544]
本研究では,非測定抽象特性に関する専門家の嗜好を代理モデルに組み込むための,人間とAIの協調型ベイズフレームワークを提案する。
優先判断において、誤った/誤解を招く専門家バイアスを処理できる効率的な戦略を提供する。
論文 参考訳(メタデータ) (2024-02-27T09:23:13Z) - Data-Efficient Interactive Multi-Objective Optimization Using ParEGO [6.042269506496206]
多目的最適化は、競合する目的間の最適なトレードオフを提供する非支配的なソリューションの集合を特定することを目的としている。
実践的な応用では、意思決定者(DM)は実装すべき好みに合わせて単一のソリューションを選択する。
そこで本稿では,パレートフロントの最も好まれる領域を,高コストで評価できる2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-12T15:55:51Z) - Multi-Objective Bayesian Optimization with Active Preference Learning [18.066263838953223]
本稿では,多目的最適化 (MOO) 問題において最も望ましい解を特定するためのベイズ最適化 (BO) 手法を提案する。
また、意思決定者(DM)との相互作用コストを最小限に抑えるため、選好推定のためのアクティブラーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-11-22T15:24:36Z) - Differentiable Multi-Target Causal Bayesian Experimental Design [43.76697029708785]
本稿では,ベイズ最適設計問題に対する勾配に基づくアプローチを導入し,バッチ環境で因果モデルを学習する。
既存の手法は、一連の実験を構築するためにグリーディ近似に依存している。
そこで本稿では,最適介入対象ペアの集合を取得するための,概念的にシンプルな勾配に基づく最適化手法を提案する。
論文 参考訳(メタデータ) (2023-02-21T11:32:59Z) - Optimal Bayesian experimental design for subsurface flow problems [77.34726150561087]
本稿では,設計ユーティリティ機能のためのカオス拡張サロゲートモデル(PCE)の開発のための新しいアプローチを提案する。
この手法により,対象関数に対する適切な品質応答面の導出が可能となり,計算予算は複数の単点評価に匹敵する。
論文 参考訳(メタデータ) (2020-08-10T09:42:59Z) - Preferential Batch Bayesian Optimization [16.141259199997005]
優先バッチベイズ最適化(PBBO)は、潜在関数の最適性を見つけるための新しいフレームワークである。
本稿では,ベイズ最適化における従来の手法の一般化と拡張について述べる。
論文 参考訳(メタデータ) (2020-03-25T14:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。