論文の概要: One Step Preference Elicitation in Multi-Objective Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2105.13278v1
- Date: Thu, 27 May 2021 16:23:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-28 16:15:12.676092
- Title: One Step Preference Elicitation in Multi-Objective Bayesian Optimization
- Title(参考訳): 多目的ベイズ最適化における一段階選好
- Authors: Juan Ungredda, Mariapia Marchi, Teresa Montrone and Juergen Branke
- Abstract要約: 評価に費用がかかる目的関数を持つ多目的最適化問題を考察する。
DMの未知の嗜好による真の最良の解は、見いだされた非支配的な解の小さなセットに含まれないことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a multi-objective optimization problem with objective functions
that are expensive to evaluate. The decision maker (DM) has unknown
preferences, and so the standard approach is to generate an approximation of
the Pareto front and let the DM choose from the generated non-dominated
designs. However, especially for expensive to evaluate problems where the
number of designs that can be evaluated is very limited, the true best solution
according to the DM's unknown preferences is unlikely to be among the small set
of non-dominated solutions found, even if these solutions are truly Pareto
optimal. We address this issue by using a multi-objective Bayesian optimization
algorithm and allowing the DM to select a preferred solution from a predicted
continuous Pareto front just once before the end of the algorithm rather than
selecting a solution after the end. This allows the algorithm to understand the
DM's preferences and make a final attempt to identify a more preferred
solution. We demonstrate the idea using ParEGO, and show empirically that the
found solutions are significantly better in terms of true DM preferences than
if the DM would simply pick a solution at the end.
- Abstract(参考訳): 評価に費用がかかる目的関数を持つ多目的最適化問題を考察する。
意思決定者(DM)は好ましくないため、標準的なアプローチはParetoフロントの近似を生成し、DMが生成した非支配的な設計から選択させることである。
しかし、特に評価可能な設計数が非常に限られている問題を評価するために、DMの未知の選好による真の最良の解は、たとえこれらの解が真にパレート最適であるとしても、見いだされる非支配解の小さなセットに含まれない。
我々は,多目的ベイズ最適化アルゴリズムを用いて,dmがアルゴリズムの終了直前の1回だけ,予測された連続パレートフロントから望ましい解を選択できるようにすることでこの問題に対処した。
これにより、アルゴリズムはdmの好みを理解し、より望ましいソリューションを特定する最後の試みを行うことができる。
我々はparegoを用いてそのアイデアを実証し、dmが最終的に単にソリューションを選ぶよりも、真のdmの好みの方がはるかに優れていることを実証的に示します。
関連論文リスト
- Data-Efficient Interactive Multi-Objective Optimization Using ParEGO [6.042269506496206]
多目的最適化は、競合する目的間の最適なトレードオフを提供する非支配的なソリューションの集合を特定することを目的としている。
実践的な応用では、意思決定者(DM)は実装すべき好みに合わせて単一のソリューションを選択する。
そこで本稿では,パレートフロントの最も好まれる領域を,高コストで評価できる2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-12T15:55:51Z) - Multi-Objective Bayesian Optimization with Active Preference Learning [18.066263838953223]
本稿では,多目的最適化 (MOO) 問題において最も望ましい解を特定するためのベイズ最適化 (BO) 手法を提案する。
また、意思決定者(DM)との相互作用コストを最小限に抑えるため、選好推定のためのアクティブラーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-11-22T15:24:36Z) - Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。
本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文 参考訳(メタデータ) (2022-01-28T05:53:28Z) - RoMA: Robust Model Adaptation for Offline Model-based Optimization [115.02677045518692]
入力出力クエリの静的データセットからブラックボックス目的関数を最大化する入力を探索する問題を考える。
この問題を解決するための一般的なアプローチは、真の客観的関数を近似するプロキシモデルを維持することである。
ここでの大きな課題は、検索中に逆最適化された入力を避ける方法である。
論文 参考訳(メタデータ) (2021-10-27T05:37:12Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Goal Seeking Quadratic Unconstrained Binary Optimization [0.5439020425819]
本稿では,目標からのずれを最小限に抑える2種類の目標探索QUBOを提案する。
本論文では、タブー探索に基づく1フリップによる目標からの偏差を最小限に抑える2種類の目標探索QUBOについて述べる。
論文 参考訳(メタデータ) (2021-03-24T03:03:13Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Online Model Selection for Reinforcement Learning with Function
Approximation [50.008542459050155]
我々は、$tildeO(L5/6 T2/3)$ regretで最適な複雑性に適応するメタアルゴリズムを提案する。
また、メタアルゴリズムは、インスタンス依存の後悔境界を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-11-19T10:00:54Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - Solution Subset Selection for Final Decision Making in Evolutionary
Multi-Objective Optimization [7.745468825770201]
最終的な意思決定の観点から,サブセットの選択について論じる。
定式化関数はIGD+インジケータと同じであることを示す。
論文 参考訳(メタデータ) (2020-06-15T06:26:58Z) - Ensuring smoothly navigable approximation sets by Bezier curve
parameterizations in evolutionary bi-objective optimization -- applied to
brachytherapy treatment planning for prostate cancer [0.0]
決定空間における滑らかなベジエ曲線として近似集合をパラメータ化する場合について検討する。
高品質な近似集合をBezEAで得ることができ、時には支配とUHVに基づくアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-11T13:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。