論文の概要: Experience in Engineering Complex Systems: Active Preference Learning
with Multiple Outcomes and Certainty Levels
- arxiv url: http://arxiv.org/abs/2302.14630v1
- Date: Mon, 27 Feb 2023 15:55:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 16:07:57.547730
- Title: Experience in Engineering Complex Systems: Active Preference Learning
with Multiple Outcomes and Certainty Levels
- Title(参考訳): エンジニアリング複合システムにおける経験: 複数の成果と確実性レベルを持つアクティブな選好学習
- Authors: Le Anh Dao, Loris Roveda, Marco Maccarini, Matteo Lavit Nicora, Marta
Mondellini, Matteo Meregalli Falerni, Palaniappan Veerappan, Lorenzo
Mantovani, Dario Piga, Simone Formentin, Matteo Malosio
- Abstract要約: ブラックボックス最適化とは、目的関数と/または制約集合が未知、到達不能、あるいは存在しない問題を指す。
この特定の情報を活用するために、いわゆるActive Preference Learningと呼ばれるアルゴリズムが開発された。
我々のアプローチは、さらなる情報を効果的に活用できるような方法でアルゴリズムを拡張することを目的としている。
- 参考スコア(独自算出の注目度): 1.5257326975704795
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Black-box optimization refers to the optimization problem whose objective
function and/or constraint sets are either unknown, inaccessible, or
non-existent. In many applications, especially with the involvement of humans,
the only way to access the optimization problem is through performing physical
experiments with the available outcomes being the preference of one candidate
with respect to one or many others. Accordingly, the algorithm so-called Active
Preference Learning has been developed to exploit this specific information in
constructing a surrogate function based on standard radial basis functions, and
then forming an easy-to-solve acquisition function which repetitively suggests
new decision vectors to search for the optimal solution. Based on this idea,
our approach aims to extend the algorithm in such a way that can exploit
further information effectively, which can be obtained in reality such as:
5-point Likert type scale for the outcomes of the preference query (i.e., the
preference can be described in not only "this is better than that" but also
"this is much better than that" level), or multiple outcomes for a single
preference query with possible additive information on how certain the outcomes
are. The validation of the proposed algorithm is done through some standard
benchmark functions, showing a promising improvement with respect to the
state-of-the-art algorithm.
- Abstract(参考訳): ブラックボックス最適化(Black-box optimization)とは、目的関数や制約セットが未知、到達不能、あるいは存在しない最適化問題を指す。
多くのアプリケーション、特に人間の関与において、最適化問題にアクセスする唯一の方法は、ある候補を1つまたは複数の候補に対して選好することによる物理的実験を行うことである。
そこで,この情報を活用し,標準ラジアル基底関数に基づくサロゲート関数を構築した上で,新たな決定ベクトルを反復的に提案し,最適解を探索する容易解獲得関数を構築する,いわゆるアクティブ・プレファレンス・ラーニング(active preference learning)アルゴリズムを開発した。
この考え方に基づき,提案手法は,さらなる情報を効果的に活用するためのアルゴリズムを拡張することを目的としている。5点のlikert型スケール 選好クエリの結果(すなわち,選好が"これよりも優れている"だけでなく,"それよりもずっと良い"レベルに記述できる) や,結果の確実性に関する付加的な情報を含む単一の選好クエリの複数の結果など,現実に得ることができる。
提案アルゴリズムの検証は標準的なベンチマーク関数によって行われ、最先端のアルゴリズムに関して有望な改善を示す。
関連論文リスト
- Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文 参考訳(メタデータ) (2024-06-12T16:58:41Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - DynamoRep: Trajectory-Based Population Dynamics for Classification of
Black-box Optimization Problems [0.755972004983746]
簡単な統計量を用いて最適化アルゴリズムの軌道を記述する特徴抽出法を提案する。
提案するDynamoRep機能は,最適化アルゴリズムが動作している問題クラスを特定するのに十分な情報を取得する。
論文 参考訳(メタデータ) (2023-06-08T06:57:07Z) - Global and Preference-based Optimization with Mixed Variables using Piecewise Affine Surrogates [0.6083861980670925]
本稿では,線形制約付き混合変数問題の解法として,新しいサロゲートに基づく大域的最適化アルゴリズムを提案する。
目的関数はブラックボックスとコスト対評価であり、線形制約は予測不可能な事前知識である。
本稿では,2種類の探索関数を導入し,混合整数線形計画解法を用いて実現可能な領域を効率的に探索する。
論文 参考訳(メタデータ) (2023-02-09T15:04:35Z) - Generalizing Bayesian Optimization with Decision-theoretic Entropies [102.82152945324381]
統計的決定論の研究からシャノンエントロピーの一般化を考える。
まず,このエントロピーの特殊なケースがBO手順でよく用いられる獲得関数に繋がることを示す。
次に、損失に対する選択肢の選択が、どのようにして柔軟な獲得関数の族をもたらすかを示す。
論文 参考訳(メタデータ) (2022-10-04T04:43:58Z) - BOME! Bilevel Optimization Made Easy: A Simple First-Order Approach [46.457298683984924]
バイレベル最適化(BO)は、さまざまな機械学習問題を解決するのに有用である。
従来の手法では、暗黙の微分を伴う低レベル最適化プロセスを通じて差別化する必要がある。
一階BOは一階情報にのみ依存し、暗黙の微分を必要としない。
論文 参考訳(メタデータ) (2022-09-19T01:51:12Z) - Offline Policy Optimization with Eligible Actions [34.4530766779594]
オフラインポリシーの最適化は多くの現実世界の意思決定問題に大きな影響を与える可能性がある。
重要度サンプリングとその変種は、オフラインポリシー評価において一般的に使用されるタイプの推定器である。
そこで本稿では, 州ごとの正規化制約によって過度に適合することを避けるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-01T19:18:15Z) - A unified surrogate-based scheme for black-box and preference-based
optimization [2.561649173827544]
ブラックボックスと嗜好に基づく最適化問題は密接に関連しており、同じアプローチのファミリを用いて解決可能であることを示す。
一般的なMSRSフレームワークを一般化した最適化手法である一般化されたメトリック応答面(gMRS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-03T08:47:54Z) - Bayesian Algorithm Execution: Estimating Computable Properties of
Black-box Functions Using Mutual Information [78.78486761923855]
多くの現実世界では、T関数の評価の予算を考えると、高価なブラックボックス関数 f の性質を推測したい。
本稿では,アルゴリズムの出力に対して相互情報を最大化するクエリを逐次選択する手法InfoBAXを提案する。
これらの問題に対してInfoBAXは、元のアルゴリズムで要求されるより500倍少ないクエリをfに使用する。
論文 参考訳(メタデータ) (2021-04-19T17:22:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。