論文の概要: Amortized Active Generation of Pareto Sets
- arxiv url: http://arxiv.org/abs/2510.21052v1
- Date: Thu, 23 Oct 2025 23:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.340901
- Title: Amortized Active Generation of Pareto Sets
- Title(参考訳): パレート集合のアモルト化能動生成
- Authors: Daniel M. Steinberg, Asiri Wijesinghe, Rafael Oliveira, Piotr Koniusz, Cheng Soon Ong, Edwin V. Bonilla,
- Abstract要約: A-GPSは、オンラインの離散ブラックボックスマルチオブジェクト最適化のための新しいフレームワークである。
メソッドは、非支配関係を予測するためにクラス確率推定器を使用する。
この非支配的CPEは,超ボリューム改善の確率を暗黙的に見積もっている。
- 参考スコア(独自算出の注目度): 48.56811624922571
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce active generation of Pareto sets (A-GPS), a new framework for online discrete black-box multi-objective optimization (MOO). A-GPS learns a generative model of the Pareto set that supports a-posteriori conditioning on user preferences. The method employs a class probability estimator (CPE) to predict non-dominance relations and to condition the generative model toward high-performing regions of the search space. We also show that this non-dominance CPE implicitly estimates the probability of hypervolume improvement (PHVI). To incorporate subjective trade-offs, A-GPS introduces preference direction vectors that encode user-specified preferences in objective space. At each iteration, the model is updated using both Pareto membership and alignment with these preference directions, producing an amortized generative model capable of sampling across the Pareto front without retraining. The result is a simple yet powerful approach that achieves high-quality Pareto set approximations, avoids explicit hypervolume computation, and flexibly captures user preferences. Empirical results on synthetic benchmarks and protein design tasks demonstrate strong sample efficiency and effective preference incorporation.
- Abstract(参考訳): オンライン離散ブラックボックス多目的最適化(MOO)のための新しいフレームワークであるPareto Set(A-GPS)のアクティブ・ジェネレーションを紹介する。
A-GPSは、ユーザの好みに応じてa-posteriori条件をサポートするParetoセットの生成モデルを学ぶ。
クラス確率推定器(CPE)を用いて、非支配関係を予測し、探索空間の高パフォーマンス領域に対して生成モデルを条件付ける。
また,この非支配性CPEは,超体積改善(PHVI)の確率を暗黙的に推定することを示した。
主観的トレードオフを組み込むため、A-GPSは客観空間におけるユーザが指定した嗜好を符号化する選好方向ベクトルを導入している。
各イテレーションにおいて、モデルはParetoメンバシップとこれらの嗜好方向のアライメントの両方を使用して更新され、再トレーニングせずにParetoフロントをサンプリングできる再生モデルが生成される。
その結果、高品質なPareto集合近似を実現し、明示的なハイパーボリューム計算を回避し、ユーザの好みを柔軟にキャプチャする。
合成ベンチマークとタンパク質設計タスクの実証実験の結果、強いサンプル効率と効果的な選好が示された。
関連論文リスト
- Hyperparameter Optimization via Interacting with Probabilistic Circuits [20.128718882698593]
候補点の獲得機能のない生成を可能にする新しい選択ポリシーを開発する。
本手法は,標準HPOにおける最先端性能を実現し,対話型HPOにおける対話型BOベースラインよりも優れることを示す。
論文 参考訳(メタデータ) (2025-05-23T12:21:19Z) - Multi-Objective Preference Optimization: Improving Human Alignment of Generative Models [15.799929216215672]
制約付きKL正規化最適化としてアライメントをフレーム化するMOPOアルゴリズムを提案する。
以前の作業とは異なり、MOPOはペアワイズ好みのデータを直接操作し、ポイントワイズ報酬の仮定を必要とせず、プロンプトコンテキストエンジニアリングを避ける。
論文 参考訳(メタデータ) (2025-05-16T05:58:26Z) - Preference-Guided Diffusion for Multi-Objective Offline Optimization [64.08326521234228]
オフライン多目的最適化のための優先誘導拡散モデルを提案する。
我々の指導は、ある設計が他の設計を支配する確率を予測するために訓練された選好モデルである。
本結果は,多種多様な高品質な解を生成する上での分類器誘導拡散モデルの有効性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-03-21T16:49:38Z) - Calibrated Multi-Preference Optimization for Aligning Diffusion Models [90.15024547673785]
Calibrated Preference Optimization (CaPO) は、テキスト・ツー・イメージ(T2I)拡散モデルを調整する新しい手法である。
CaPOは、人間の注釈のない複数の報酬モデルからの一般的な好みを取り入れている。
実験結果から, CaPOは従来法よりも常に優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-02-04T18:59:23Z) - ParetoFlow: Guided Flows in Multi-Objective Optimization [12.358524770639136]
オフライン多目的最適化(MOO)では、関連するラベルのオフラインデータセットを同時に複数の目的に活用する。
最近のイテレーションは主に進化的最適化とベイズ最適化を採用しており、データに固有の生成能力に限定的に注意が向けられている。
本手法は,様々なタスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-12-04T21:14:18Z) - Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1240295759264]
本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文 参考訳(メタデータ) (2024-08-14T11:29:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。