論文の概要: QUIVER: Cost-Aware Adaptive Preference Querying in Surrogate-Assisted Evolutionary Multi-Objective Optimization
- arxiv url: http://arxiv.org/abs/2605.04267v1
- Date: Tue, 05 May 2026 20:02:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.530661
- Title: QUIVER: Cost-Aware Adaptive Preference Querying in Surrogate-Assisted Evolutionary Multi-Objective Optimization
- Title(参考訳): QUIVER:サロゲート支援進化的多目的最適化におけるコストアウェア適応型参照クエリ
- Authors: Florian A. D. Burnat,
- Abstract要約: 本稿では、客観評価と嗜好クエリを適応的に選択する、代理支援型進化的多目的言語であるQUIVERを紹介する。
我々はQUIVERがWFG問題に挑戦する上で最下位のユーティリティ後悔を達成していることを示す。
この適応的モダリティ選択は、行動におけるコストアウェアな嗜好学習を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive multi-objective optimization systems face a budget allocation dilemma: one can spend resources on expensive objective evaluations or on eliciting decision-maker preferences that identify the relevant region of the Pareto set. Moreover, preference elicitation itself spans modalities with different information content and cognitive burden, ranging from cheap, noisy pairwise preference statements (PS) to richer but costlier indifference adjustments (IA). We study cost-aware optimization under an unknown scalarization and introduce QUIVER (Query-Informed Value Estimation for Regret), a surrogate-assisted evolutionary multi-objective optimizer that adaptively chooses between objective evaluations and heterogeneous preference queries. At each step, QUIVER selects the next action by maximizing the expected decision-quality improvement per unit total cost. Across DTLZ and WFG benchmarks under synthetic decision-maker models, QUIVER achieves the lowest final utility regret on challenging WFG problems (utility regret of 2.14 on WFG4, 2.82 on WFG9: a 25% improvement over baselines), outperforming all single-modality baselines. We analyze how the optimal mix of PS and IA adapts to problem difficulty: on easy problems (DTLZ2), QUIVER selects 80\% PS queries; on hard problems (WFG9), it shifts to 35% IA queries. This adaptive modality selection demonstrates cost-aware preference learning in action.
- Abstract(参考訳): 対話型多目的最適化システムは、予算配分ジレンマに直面している: 高価な客観的評価や、Pareto集合の関連する領域を特定する意思決定者選好にリソースを費やすことができる。
さらに、選好選択そのものは、安価でノイズの多いペアワイドな選好文(PS)から、よりリッチだがよりコストの高い偏見調整(IA)まで、異なる情報内容と認知的負担を伴うモダリティにまたがる。
本研究では,未知のスキャラライゼーションの下でコスト意識の最適化について検討し,客観評価と異種嗜好クエリを適応的に選択するサロゲート型進化的多目的最適化器であるQUIVER(Query-Informed Value Estimation for Regret)を導入する。
各ステップにおいてQUIVERは、単位総コスト当たりの予測決定品質改善を最大化し、次のアクションを選択する。
DTLZとWFGのベンチマークを総合的に比較すると、QUIVERはWFG問題(WFG4では2.14、WFG9では2.82、ベースラインでは25%改善)に挑戦し、単一のモダリティベースラインを上回っている。
簡単な問題(DTLZ2)では、QUIVERが80\%のPSクエリを選択し、難しい問題(WFG9)では35%のIAクエリにシフトする。
この適応的モダリティ選択は、行動におけるコストアウェアな嗜好学習を示す。
関連論文リスト
- GIFT: Global Irreplaceability Frame Targeting for Efficient Video Understanding [63.62445065977448]
GIFT: Global Irreplaceability Frame Targetingはトレーニング不要のフレームワークで、固有の非配置性を評価してフレームを選択する。
GIFTは,LLaVA-Video-7Bの長文ビデオベンチマークにおいて,一様サンプリングに比べて最大12.5%向上したことを示す。
論文 参考訳(メタデータ) (2026-03-26T06:21:41Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - Parametric Expensive Multi-Objective Optimization via Generative Solution Modeling [34.344228998247225]
本稿では,この逆モデルについて,獲得駆動探索モデルと生成モデルとの交互に学習した最初のパラメトリック多目的ベイズモデルを提案する。
我々はタスク対応ガウス過程を通じてタスク間シナジーを活用することにより、より高速な収束を理論的に正当化する。
論文 参考訳(メタデータ) (2025-11-12T15:13:27Z) - Parametric Pareto Set Learning for Expensive Multi-Objective Optimization [16.780031024741223]
パラメトリック多目的最適化(PMO)は、無限の多目的最適化問題を解くという課題に対処する。
従来の手法では、各パラメータ設定を再実行する必要があるため、客観的評価が計算コストが高い場合には、不当なコストが発生する。
論文 参考訳(メタデータ) (2025-11-08T03:05:28Z) - Regularized infill criteria for multi-objective Bayesian optimization with application to aircraft design [0.565395466029518]
本稿では,SEGOMOEの専門家の混在による超効率的なグローバル最適化を拡張し,制約付き多目的問題の解法を提案する。
提案手法の利点は、制約のない既知の多目的ベンチマーク問題に示される。
予備的な結果は,関数評価における総コストを,進化的アルゴリズムNSGA-IIと比較して20倍に削減したことを示している。
論文 参考訳(メタデータ) (2025-04-11T16:24:40Z) - Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models [79.84205827056907]
本稿では,高品質な嗜好データを自律的に生成するアルゴリズムであるセルフステアリング最適化(SSO$)を提案する。
$SSO$は、ポリシーモデル自体からデータジェネレータを構築するために、特別な最適化目標を採用しています。
評価の結果,$SSO$は人選好アライメントと報酬最適化のベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-22T16:04:03Z) - Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Multi-Objective Bayesian Optimization with Active Preference Learning [18.066263838953223]
本稿では,多目的最適化 (MOO) 問題において最も望ましい解を特定するためのベイズ最適化 (BO) 手法を提案する。
また、意思決定者(DM)との相互作用コストを最小限に抑えるため、選好推定のためのアクティブラーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-11-22T15:24:36Z) - Studying Evolutionary Solution Adaption Using a Flexibility Benchmark Based on a Metal Cutting Process [39.05320053926048]
システム柔軟性のためのバイオインスパイアされたフレームワークの観点から、異なる生産要件を最適化することを検討する。
NSGA-IIの柔軟性は,1)2つのタスクの解を同時に最適化し,より適応性が高いと期待されるソース間の解を得る,2)アクティベートあるいは非アクティベート可能な様々な可能性に対応する,アクティブな非アクティブなジェノタイプという2つの変種によって拡張される。
論文 参考訳(メタデータ) (2023-05-31T12:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。