論文の概要: SURF: Steering the Scalarization Weight to Uniformly Traverse the Pareto Front
- arxiv url: http://arxiv.org/abs/2605.20619v1
- Date: Wed, 20 May 2026 02:09:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.436681
- Title: SURF: Steering the Scalarization Weight to Uniformly Traverse the Pareto Front
- Title(参考訳): SURF:Paretoフロントを均一にトラバースするスカラライゼーションウェイトをステアリングする
- Authors: Liuyuan Jiang, Chentong Huang, Lisha Chen,
- Abstract要約: その結果, SURF はベースラインよりも均一な PF カバレッジを効果的に達成できることが示唆された。
バンディット,多目的ジムナジウム,多目的LDMアライメントの実験により,SURFがベースラインよりも均一なPFカバレッジを効率的に達成できることが示されている。
- 参考スコア(独自算出の注目度): 6.196072730297927
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scalarization is widely used in multi-objective optimization owing to its simplicity and scalability. In many applications, the goal is to generate solutions that represent diverse user preferences, ideally with uniform coverage of the Pareto front (PF). However, uniformly sampling scalarization weights usually induces non-uniform coverage of the PF. We explain this mismatch through a geometric analysis of the scalarization path. As the scalarization weight varies, the corresponding solutions trace the PF with a generally non-uniform traversal speed. This speed induces an arc-length cumulative distribution function (CDF); inverting this CDF map yields a principled rule for selecting weights that produce uniform PF coverage. Building on this insight, we propose SURF (Sampling Uniformly along the PaReto Front). For structured problems, including bi-objective bandits, we derive closed-form expressions for this CDF map and the resulting PF-aware weight sampling rule. For general problems, SURF alternates between CDF reconstruction and weight sampling. Theoretically, we show that under provable conditions, SURF converges linearly to an unavoidable finite-sampling floor. Empirically, experiments on bandits, multi-objective-gymnasium, and multi-objective LLM alignment demonstrate that SURF efficiently achieves more uniform PF coverage than baselines.
- Abstract(参考訳): スケーラビリティは、その単純さとスケーラビリティのため、多目的最適化で広く利用されている。
多くのアプリケーションにおいて、ゴールは、Paretoフロント(PF)の均一なカバレッジを理想とする、多様なユーザの好みを表すソリューションを作成することである。
しかしながら、スカラー化重みの均一サンプリングは通常、PFの非一様カバレッジを誘導する。
このミスマッチはスカラー化経路の幾何学的解析によって説明される。
スカラー化の重みが変化するにつれて、対応する解は一般に一様でないトラバース速度でPFを辿る。
この速度は弧長累積分布関数(CDF)を誘導し、このCDFマップを反転させることで、均一なPFカバレッジを生成する重みを選択するための原則化された規則が得られる。
この知見に基づいて、我々はSURF (Sampling Uniformly along Pareto Front)を提案する。
複目的包帯を含む構造化問題に対しては,本CDFマップの閉形式表現と,その結果のPF対応加重規則を導出する。
一般的な問題として、SURFはCDF再構成と重量サンプリングを交互に行う。
理論的には、証明可能な条件下では、SURFは避けられない有限サンプリングフロアに線形に収束する。
実験的に、包帯、多目的マグネシウム、多目的LDMアライメントの実験は、SURFがベースラインよりもより均一なPFカバレッジを効率的に達成していることを示した。
関連論文リスト
- Orthogonalized Policy Optimization:Decoupling Sampling Geometry from Optimization Geometry in RLHF [0.0]
大規模言語モデルアライメントの目的はしばしば、PPO、DPO、IPO、およびそれらの変種といった、異なるアルゴリズムの集合として提示される。
この研究において、この多様性はより単純な基盤構造を曖昧にしていると論じる。
この絡み合いは、単にモデリングの利便性ではなく、体系的な不安定性の源であることを示す。
論文 参考訳(メタデータ) (2026-01-18T13:57:44Z) - Adversarial Transform Particle Filters [11.330617592263744]
粒子フィルタ(PF)とアンサンブルカルマンフィルタ(EnKF)は状態空間モデルにおける近似推論に広く用いられている。
本稿では, PF と EnKF の強みを組み合わせた新しいフィルタフレームワークである Adversarial Transform Particle Filter (ATPF) を提案する。
論文 参考訳(メタデータ) (2025-02-10T05:31:35Z) - A Unified Analysis for Finite Weight Averaging [50.75116992029417]
Gradient Descent(SGD)の平均イテレーションは、SWA(Weight Averaging)、EMA(Exponential moving Average)、LAWA(Latest Weight Averaging)といったディープラーニングモデルのトレーニングにおいて、経験的な成功を収めている。
本稿では、LAWAを有限重み平均化(FWA)として一般化し、最適化と一般化の観点からSGDと比較して、それらの利点を説明する。
論文 参考訳(メタデータ) (2024-11-20T10:08:22Z) - A Unified Theory of Stochastic Proximal Point Methods without Smoothness [52.30944052987393]
近点法はその数値的安定性と不完全なチューニングに対する頑健性からかなりの関心を集めている。
本稿では,近位点法(SPPM)の幅広いバリエーションの包括的解析について述べる。
論文 参考訳(メタデータ) (2024-05-24T21:09:19Z) - UMOEA/D: A Multiobjective Evolutionary Algorithm for Uniform Pareto
Objectives based on Decomposition [19.13435817442015]
多目的最適化(MOO)は、多くのアプリケーションで広く使われている。
従来の手法では、PF全体を表すためにパレートの目的(PF上の粒子)の集合を利用するのが一般的であった。
本稿は,従来のMOO手法で見られる限られた多様性を緩和するため,PF上でのインフォニフォーム分散目的を構築することを提案する。
論文 参考訳(メタデータ) (2024-02-14T08:09:46Z) - On Optimal Sampling for Learning SDF Using MLPs Equipped with Positional Encoding [76.78321723602636]
我々は、好ましくない副作用を伴わずに、正確な暗黙の場を学習するための適切なサンプリング率を決定するツールを考案した。
PEを具備したPEは、PE層の最高周波数成分よりも内在周波数がはるかに高いことが観察された。
SDFフィッティングの設定において,この推奨サンプリングレートは正確なフィッティング結果の確保に十分であることを示す。
論文 参考訳(メタデータ) (2024-01-02T10:51:52Z) - Symmetric Mean-field Langevin Dynamics for Distributional Minimax
Problems [78.96969465641024]
平均場ランゲヴィンのダイナミクスを、対称で証明可能な収束した更新で、初めて確率分布に対する最小の最適化に拡張する。
また,時間と粒子の離散化機構について検討し,カオス結果の新たな均一時間伝播を証明した。
論文 参考訳(メタデータ) (2023-12-02T13:01:29Z) - Transport meets Variational Inference: Controlled Monte Carlo Diffusions [5.5654189024307685]
本稿では,経路空間上の発散に着目したサンプリングおよび生成モデリングのための原理的かつ体系的な枠組みを提案する。
ベイズ計算のためのemphControlled Monte Carlo Diffusion sampler (CMCD)を開発した。
論文 参考訳(メタデータ) (2023-07-03T14:28:36Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。