論文の概要: Sampler-Robust Optimization under Generative Models
- arxiv url: http://arxiv.org/abs/2604.27447v1
- Date: Thu, 30 Apr 2026 05:33:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.939081
- Title: Sampler-Robust Optimization under Generative Models
- Title(参考訳): 生成モデルによるサンプリング・ロバスト最適化
- Authors: Ziwei Zhang, Jonathan Yu-Meng Li,
- Abstract要約: 決定パイプラインは、不確実性を表すために学習された生成モデルに依存している。
信頼性は2つのエラーに依存する。
本稿では,学習したジェネレータの摂動によって誘導される最悪のサンプルに対する決定を最適化するサンプリング-ロバスト最適化を提案する。
- 参考スコア(独自算出の注目度): 4.250238840479483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern stochastic optimization pipelines increasingly rely on learned generative models to represent uncertainty, while downstream decisions are evaluated almost entirely through Monte Carlo scenarios. This shifts the operational object of uncertainty from an explicit probability law to the sampler induced by the learned generator. Reliability therefore depends on two errors: sampler misspecification and finite-simulation error. We propose Sampler-Robust Optimization (SRO), which optimizes decisions against the worst-case sampler induced by perturbing the learned generator. This sampler-first formulation aligns with simulation-based decision pipelines and admits a sharpness-aware interpretation: it favors decisions whose performance is stable under generator perturbations, rather than merely under the nominal sampler. Under a coverage assumption, we show that the empirical worst-case objective provides a high-probability upper certificate for the true population objective, with finite-simulation error partially absorbed by the robustification used to guard against sampler misspecification. The framework accommodates generative models with or without explicit densities and admits efficient minimax procedures. Portfolio-optimization experiments show that SRO produces more stable decisions and improves out-of-sample performance under distribution shift.
- Abstract(参考訳): 現代の確率最適化パイプラインは、不確実性を表すために学習された生成モデルにますます依存し、下流の決定はモンテカルロのシナリオを通してほぼ完全に評価される。
これにより、不確実性の操作対象を明示的な確率法則から学習した生成元によって誘導されるサンプリング器にシフトする。
したがって、信頼性は2つの誤りに依存する。
本稿では,学習したジェネレータの摂動によって誘導される最悪のサンプルに対する決定を最適化するサンプラー・ロバスト最適化(SRO)を提案する。
このサンプリングファーストの定式化は、シミュレーションに基づく決定パイプラインと一致し、シャープネスを意識した解釈を認めている。
そこで,本研究では,サンプルの誤識別を防ぐための堅牢化により,有限シミュレーション誤差が部分的に吸収され,実証的な最悪の対象が真の人口目標に対して高い確率の上位証明を提供することを示す。
このフレームワークは、明確な密度の有無にかかわらず生成モデルに対応し、効率的なminimaxプロシージャを許容する。
ポートフォリオ最適化実験により、SROはより安定した決定を下し、分散シフト下でのサンプル外性能を改善することが示されている。
関連論文リスト
- Sharp Convergence Rates for Masked Diffusion Models [53.117058231393834]
制約を克服するオイラー法に対する全変分に基づく解析法を開発した。
その結果、スコア推定の仮定を緩和し、パラメータ依存性を改善し、収束保証を確立する。
全体としては,CTMC軌道に沿った直接テレビによる誤り分解と,FHSのためのデカップリングに基づく経路解析を導入している。
論文 参考訳(メタデータ) (2026-02-26T00:47:51Z) - On the Optimal Construction of Unbiased Gradient Estimators for Zeroth-Order Optimization [57.179679246370114]
既存の手法の潜在的な制限は、ステップサイズが提案されない限り、ほとんどの摂動推定器に固有のバイアスである。
本稿では, 良好な構成を維持しつつ, バイアスを排除した非バイアス勾配スケーリング推定器のファミリーを提案する。
論文 参考訳(メタデータ) (2025-10-22T18:25:43Z) - Flipping Against All Odds: Reducing LLM Coin Flip Bias via Verbalized Rejection Sampling [59.133428586090226]
大規模言語モデル(LLM)は、しばしば自然言語を用いて確率分布を正確に記述することができる。
このミスマッチはモンテカルロ法、エージェントベースのシミュレーション、ランダム化された意思決定などの信頼性を必要とするタスクでの使用を制限する。
本稿では,古典的リジェクションサンプリングの自然言語適応であるVerbalized Rejection Smpling (VRS)を紹介する。
論文 参考訳(メタデータ) (2025-06-11T17:59:58Z) - Minimax Optimality of the Probability Flow ODE for Diffusion Models [8.15094483029656]
この研究は、決定論的ODEベースのサンプリングのための最初のエンドツーエンド理論フレームワークを開発する。
L2$のスコア誤差と関連する平均ジャコビアン誤差の両方を同時に制御するスムーズな正規化スコア推定器を提案する。
得られたサンプルは全変動距離, 変調対数係数において最小値が得られることを示す。
論文 参考訳(メタデータ) (2025-03-12T17:51:29Z) - Improving Value-based Process Verifier via Structural Prior Injection [30.07647106495661]
合理的な構造的事前注入は, コストの少ない約1$sim$2ポイントで, 価値に基づくプロセス検証の性能を向上できることを示す。
また, 異なる構造的事前条件下では, 同じ最適解を持つにもかかわらず, 検証器の性能が大きく異なることを示す。
論文 参考訳(メタデータ) (2025-02-21T07:57:59Z) - Informed Correctors for Discrete Diffusion Models [27.295990499157814]
離散拡散モデルに対する予測・相関型サンプリング手法を提案する。
情報補正器は,誤差が少なく,FIDスコアが向上した優れたサンプルを連続的に生成することを示す。
本結果は,離散拡散を用いた高速かつ高忠実な生成のための情報補正器の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-07-30T23:29:29Z) - Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples [58.68233326265417]
非画像データは実際のアプリケーションで広く使われており、ノイズが多い傾向にある。
リスク感受性SDEは、リスクベクトルによってパラメータ化された微分方程式(SDE)の一種である。
我々はガウス雑音分布と非ガウス雑音分布の両方について系統的研究を行う。
論文 参考訳(メタデータ) (2024-02-03T08:41:51Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Efficient Propagation of Uncertainty via Reordering Monte Carlo Samples [0.7087237546722617]
不確実性伝播は、入力変数の不確実性に基づいてモデル出力の不確実性を決定する技術である。
本研究は,全ての試料が平均的に有用であるにもかかわらず,他の試料よりも有用であるとする仮説を考察する。
本稿では、MCサンプルを適応的に並べ替える手法を導入し、UPプロセスの計算コストの削減をもたらす方法を示す。
論文 参考訳(メタデータ) (2023-02-09T21:28:15Z) - VAE Approximation Error: ELBO and Conditional Independence [78.72292013299868]
本稿では,ELBO目標とエンコーダ確率系列の選択の組み合わせによるVAE近似誤差を解析する。
より深いエンコーダネットワークを考慮すれば,ELBOサブセットを拡大することができず,各エラーを低減できないことを示す。
論文 参考訳(メタデータ) (2021-02-18T12:54:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。