論文の概要: From Inverse Optimization to Feasibility to ERM
- arxiv url: http://arxiv.org/abs/2402.17890v1
- Date: Tue, 27 Feb 2024 21:06:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 17:03:20.541010
- Title: From Inverse Optimization to Feasibility to ERM
- Title(参考訳): 逆最適化からEMMへの可能性
- Authors: Saurabh Mishra, Anant Raj, Sharan Vaswani
- Abstract要約: 逆最適化では、未知のパラメータを既知の解から推測する。
本研究では、未知のパラメータをより正確に予測するために、追加の文脈情報を利用する文脈逆設定について検討する。
- 参考スコア(独自算出の注目度): 13.185428008703088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inverse optimization involves inferring unknown parameters of an optimization
problem from known solutions, and is widely used in fields such as
transportation, power systems and healthcare. We study the contextual inverse
optimization setting that utilizes additional contextual information to better
predict the unknown problem parameters. We focus on contextual inverse linear
programming (CILP), addressing the challenges posed by the non-differentiable
nature of LPs. For a linear prediction model, we reduce CILP to a convex
feasibility problem allowing the use of standard algorithms such as alternating
projections. The resulting algorithm for CILP is equipped with a linear
convergence guarantee without additional assumptions such as degeneracy or
interpolation. Next, we reduce CILP to empirical risk minimization (ERM) on a
smooth, convex loss that satisfies the Polyak-Lojasiewicz condition. This
reduction enables the use of scalable first-order optimization methods to solve
large non-convex problems, while maintaining theoretical guarantees in the
convex setting. Finally, we experimentally validate our approach on both
synthetic and real-world problems, and demonstrate improved performance
compared to existing methods.
- Abstract(参考訳): 逆最適化は、既知の解から最適化問題の未知のパラメータを推定することを含み、輸送、電力システム、医療などの分野で広く利用されている。
追加の文脈情報を利用して未知の問題パラメータをより正確に予測する文脈逆最適化設定について検討する。
我々は、文脈逆線形プログラミング(CILP)に注目し、LPの非微分性に起因する課題に対処する。
線形予測モデルでは、CILPを凸実現可能性問題に還元し、交互プロジェクションのような標準アルゴリズムを使用する。
結果として得られるcilpのアルゴリズムは、退化や補間のような追加の仮定なしに線形収束保証を備える。
次に,polyak-lojasiewicz条件を満たす滑らかな凸損失に対して,cilpを経験的リスク最小化(erm)に還元する。
この削減により、拡張性のある一階最適化手法を用いることで、凸設定における理論的保証を維持しながら、大きな非凸問題の解決が可能になる。
最後に,合成問題と実世界の問題の両方に対するアプローチを実験的に検証し,既存手法と比較して性能が向上したことを示す。
関連論文リスト
- Alternating Minimization Schemes for Computing Rate-Distortion-Perception Functions with $f$-Divergence Perception Constraints [10.564071872770146]
離散メモリレスソースに対するRDPF(Ralse-Distortion-Perception Function)の計算について検討した。
最適パラメトリック解を特徴付ける。
歪みと知覚制約について十分な条件を提供する。
論文 参考訳(メタデータ) (2024-08-27T12:50:12Z) - Low-Rank Extragradient Methods for Scalable Semidefinite Optimization [0.0]
この問題が低ランクの解を許容する高次元かつ高可算な設定に焦点をあてる。
これらの条件下では、よく知られた過次法が制約付き最適化問題の解に収束することを示す理論的結果がいくつか提示される。
論文 参考訳(メタデータ) (2024-02-14T10:48:00Z) - Exploring the Algorithm-Dependent Generalization of AUPRC Optimization
with List Stability [107.65337427333064]
AUPRC(Area Under the Precision-Recall Curve)の最適化は、機械学習にとって重要な問題である。
本研究では, AUPRC最適化の単依存一般化における最初の試行について述べる。
3つの画像検索データセットの実験は、我々のフレームワークの有効性と健全性に言及する。
論文 参考訳(メタデータ) (2022-09-27T09:06:37Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Successive Convex Approximation Based Off-Policy Optimization for
Constrained Reinforcement Learning [12.523496806744946]
本稿では,一般的な制約付き強化学習問題の解法として,凸近似に基づくオフポリティ最適化(SCAOPO)アルゴリズムを提案する。
時変状態分布と非政治学習によるバイアスにもかかわらず、実現可能な初期点を持つSCAOPOはカルーシュ=クーン=タッカー点に確実に収束することができる。
論文 参考訳(メタデータ) (2021-05-26T13:52:39Z) - Recent Theoretical Advances in Non-Convex Optimization [56.88981258425256]
近年、深層ネットワークにおける非最適化アルゴリズムの解析やデータ問題への関心が高まっており、非最適化のための理論的最適化アルゴリズムの最近の結果の概要を概説する。
論文 参考訳(メタデータ) (2020-12-11T08:28:51Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z) - Logistic Q-Learning [87.00813469969167]
MDPにおける最適制御の正規化線形プログラミング定式化から導いた新しい強化学習アルゴリズムを提案する。
提案アルゴリズムの主な特徴は,広範に使用されているベルマン誤差の代わりとして理論的に音声として機能する,政策評価のための凸損失関数である。
論文 参考訳(メタデータ) (2020-10-21T17:14:31Z) - Meta-learning based Alternating Minimization Algorithm for Non-convex
Optimization [9.774392581946108]
複数変数の非プロブレムに挑戦する新しい解を提案する。
提案手法では,他の手法が一般的に失敗するケースに対して,効果的なイテレーションを実現することができる。
論文 参考訳(メタデータ) (2020-09-09T10:45:00Z) - Consistency analysis of bilevel data-driven learning in inverse problems [1.0705399532413618]
本稿では,データからの正規化パラメータの適応学習を最適化により検討する。
線形逆問題に対する我々のフレームワークの実装方法を示す。
勾配降下法を用いてオンライン数値スキームを導出する。
論文 参考訳(メタデータ) (2020-07-06T12:23:29Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。