論文の概要: Efficient Learning of Decision-Making Models: A Penalty Block Coordinate
Descent Algorithm for Data-Driven Inverse Optimization
- arxiv url: http://arxiv.org/abs/2210.15393v1
- Date: Thu, 27 Oct 2022 12:52:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 16:18:12.772418
- Title: Efficient Learning of Decision-Making Models: A Penalty Block Coordinate
Descent Algorithm for Data-Driven Inverse Optimization
- Title(参考訳): 意思決定モデルの効率的な学習:データ駆動逆最適化のためのペナルティブロック座標Descentアルゴリズム
- Authors: Rishabh Gupta, Qi Zhang
- Abstract要約: 我々は、意思決定プロセスを明らかにするために、事前の意思決定データを使用する逆問題を考える。
この統計的学習問題は、データ駆動逆最適化と呼ばれる。
そこで本稿では,大規模問題を解くために,効率的なブロック座標降下に基づくアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 12.610576072466895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision-making problems are commonly formulated as optimization problems,
which are then solved to make optimal decisions. In this work, we consider the
inverse problem where we use prior decision data to uncover the underlying
decision-making process in the form of a mathematical optimization model. This
statistical learning problem is referred to as data-driven inverse
optimization. We focus on problems where the underlying decision-making process
is modeled as a convex optimization problem whose parameters are unknown. We
formulate the inverse optimization problem as a bilevel program and propose an
efficient block coordinate descent-based algorithm to solve large problem
instances. Numerical experiments on synthetic datasets demonstrate the
computational advantage of our method compared to standard commercial solvers.
Moreover, the real-world utility of the proposed approach is highlighted
through two realistic case studies in which we consider estimating risk
preferences and learning local constraint parameters of agents in a multiplayer
Nash bargaining game.
- Abstract(参考訳): 決定問題は通常最適化問題として定式化され、最適決定を行うために解かれる。
本研究では,事前決定データを用いて基礎となる意思決定過程を数学的最適化モデルとして解明する逆問題を考える。
この統計学習問題はデータ駆動逆最適化と呼ばれる。
基礎となる意思決定プロセスがパラメータが不明な凸最適化問題としてモデル化される問題に焦点を当てる。
逆最適化問題を双レベルプログラムとして定式化し,大規模問題に対する効率的なブロック座標降下型アルゴリズムを提案する。
合成データセットの数値実験により,本手法の計算的優位性を示す。
さらに,マルチプレイヤーナッシュバーゲティングゲームにおいて,リスク嗜好を推定し,エージェントの局所的制約パラメータを学習する2つの現実的なケーススタディを通じて,提案手法の現実的有用性を強調した。
関連論文リスト
- Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - BO4IO: A Bayesian optimization approach to inverse optimization with uncertainty quantification [5.031974232392534]
この研究はデータ駆動逆最適化(IO)に対処する。
目的は最適化モデルにおける未知のパラメータを、最適あるいは準最適と仮定できる観測された決定から推定することである。
論文 参考訳(メタデータ) (2024-05-28T06:52:17Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - Data-driven decision-focused surrogate modeling [10.1947610432159]
本稿では,実時間設定における非線形最適化問題の解決を目的とした,意思決定中心の代理モデルの概念を紹介する。
提案したデータ駆動フレームワークは、決定予測エラーを最小限に抑えるためにトレーニングされた、よりシンプルな、例えば凸(convex)、代理最適化モデル(surrogate optimization model)を学ぶことを目指している。
我々は、一般的な非線形化学プロセスの最適化を含む数値実験を通して、我々の枠組みを検証する。
論文 参考訳(メタデータ) (2023-08-23T14:23:26Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Teaching Networks to Solve Optimization Problems [13.803078209630444]
反復解法をトレーニング可能なパラメトリック集合関数に置き換えることを提案する。
このようなパラメトリックな(集合)関数を学習することで、様々な古典的最適化問題を解くことができることを示す。
論文 参考訳(メタデータ) (2022-02-08T19:13:13Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Decomposition and Adaptive Sampling for Data-Driven Inverse Linear
Optimization [12.610576072466895]
この研究は、線形プログラムの未知のコストベクトルを推論することが目的である逆線形最適化に対処する。
本稿では,既存の手法と比較して,制約の少ない,一般的に許容可能なコスト見積の集合の回復を可能にする,新たな問題の定式化を導入する。
論文 参考訳(メタデータ) (2020-09-16T22:25:31Z) - Automatically Learning Compact Quality-aware Surrogates for Optimization
Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。
最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。
我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-18T19:11:54Z) - Causal Bayesian Optimization [8.958125394444679]
本研究では、介入の順序が実行される因果モデルの一部である関心の変数をグローバルに最適化する問題について検討する。
私たちのアプローチは、因果推論、不確実性定量化、シーケンシャルな意思決定といったアイデアを組み合わせています。
因果グラフを理解することで、最適な意思決定戦略を推論する能力が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-05-24T13:20:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。