論文の概要: Inverse Multiobjective Optimization Through Online Learning
- arxiv url: http://arxiv.org/abs/2010.06140v1
- Date: Mon, 12 Oct 2020 17:53:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 08:12:25.768154
- Title: Inverse Multiobjective Optimization Through Online Learning
- Title(参考訳): オンライン学習による逆多目的最適化
- Authors: Chaosheng Dong, Bo Zeng
- Abstract要約: 本研究では,多目的意思決定モデルの目的関数や制約を学習する問題について検討する。
ノイズの多いデータを処理できる暗黙の更新ルールを持つオンライン学習アルゴリズムを2つ開発した。
数値計算の結果,両アルゴリズムはパラメータを高い精度で学習でき,ノイズに対して頑健であることがわかった。
- 参考スコア(独自算出の注目度): 14.366265951396587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of learning the objective functions or constraints of a
multiobjective decision making model, based on a set of sequentially arrived
decisions. In particular, these decisions might not be exact and possibly carry
measurement noise or are generated with the bounded rationality of decision
makers. In this paper, we propose a general online learning framework to deal
with this learning problem using inverse multiobjective optimization. More
precisely, we develop two online learning algorithms with implicit update rules
which can handle noisy data. Numerical results show that both algorithms can
learn the parameters with great accuracy and are robust to noise.
- Abstract(参考訳): 本研究では,多目的意思決定モデルの目的的機能や制約を逐次決定のセットに基づいて学習する問題について検討する。
特に、これらの決定は正確ではなく、測定ノイズを伝達したり、意思決定者の有界合理性によって生成されたりする可能性がある。
本稿では,逆多目的最適化を用いて,この学習問題に対処する一般的なオンライン学習フレームワークを提案する。
より正確には、ノイズのあるデータを処理できる暗黙の更新ルールを持つ2つのオンライン学習アルゴリズムを開発した。
数値計算の結果,両アルゴリズムはパラメータを高い精度で学習でき,ノイズに強いことがわかった。
関連論文リスト
- End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - Explainable Data-Driven Optimization: From Context to Decision and Back
Again [76.84947521482631]
データ駆動最適化では、コンテキスト情報と機械学習アルゴリズムを使用して、不確実なパラメータによる決定問題の解決策を見つける。
本稿では,データ駆動型問題に対する解法を説明するために,対実的説明手法を提案する。
在庫管理やルーティングといった運用管理における重要な問題を説明することで,我々のアプローチを実証する。
論文 参考訳(メタデータ) (2023-01-24T15:25:16Z) - Efficient Learning of Decision-Making Models: A Penalty Block Coordinate
Descent Algorithm for Data-Driven Inverse Optimization [12.610576072466895]
我々は、意思決定プロセスを明らかにするために、事前の意思決定データを使用する逆問題を考える。
この統計的学習問題は、データ駆動逆最適化と呼ばれる。
そこで本稿では,大規模問題を解くために,効率的なブロック座標降下に基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-27T12:52:56Z) - Model-Based Deep Learning: On the Intersection of Deep Learning and
Optimization [101.32332941117271]
決定アルゴリズムは様々なアプリケーションで使われている。
数理モデルに頼らずにデータから調整された高度パラメトリックアーキテクチャを使用するディープラーニングアプローチが、ますます人気が高まっている。
モデルに基づく最適化とデータ中心のディープラーニングは、しばしば異なる規律とみなされる。
論文 参考訳(メタデータ) (2022-05-05T13:40:08Z) - Targeted Active Learning for Bayesian Decision-Making [15.491942513739676]
サンプルを逐次取得する際には,学習と意思決定を分離することが準最適である。
本稿では,ダウン・ザ・ライン決定問題を考慮に入れた,新たなアクティブな学習戦略を提案する。
具体的には、最適決定の後続分布における期待情報ゲインを最大化する、新しい能動的学習基準を導入する。
論文 参考訳(メタデータ) (2021-06-08T09:05:43Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Learning with Differentiable Perturbed Optimizers [54.351317101356614]
本稿では,操作を微分可能で局所的に一定ではない操作に変換する手法を提案する。
提案手法は摂動に依拠し,既存の解法とともに容易に利用することができる。
本稿では,この枠組みが,構造化予測において発達した損失の族とどのように結びつくかを示し,学習課題におけるそれらの使用に関する理論的保証を与える。
論文 参考訳(メタデータ) (2020-02-20T11:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。