論文の概要: UNIFY: a Unified Policy Designing Framework for Solving Constrained
Optimization Problems with Machine Learning
- arxiv url: http://arxiv.org/abs/2210.14030v1
- Date: Tue, 25 Oct 2022 14:09:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 14:14:41.035694
- Title: UNIFY: a Unified Policy Designing Framework for Solving Constrained
Optimization Problems with Machine Learning
- Title(参考訳): UNIFY: 制約付き最適化問題を機械学習で解くための統一ポリシー設計フレームワーク
- Authors: Mattia Silvestri, Allegra De Filippo, Michele Lombardi, Michela Milano
- Abstract要約: 複雑な意思決定問題に対するソリューションポリシーを設計するための統一的な枠組みを提案する。
我々のアプローチは、制約のないMLモデルとCO問題という2つの段階におけるポリシーの巧妙な分解に依存している。
本手法の有効性を,エネルギー管理システムと包括的要件付き集合マルチカバーの2つの実践的問題に対して示す。
- 参考スコア(独自算出の注目度): 18.183339583346005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The interplay between Machine Learning (ML) and Constrained Optimization (CO)
has recently been the subject of increasing interest, leading to a new and
prolific research area covering (e.g.) Decision Focused Learning and
Constrained Reinforcement Learning. Such approaches strive to tackle complex
decision problems under uncertainty over multiple stages, involving both
explicit (cost function, constraints) and implicit knowledge (from data), and
possibly subject to execution time restrictions. While a good degree of success
has been achieved, the existing methods still have limitations in terms of both
applicability and effectiveness. For problems in this class, we propose UNIFY,
a unified framework to design a solution policy for complex decision-making
problems. Our approach relies on a clever decomposition of the policy in two
stages, namely an unconstrained ML model and a CO problem, to take advantage of
the strength of each approach while compensating for its weaknesses. With a
little design effort, UNIFY can generalize several existing approaches, thus
extending their applicability. We demonstrate the method effectiveness on two
practical problems, namely an Energy Management System and the Set Multi-cover
with stochastic coverage requirements. Finally, we highlight some current
challenges of our method and future research directions that can benefit from
the cross-fertilization of the two fields.
- Abstract(参考訳): 機械学習 (ML) と制約付き最適化 (CO) の相互作用は近年関心が高まり、(例えば) 決定に焦点を絞った学習と制約付き強化学習を網羅する新たな研究領域が生まれている。
このようなアプローチは、明示的な(コスト関数、制約)知識と(データからの)暗黙的な知識の両方を含む、多段階にわたる不確実性の下で複雑な決定問題に取り組むことに努める。
成功の度合いは高いが、既存の手法は適用性と有効性の両方に関して制限がある。
このクラスでは、複雑な意思決定問題に対するソリューションポリシーを設計するための統一的なフレームワークUNIFYを提案する。
提案手法は、制約のないMLモデルとCO問題という2つの段階におけるポリシーの巧妙な分解に依存し、その弱点を補いながら各アプローチの強みを利用する。
ちょっとした設計の努力で、UNIFYはいくつかの既存のアプローチを一般化し、適用性を高めることができる。
本手法の有効性を,確率的カバレッジを要求されたエネルギ管理システムとセットマルチカバーの2つの実践的問題に対して示す。
最後に,この2つの分野の交配の恩恵を受けるための方法と今後の研究の方向性について述べる。
関連論文リスト
- BloomWise: Enhancing Problem-Solving capabilities of Large Language Models using Bloom's-Taxonomy-Inspired Prompts [59.83547898874152]
我々は,Bloomの分類にインスパイアされた新しいプロンプト技術であるBloomWiseを導入し,Large Language Models(LLMs)の性能を向上させる。
より洗練された認知スキルを身につける必要性に関する決定は、LLMによる自己評価に基づいている。
4つの一般的な算数推論データセットの広範な実験において,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-10-05T09:27:52Z) - Safe and Balanced: A Framework for Constrained Multi-Objective Reinforcement Learning [26.244121960815907]
本稿では,多目的学習と制約順守の政策最適化を協調するプライマリベースフレームワークを提案する。
提案手法は,複数のRL目標を最適化するために,新しい自然ポリシー勾配演算法を用いる。
また,提案手法は,安全性の高い多目的強化学習タスクにおいて,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-05-26T00:42:10Z) - Near-Optimal Solutions of Constrained Learning Problems [85.48853063302764]
機械学習システムでは、振る舞いを縮小する必要性がますます顕在化している。
これは、双対ロバスト性変数を満たすモデルの開発に向けた最近の進歩によって証明されている。
この結果から, 豊富なパラメトリゼーションは非次元的, 有限な学習問題を効果的に緩和することが示された。
論文 参考訳(メタデータ) (2024-03-18T14:55:45Z) - Intrinsically Motivated Hierarchical Policy Learning in Multi-objective
Markov Decision Processes [15.50007257943931]
本稿では,この制限に対処するために,本質的な2相強化学習法を提案する。
提案手法は, 動的ロボット環境において, 最先端の多目的強化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T02:10:45Z) - Learning with Constraint Learning: New Perspective, Solution Strategy
and Various Applications [45.45917703420217]
本稿では,制約付き学習(LwCL)と呼ばれる新しいフレームワークを提案する。
LwCLは、多様な学習や視覚問題の本質を捉える一般的な階層的最適化モデルとして設計されている。
提案フレームワークは,3つのカテゴリと9つの異なる問題タイプを含む,学習と視覚の幅広い応用に効果的に対処する。
論文 参考訳(メタデータ) (2023-07-28T01:50:27Z) - An Efficient Learning-Based Solver for Two-Stage DC Optimal Power Flow with Feasibility Guarantees [4.029937264494929]
本稿では,より効率的かつ最適な方法で2段階問題の解法を提案する。
ゲージマップと呼ばれるテクニックが学習アーキテクチャ設計に組み込まれ、学習したソリューションがネットワークの制約に対して実現可能であることを保証する。
論文 参考訳(メタデータ) (2023-04-03T22:56:08Z) - Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。
我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-11-08T04:06:23Z) - Efficient lifting of symmetry breaking constraints for complex
combinatorial problems [9.156939957189502]
この作業は、Answer Set Programmingのためのモデルベースのアプローチの学習フレームワークと実装を拡張します。
Inductive Logic Programming System ILASPに新たなコンフリクト解析アルゴリズムを組み込む。
論文 参考訳(メタデータ) (2022-05-14T20:42:13Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Learning What to Defer for Maximum Independent Sets [84.00112106334655]
本稿では,各段階における解の要素的決定を学習することにより,エージェントが適応的に段階数を縮小あるいは拡張する,新たなDRL方式を提案する。
提案手法を最大独立集合(MIS)問題に適用し、現状のDRL方式よりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2020-06-17T02:19:31Z) - Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。
PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。
このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文 参考訳(メタデータ) (2020-06-09T19:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。