論文の概要: Constrained Prescriptive Trees via Column Generation
- arxiv url: http://arxiv.org/abs/2207.10163v1
- Date: Wed, 20 Jul 2022 19:30:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-22 13:43:02.176807
- Title: Constrained Prescriptive Trees via Column Generation
- Title(参考訳): 列生成による制約付き規範木
- Authors: Shivaram Subramanian, Wei Sun, Youssef Drissi, Markus Ettl
- Abstract要約: 本稿では、列生成による最適ポリシーを効率的に識別する新しいパスベース混合整数プログラム(MIP)について紹介する。
提案手法の有効性を,合成データと実データの両方に対して広範な実験により実証する。
- 参考スコア(独自算出の注目度): 5.273277327802614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the abundance of available data, many enterprises seek to implement
data-driven prescriptive analytics to help them make informed decisions. These
prescriptive policies need to satisfy operational constraints, and proactively
eliminate rule conflicts, both of which are ubiquitous in practice. It is also
desirable for them to be simple and interpretable, so they can be easily
verified and implemented. Existing approaches from the literature center around
constructing variants of prescriptive decision trees to generate interpretable
policies. However, none of the existing methods are able to handle constraints.
In this paper, we propose a scalable method that solves the constrained
prescriptive policy generation problem. We introduce a novel path-based
mixed-integer program (MIP) formulation which identifies a (near) optimal
policy efficiently via column generation. The policy generated can be
represented as a multiway-split tree which is more interpretable and
informative than a binary-split tree due to its shorter rules. We demonstrate
the efficacy of our method with extensive experiments on both synthetic and
real datasets.
- Abstract(参考訳): 利用可能なデータが豊富にあるため、多くの企業はインフォームドな意思決定を支援するデータ駆動の規範的分析を実装しようとしている。
これらの規範的なポリシーは、運用上の制約を満たし、ルールの衝突を積極的に排除する必要があります。
また、それらがシンプルで解釈可能であることも望ましいため、検証や実装が容易である。
文献からの既存のアプローチは、解釈可能なポリシーを生成するために規範的決定木の変種を構築することに集中している。
しかし、既存のどのメソッドも制約を処理できない。
本稿では,制約付き規範的政策生成問題を解決するスケーラブルな手法を提案する。
本稿では、列生成による最適ポリシーを効率的に識別する新しいパスベース混合整数プログラム(MIP)について紹介する。
生成されたポリシーは、より短いルールのためにバイナリスプリットツリーよりも解釈可能で情報に富んだマルチウェイスプリットツリーとして表現できる。
提案手法の有効性を,合成データと実データの両方に対して広範な実験により実証する。
関連論文リスト
- Adversarial Imitation Learning On Aggregated Data [0.0]
逆強化学習(IRL: Inverse Reinforcement Learning)は、いくつかの専門家による実証から最適なポリシーを学習し、適切な報酬関数を指定するという面倒なプロセスを避ける。
本稿では,AILAD(Adversarial Imitation Learning on Aggregated Data)と呼ばれる動的適応手法を用いて,これらの要件を除去する手法を提案する。
非線型報酬関数とそれに付随する最適ポリシーの両方を、敵対的枠組みを用いて共役的に学習する。
論文 参考訳(メタデータ) (2023-11-14T22:13:38Z) - A Surprisingly Simple Continuous-Action POMDP Solver: Lazy Cross-Entropy
Search Over Policy Trees [5.250288418639076]
我々は、Lazy Cross-Entropy Search Over Policy Trees (L CEOPT) と呼ばれるオンラインPOMDPソルバを提案する。
提案手法は,各計画段階において,ポリシーツリーの空間を探索するために,新しい遅延クロスエントロピー法を用いる。
提案手法は既存の最先端手法と比較して驚くほど単純であるが, 連続作用POMDP問題では実証的に優れていた。
論文 参考訳(メタデータ) (2023-05-14T03:12:53Z) - Scalable Optimal Multiway-Split Decision Trees with Constraints [3.092691764363848]
決定変数の個数が$N$とは独立な経路に基づく新しいMIP定式化を提案する。
本フレームワークは, 規則が短いため, 通常の二分木よりも解釈しやすいマルチウェイスプリットツリーを生成する。
我々は,最大1,008,372個のサンプルを含むデータセットについて,既存のMIPベースの決定木モデルでは数千点を超えるデータに対してうまくスケールしないことを示す。
論文 参考訳(メタデータ) (2023-02-14T03:48:48Z) - Policy learning "without'' overlap: Pessimism and generalized empirical
Bernstein's inequality [107.84979976896912]
オフライン政策学習は、収集された優先順位を利用して、最適な個別化決定ルールを学ぶことを目的としている。
既存のポリシー学習手法は、一様重なりの仮定、すなわち、すべての個々の特性に対する全てのアクションを探索する確率は、オフラインデータセットにおいて低い境界となる。
本稿では,政策値の点推定ではなく,低信頼境界(LCB)を最適化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-19T22:43:08Z) - Efficient Policy Iteration for Robust Markov Decision Processes via
Regularization [49.05403412954533]
ロバストな意思決定プロセス(MDP)は、システムのダイナミクスが変化している、あるいは部分的にしか知られていない決定問題をモデル化するためのフレームワークを提供する。
最近の研究は、長方形長方形の$L_p$頑健なMDPと正規化されたMDPの等価性を確立し、標準MDPと同じレベルの効率を享受する規則化されたポリシー反復スキームを導出した。
本研究では、政策改善のステップに焦点をあて、欲求政策と最適なロバストなベルマン作用素のための具体的な形式を導出する。
論文 参考訳(メタデータ) (2022-05-28T04:05:20Z) - Constructing a Good Behavior Basis for Transfer using Generalized Policy
Updates [63.58053355357644]
そこで我々は,優れた政策集合を学習する問題を考察し,組み合わせることで,目に見えない多種多様な強化学習タスクを解くことができることを示した。
理論的には、独立したポリシーのセットと呼ぶ、特定の多様なポリシーのセットにアクセスできることによって、ハイレベルなパフォーマンスを即時に達成できることが示される。
論文 参考訳(メタデータ) (2021-12-30T12:20:46Z) - Generating Explainable Rule Sets from Tree-Ensemble Learning Methods by
Answer Set Programming [9.221315229933532]
本稿では, Answer Set Programming (ASP) を用いた木組学習者から説明可能なルールセットを生成する手法を提案する。
基本決定木の分割構造をルール構築に活用する分解的手法を採用する。
ユーザ定義の制約や好みをASPで宣言的に表現して、透過的で柔軟なルールセット生成を可能にする方法を示します。
論文 参考訳(メタデータ) (2021-09-17T01:47:38Z) - Learning Optimal Prescriptive Trees from Observational Data [7.215903549622416]
混合整数最適化(MIO)技術を用いて最適規範木を学習する手法を提案する。
既存の文献とは対照的に、我々の手法はデータをランダム化する必要がなく、2)学習木に厳密な仮定を課さず、3)ドメイン固有の制約をモデル化する能力を持っている。
論文 参考訳(メタデータ) (2021-08-31T05:38:36Z) - Compressive Summarization with Plausibility and Salience Modeling [54.37665950633147]
本稿では,候補空間に対する厳密な構文的制約を緩和し,その代わりに圧縮決定を2つのデータ駆動基準,すなわち妥当性とサリエンスに委ねることを提案する。
提案手法は,ベンチマーク要約データセット上で強いドメイン内結果を得るとともに,人間による評価により,文法的および事実的削除に対して,可算性モデルが一般的に選択されることを示す。
論文 参考訳(メタデータ) (2020-10-15T17:07:10Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。