論文の概要: Beyond IID: data-driven decision-making in heterogeneous environments
- arxiv url: http://arxiv.org/abs/2206.09642v1
- Date: Mon, 20 Jun 2022 08:43:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 15:20:30.641028
- Title: Beyond IID: data-driven decision-making in heterogeneous environments
- Title(参考訳): beyond iid: 異種環境におけるデータ駆動意思決定
- Authors: Omar Besbes, Will Ma and Omar Mouchtaki
- Abstract要約: 本稿では,未知の分布と異なる分布から歴史的サンプルを生成する新しい枠組みを提案する。
私たちは、中心的なデータ駆動ポリシーによって達成可能な最悪の後悔を定量化します。
- 参考スコア(独自算出の注目度): 2.9603743540540357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study data-driven decision-making and depart from the
classical identically and independently distributed (i.i.d.) assumption. We
present a new framework in which historical samples are generated from unknown
and different distributions, which we dub heterogeneous environments. These
distributions are assumed to lie in a heterogeneity ball with known radius and
centered around the (also) unknown future (out-of-sample) distribution on which
the performance of a decision will be evaluated. We quantify the asymptotic
worst-case regret that is achievable by central data-driven policies such as
Sample Average Approximation, but also by rate-optimal ones, as a function of
the radius of the heterogeneity ball. Our work shows that the type of
achievable performance varies considerably across different combinations of
problem classes and notions of heterogeneity. We demonstrate the versatility of
our framework by comparing achievable guarantees for the heterogeneous version
of widely studied data-driven problems such as pricing, ski-rental, and
newsvendor. En route, we establish a new connection between data-driven
decision-making and distributionally robust optimization.
- Abstract(参考訳): 本研究では,データ駆動意思決定の研究を行い,同一かつ独立に分布する(i.i.d.)仮定から脱却する。
本稿では,異種環境を想定した未知分布と異なる分布から歴史サンプルを生成する新しい枠組みを提案する。
これらの分布は、既知の半径を持つ不均一性球の中にあり、決定の実行性を評価する未知の未来(サンプル外)分布を中心としていると仮定される。
サンプル平均近似やレート最適化といった中央データ駆動政策によって達成可能な漸近的最悪事例の後悔を、異種球の半径関数として定量化する。
本研究は,問題クラスと異質性の概念の組み合わせによって,達成可能な性能のタイプがかなり変化することを示す。
我々は,価格,スキーレンタル,ニュースベンドルなど,広く研究されているデータ駆動問題の異種バージョンに対する達成可能な保証を比較することで,フレームワークの汎用性を示す。
その過程で,データ駆動意思決定と分散的ロバストな最適化との新たな接続を確立する。
関連論文リスト
- Stochastic Gradient Descent with Adaptive Data [4.119418481809095]
勾配降下(SGD)は、オンライン学習シナリオにおいて特に有用である強力な最適化手法である。
オペレーションリサーチにおけるポリシー最適化問題へのSGDの適用には、環境を変えてポリシー更新に使用するデータに影響を与えるという、明確な課題が伴う。
過去の決定が生成したデータに与える影響は、勾配推定におけるバイアスを導入し、iidケースに存在しないオンライン学習の不安定性の潜在的な原因を示す。
適応データによるSGDの収束速度は, 政策誘起力学の混合時間に係わる限り, 古典的イド設定とほとんど同様であることを示す。
論文 参考訳(メタデータ) (2024-10-02T02:58:32Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [61.580419063416734]
最近の構造化学習手法のストリームは、様々な最適化問題に対する技術の実践的状態を改善している。
鍵となる考え方は、インスタンスを別々に扱うのではなく、インスタンス上の統計分布を利用することだ。
本稿では,最適化を容易にし,一般化誤差を改善するポリシを摂動することでリスクを円滑にする手法について検討する。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - It's All in the Mix: Wasserstein Machine Learning with Mixed Features [5.739657897440173]
混合機能問題の解法として,実用的なアルゴリズムを提案する。
提案手法は, 個々の特徴が存在する場合の既存手法を著しく上回りうることを示す。
論文 参考訳(メタデータ) (2023-12-19T15:15:52Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Integrated Conditional Estimation-Optimization [6.037383467521294]
確率のある不確実なパラメータを文脈的特徴情報を用いて推定できる実世界の多くの最適化問題である。
不確実なパラメータの分布を推定する標準的な手法とは対照的に,統合された条件推定手法を提案する。
当社のI CEOアプローチは、穏健な条件下で理論的に一貫性があることを示します。
論文 参考訳(メタデータ) (2021-10-24T04:49:35Z) - Complexity-Free Generalization via Distributionally Robust Optimization [4.313143197674466]
分散ロバスト最適化(DRO)から解の一般化境界を得るための代替経路を提案する。
我々の DRO 境界は、あいまいな集合の幾何と真の損失関数との整合性に依存する。
特に、DRO距離計量として最大平均誤差を用いる場合、我々の分析は、我々の知識の最も良いところは、真の損失関数にのみ依存する文献における第一の一般化であることを示している。
論文 参考訳(メタデータ) (2021-06-21T15:19:52Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Kidney Exchange with Inhomogeneous Edge Existence Uncertainty [33.17472228570093]
我々は一致したサイクルとチェーンパッキングの問題の最大化を目指しており、そこでは障害の端まで有向グラフ内の構造を識別することを目的としている。
ユナイテッド・フォー・シェアリング(SUNO)のデータに対する我々のアプローチは、SAAベースの手法と同じ重み付けでより良いパフォーマンスを提供する。
論文 参考訳(メタデータ) (2020-07-07T04:08:39Z) - Learning Overlapping Representations for the Estimation of
Individualized Treatment Effects [97.42686600929211]
観測データから代替案の可能性を推定することは難しい問題である。
入力のドメイン不変表現を学習するアルゴリズムは、しばしば不適切であることを示す。
我々は,様々なベンチマークデータセットの最先端性を大幅に向上させる,ディープカーネル回帰アルゴリズムと後続正規化フレームワークを開発した。
論文 参考訳(メタデータ) (2020-01-14T12:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。