論文の概要: Beyond IID: data-driven decision-making in heterogeneous environments
- arxiv url: http://arxiv.org/abs/2206.09642v1
- Date: Mon, 20 Jun 2022 08:43:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 15:20:30.641028
- Title: Beyond IID: data-driven decision-making in heterogeneous environments
- Title(参考訳): beyond iid: 異種環境におけるデータ駆動意思決定
- Authors: Omar Besbes, Will Ma and Omar Mouchtaki
- Abstract要約: 本稿では,未知の分布と異なる分布から歴史的サンプルを生成する新しい枠組みを提案する。
私たちは、中心的なデータ駆動ポリシーによって達成可能な最悪の後悔を定量化します。
- 参考スコア(独自算出の注目度): 2.9603743540540357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study data-driven decision-making and depart from the
classical identically and independently distributed (i.i.d.) assumption. We
present a new framework in which historical samples are generated from unknown
and different distributions, which we dub heterogeneous environments. These
distributions are assumed to lie in a heterogeneity ball with known radius and
centered around the (also) unknown future (out-of-sample) distribution on which
the performance of a decision will be evaluated. We quantify the asymptotic
worst-case regret that is achievable by central data-driven policies such as
Sample Average Approximation, but also by rate-optimal ones, as a function of
the radius of the heterogeneity ball. Our work shows that the type of
achievable performance varies considerably across different combinations of
problem classes and notions of heterogeneity. We demonstrate the versatility of
our framework by comparing achievable guarantees for the heterogeneous version
of widely studied data-driven problems such as pricing, ski-rental, and
newsvendor. En route, we establish a new connection between data-driven
decision-making and distributionally robust optimization.
- Abstract(参考訳): 本研究では,データ駆動意思決定の研究を行い,同一かつ独立に分布する(i.i.d.)仮定から脱却する。
本稿では,異種環境を想定した未知分布と異なる分布から歴史サンプルを生成する新しい枠組みを提案する。
これらの分布は、既知の半径を持つ不均一性球の中にあり、決定の実行性を評価する未知の未来(サンプル外)分布を中心としていると仮定される。
サンプル平均近似やレート最適化といった中央データ駆動政策によって達成可能な漸近的最悪事例の後悔を、異種球の半径関数として定量化する。
本研究は,問題クラスと異質性の概念の組み合わせによって,達成可能な性能のタイプがかなり変化することを示す。
我々は,価格,スキーレンタル,ニュースベンドルなど,広く研究されているデータ駆動問題の異種バージョンに対する達成可能な保証を比較することで,フレームワークの汎用性を示す。
その過程で,データ駆動意思決定と分散的ロバストな最適化との新たな接続を確立する。
関連論文リスト
- Training Implicit Generative Models via an Invariant Statistical Loss [3.139474253994318]
暗黙的な生成モデルは任意の複雑なデータ分布を学習する能力を持つ。
マイナス面として、トレーニングでは、敵対的判別器を使用して人工的に生成されたデータと実際のデータを区別する必要がある。
本研究では,1次元(1次元)生成暗黙的モデルを学習するための判別器フリーな手法を開発した。
論文 参考訳(メタデータ) (2024-02-26T09:32:28Z) - Towards stable real-world equation discovery with assessing
differentiating quality influence [52.2980614912553]
一般的に用いられる有限差分法に代わる方法を提案する。
我々は,これらの手法を実問題と類似した問題に適用可能であること,および方程式発見アルゴリズムの収束性を確保する能力の観点から評価する。
論文 参考訳(メタデータ) (2023-11-09T23:32:06Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Differentiable Invariant Causal Discovery [106.87950048845308]
観測データから因果構造を学ぶことは、機械学習の基本的な課題である。
本稿では,不特定変分因果解法(DICD)を提案する。
合成および実世界のデータセットに関する大規模な実験は、DICDがSHDの36%まで最先端の因果発見手法より優れていることを検証している。
論文 参考訳(メタデータ) (2022-05-31T09:29:07Z) - Variance-Reduced Heterogeneous Federated Learning via Stratified Client
Selection [31.401919362978017]
本稿では,収束性の向上と精度の向上を図るため,新たな階層化クライアント選択方式を提案する。
地層変動の多様性を考慮し,最適化されたサンプルサイズ割当方式を提案する。
実験結果から,本手法は最先端の手法と比較して性能が向上するだけでなく,一般的なFLアルゴリズムと互換性があることが確認された。
論文 参考訳(メタデータ) (2022-01-15T05:41:36Z) - Robust classification with flexible discriminant analysis in
heterogeneous data [0.7646713951724009]
本稿では、各データポイントを任意のスケールパラメータで描画する、新しいロバスト判別分析を提案する。
パラメータの最大値の推定と分類は、最先端の手法と比較して非常に単純で、高速で、堅牢である。
論文 参考訳(メタデータ) (2022-01-09T09:22:56Z) - A Subsampling-Based Method for Causal Discovery on Discrete Data [18.35147325731821]
本研究では,原因発生方式とメカニズムの独立性をテストするためのサブサンプリング方式を提案する。
我々の手法は、離散データと分類データの両方で機能し、データ上の機能的モデルを含まないため、より柔軟なアプローチである。
論文 参考訳(メタデータ) (2021-08-31T17:11:58Z) - Decentralized Local Stochastic Extra-Gradient for Variational
Inequalities [125.62877849447729]
我々は、不均一(非IID)で多くのデバイスに分散する問題データを持つ領域上での分散変分不等式(VIs)を考察する。
我々は、完全に分散化された計算の設定を網羅する計算ネットワークについて、非常に一般的な仮定を行う。
理論的には, モノトン, モノトンおよび非モノトンセッティングにおける収束速度を理論的に解析する。
論文 参考訳(メタデータ) (2021-06-15T17:45:51Z) - Goal-oriented adaptive sampling under random field modelling of response
probability distributions [0.6445605125467573]
応答分布の空間的変動がそれらの平均および/または分散だけでなく、例えば、形状や一様性、多様性などを含む他の特徴も考慮する。
我々の貢献は、それによって引き起こされる確率分布の場をモデル化する非パラメトリックベイズアプローチに基づいている。
論文 参考訳(メタデータ) (2021-02-15T15:55:23Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Heteroskedastic and Imbalanced Deep Learning with Adaptive
Regularization [55.278153228758434]
実世界のデータセットはヘテロスケダティックで不均衡である。
ヘテロスケダスティック性と不均衡を同時に扱うことは、未発見である。
本稿ではヘテロスケダスティックデータセットに対するデータ依存正規化手法を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。