論文の概要: Quality vs. Quantity of Data in Contextual Decision-Making: Exact
Analysis under Newsvendor Loss
- arxiv url: http://arxiv.org/abs/2302.08424v1
- Date: Thu, 16 Feb 2023 17:03:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 13:10:55.705126
- Title: Quality vs. Quantity of Data in Contextual Decision-Making: Exact
Analysis under Newsvendor Loss
- Title(参考訳): 文脈意思決定における品質対データ量--ニューズベンダー損失下の厳密な分析
- Authors: Omar Besbes, Will Ma, Omar Mouchtaki
- Abstract要約: データ駆動型コンテクスト意思決定と品質とデータ量のパフォーマンスへの影響について検討する。
我々は、カーネルポリシーの最悪の後悔を正確に評価する一連の結果を開発した。
- 参考スコア(独自算出の注目度): 2.9603743540540357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When building datasets, one needs to invest time, money and energy to either
aggregate more data or to improve their quality. The most common practice
favors quantity over quality without necessarily quantifying the trade-off that
emerges. In this work, we study data-driven contextual decision-making and the
performance implications of quality and quantity of data. We focus on
contextual decision-making with a Newsvendor loss. This loss is that of a
central capacity planning problem in Operations Research, but also that
associated with quantile regression. We consider a model in which outcomes
observed in similar contexts have similar distributions and analyze the
performance of a classical class of kernel policies which weigh data according
to their similarity in a contextual space. We develop a series of results that
lead to an exact characterization of the worst-case expected regret of these
policies. This exact characterization applies to any sample size and any
observed contexts. The model we develop is flexible, and captures the case of
partially observed contexts. This exact analysis enables to unveil new
structural insights on the learning behavior of uniform kernel methods: i) the
specialized analysis leads to very large improvements in quantification of
performance compared to state of the art general purpose bounds. ii) we show an
important non-monotonicity of the performance as a function of data size not
captured by previous bounds; and iii) we show that in some regimes, a little
increase in the quality of the data can dramatically reduce the amount of
samples required to reach a performance target. All in all, our work
demonstrates that it is possible to quantify in a precise fashion the interplay
of data quality and quantity, and performance in a central problem class. It
also highlights the need for problem specific bounds in order to understand the
trade-offs at play.
- Abstract(参考訳): データセットを構築する場合、より多くのデータを集約するか、品質を改善するために時間、お金、エネルギーを投資する必要がある。
最も一般的なプラクティスは、生まれるトレードオフを必ずしも定量化せずに、品質よりも量を好むことです。
本研究では,データ駆動型文脈意思決定と,データ品質と量のパフォーマンスへの影響について検討する。
ニュースベンダの損失を伴うコンテキスト意思決定に重点を置いています。
この損失は運用研究における中心的なキャパシティ計画の問題であるが、質的回帰に関連する問題でもある。
類似した文脈で観測された結果が類似した分布を持つモデルを考え、文脈空間における類似性に応じてデータを測定する古典的なカーネルポリシーのクラスの性能を分析する。
我々は、これらのポリシーの最悪のケースで予想される後悔を正確に特徴づける一連の結果を開発した。
この正確な特徴は、あらゆるサンプルサイズと観察されたコンテキストに適用できる。
私たちが開発するモデルは柔軟で、部分的に観察されたコンテキストのケースをキャプチャします。
この正確な分析により、均一なカーネル手法の学習行動に関する新しい構造的洞察が明らかにされる。
一 専門的な分析により、技術一般の目的の範囲に比べて、性能の定量化が大幅に改善される。
二 前の境界に収まらないデータサイズの関数として、性能の重要な非単調性を示すこと。
iii)一部のレジームでは、データの品質が少し向上すれば、パフォーマンス目標に達するのに必要なサンプルの量を劇的に削減できることを示す。
全体として、私たちの研究は、データ品質と量、そして中央の問題クラスにおけるパフォーマンスを正確な方法で定量化できることを示しています。
また、プレイ中のトレードオフを理解するために、問題固有の境界の必要性を強調します。
関連論文リスト
- Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [61.580419063416734]
最近の構造化学習手法のストリームは、様々な最適化問題に対する技術の実践的状態を改善している。
鍵となる考え方は、インスタンスを別々に扱うのではなく、インスタンス上の統計分布を利用することだ。
本稿では,最適化を容易にし,一般化誤差を改善するポリシを摂動することでリスクを円滑にする手法について検討する。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - Importance-Weighted Offline Learning Done Right [16.4989952150404]
文脈的帯域幅問題におけるオフラインポリシー最適化の問題について検討する。
目標は、準最適行動ポリシーによって収集された決定データのデータセットに基づいて、ほぼ最適ポリシーを学ぶことである。
我々は、citet2015の「単純探索」推定に基づく単純な代替手法が、過去の全ての結果よりもほぼ全ての可能な条件で優れた性能保証を与えることを示した。
論文 参考訳(メタデータ) (2023-09-27T16:42:10Z) - Provably Efficient Learning in Partially Observable Contextual Bandit [4.910658441596583]
古典的帯域幅アルゴリズムの改善に因果境界をどのように適用できるかを示す。
本研究は,実世界の応用における文脈的包括的エージェントの性能を高める可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-07T13:24:50Z) - Online learning in bandits with predicted context [8.257280652461159]
エージェントがコンテキストの騒々しいバージョンにしかアクセスできない場合、コンテキスト的帯域幅の問題を考える。
この設定は、意思決定の真のコンテキストが守られない広範囲のアプリケーションによって動機付けられている。
本研究では,この設定において,軽度条件下でのサブ線形後悔保証を用いた最初のオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-26T02:33:54Z) - Robust Data-driven Prescriptiveness Optimization [4.792851066169871]
本稿では、古典的経験的リスク目標最小化に代えて、規範性の係数が代わる分布的ロバストな文脈最適化モデルを提案する。
サンプル外データセットが様々な分散シフトを受ける場合の代替手法に対する結果のロバスト性を評価する。
論文 参考訳(メタデータ) (2023-06-09T14:56:06Z) - A Unified Framework of Policy Learning for Contextual Bandit with
Confounding Bias and Missing Observations [108.89353070722497]
本研究では,観測データを用いた最適ポリシの獲得を目的とした,オフラインのコンテキスト的帯域幅問題について検討する。
本稿では、積分方程式系の解として報酬関数を形成するCausal-Adjusted Pessimistic(CAP)ポリシー学習という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-20T15:17:31Z) - Contextual Model Aggregation for Fast and Robust Federated Learning in
Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。
既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。
そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T21:42:31Z) - Off-Policy Evaluation with Policy-Dependent Optimization Response [90.28758112893054]
我々は,テキスト政治に依存した線形最適化応答を用いた非政治評価のための新しいフレームワークを開発した。
摂動法による政策依存推定のための非バイアス推定器を構築する。
因果介入を最適化するための一般的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-25T20:25:37Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Privacy-Constrained Policies via Mutual Information Regularized Policy Gradients [54.98496284653234]
報酬を最大化しつつ、行動を通じて特定の機密状態変数の開示を最小限に抑えながら、報酬を最大化する政策を訓練する課題を考察する。
本稿では, 感性状態と行動の相互情報に基づく正則化器を導入することで, この問題を解決する。
プライバシ制約のあるポリシーを最適化するためのモデルベース推定器を開発した。
論文 参考訳(メタデータ) (2020-12-30T03:22:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。