Fugu-MT 論文翻訳(概要): The Data-Driven Censored Newsvendor Problem

論文の概要: The Data-Driven Censored Newsvendor Problem

arxiv url: http://arxiv.org/abs/2412.01763v2
Date: Wed, 18 Dec 2024 22:34:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 16:30:38.141847
Title: The Data-Driven Censored Newsvendor Problem
Title（参考訳）: データ駆動型検閲ニューズベンダー問題
Authors: Chamsi Hssaine, Sean R. Sinclair,
Abstract要約: 我々は,データ駆動型ニューズベンダー問題の検閲版について検討する。そこでは,意思決定者は,期待される過給と低給のコストを最小限に抑える順序付け量を選択する必要がある。我々のゴールは、歴史的需要の検閲の程度が、この問題に対する学習アルゴリズムのパフォーマンスにどのように影響するかを理解することである。我々は、歴史的需要検閲のレベルに適応する、自然なロバストなアルゴリズムを提案する。
参考スコア（独自算出の注目度）: 0.552480439325792
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study a censored variant of the data-driven newsvendor problem, where the decision-maker must select an ordering quantity that minimizes expected overage and underage costs based only on offline censored sales data, rather than historical demand realizations. Our goal is to understand how the degree of historical demand censoring affects the performance of any learning algorithm for this problem. To isolate this impact, we adopt a distributionally robust optimization framework, evaluating policies according to their worst-case regret over an ambiguity set of distributions. This set is defined by the largest historical order quantity (the observable boundary of the dataset), and contains all distributions matching the true demand distribution up to this boundary, while allowing them to be arbitrary afterwards. We demonstrate a spectrum of achievability under demand censoring by deriving a natural necessary and sufficient condition under which vanishing regret is an achievable goal. In regimes in which it is not, we exactly characterize the information loss due to censoring: an insurmountable lower bound on the performance of any policy, even when the decision-maker has access to infinitely many demand samples. We then leverage these sharp characterizations to propose a natural robust algorithm that adapts to the historical level of demand censoring. We derive finite-sample guarantees for this algorithm across all possible censoring regimes and show its near-optimality with matching lower bounds (up to polylogarithmic factors). We moreover demonstrate its robust performance via extensive numerical experiments on both synthetic and real-world datasets.
Abstract（参考訳）: 我々は,データ駆動型ニューズベンダー問題において,過去の需要実現ではなく,オフラインの検閲された販売データのみに基づいて,予測過給と未成年コストを最小化する注文量を選択することを求める。我々のゴールは、歴史的需要の検閲の程度が、この問題に対する学習アルゴリズムのパフォーマンスにどのように影響するかを理解することである。この影響を分離するために、分布的に堅牢な最適化フレームワークを採用し、分布のあいまいさに対する最悪の後悔に基づいてポリシーを評価する。この集合は、最大の歴史的順序量(データセットの観測可能な境界)で定義され、この境界まで真の需要分布と一致する全ての分布を含む。本研究では, 要求検閲下での達成可能性のスペクトルを, 後悔を消すことが達成可能な目標である自然的かつ十分な条件を導出することによって示す。検閲による情報損失は、たとえ意思決定者が無限に多くの需要サンプルにアクセスできたとしても、いかなる政策の実績にも及ばない低い限界である。そして、これらの鋭い特徴を利用して、歴史的需要検閲のレベルに適応する自然な堅牢なアルゴリズムを提案する。我々は、このアルゴリズムのすべての可能な検閲レギュレーションに対する有限サンプル保証を導出し、そのほぼ最適性を、一致した下界(多対数因子まで)で示す。さらに、合成と実世界の両方のデータセットに関する広範な数値実験を通して、堅牢な性能を実証する。

関連論文リスト

What is the Value of Censored Data? An Exact Analysis for the Data-driven Newsvendor [1.5469452301122175]
在庫レベルで需要が検閲され、販売のみが観察される状況について検討する。以上の結果から、この需要データに基づく政策は、売上データが蓄積されるにつれてパフォーマンスを損なう可能性が示唆された。
論文参考訳（メタデータ） (2026-02-18T20:13:02Z)
Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文参考訳（メタデータ） (2025-07-30T03:20:15Z)
COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。 COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文参考訳（メタデータ） (2025-06-25T07:04:49Z)
Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand [7.289672463326423]
オフライン機能に基づく価格と在庫管理の問題について検討する。私たちの目標は、オフラインデータセットを活用して、最適な価格と在庫管理ポリシを見積もることです。
論文参考訳（メタデータ） (2025-04-14T02:57:51Z)
Controllable Generation via Locally Constrained Resampling [77.48624621592523]
本研究では, ベイズ条件付けを行い, 制約条件下でサンプルを描画する, トラクタブルな確率的手法を提案する。提案手法はシーケンス全体を考慮し,現行のグリード法よりも大域的に最適に制約された生成を導出する。提案手法は, 有害な世代からモデル出力を分離し, 脱毒化に対する同様のアプローチより優れていることを示す。
論文参考訳（メタデータ） (2024-10-17T00:49:53Z)
Private Optimal Inventory Policy Learning for Feature-based Newsvendor with Unknown Demand [13.594765018457904]
本稿では, f-differential privacy framework内で, プライバシ保護に最適な在庫ポリシーを推定するための新しいアプローチを提案する。最適在庫推定のための畳み込み平滑化に基づくクリップ付き雑音勾配降下アルゴリズムを開発した。提案手法は,コストを極端に増大させることなく,望ましいプライバシー保護を実現することができることを示す。
論文参考訳（メタデータ） (2024-04-23T19:15:43Z)
Generalization Error Bounds for Learning under Censored Feedback [15.367801388932145]
学習理論からの一般化誤差は、以前に見つからなかったデータに対してアルゴリズムがどれだけうまく機能するかを統計的に保証する。このような境界に対する検閲されたフィードバックによるデータ非IIDnessの影響を特徴付ける。既存の一般化誤差境界がモデルの一般化保証を正しく捕捉できないことを示す。
論文参考訳（メタデータ） (2024-04-14T13:17:32Z)
Is Offline Decision Making Possible with Only Few Samples? Reliable Decisions in Data-Starved Bandits via Trust Region Enhancement [25.68354404229254]
データスターブされた設定であっても、最適な設定と競合するポリシーを見つけることが可能であることを示す。これは、少数のサンプルにのみ依存することで重要な決定をしなければならない設定において、信頼性の高い意思決定への道を開くものだ。
論文参考訳（メタデータ） (2024-02-24T03:41:09Z)
Group Fairness with Uncertainty in Sensitive Attributes [34.608332397776245]
公正な予測モデルは、ハイテイクなアプリケーションにおける少数派グループに対する偏見のある決定を緩和するために不可欠である。本稿では, 感度特性の不確実性にも拘わらず, フェアネスの目標レベルを達成するブートストラップに基づくアルゴリズムを提案する。本アルゴリズムは離散的属性と連続的属性の両方に適用可能であり,実世界の分類や回帰作業に有効である。
論文参考訳（メタデータ） (2023-02-16T04:33:00Z)
Effective Dimension in Bandit Problems under Censorship [22.269565708490468]
検閲環境におけるマルチアームとコンテキストのバンディットの問題について検討する。我々の目標は、非検閲環境向けに設計された古典的アルゴリズムの文脈における検閲による性能損失を推定することである。
論文参考訳（メタデータ） (2023-02-14T09:03:35Z)
Optimal Treatment Regimes for Proximal Causal Learning [7.672587258250301]
そこで本研究では,橋梁における結果と治療の相違に基づく最適な個別化治療体制を提案する。この新たな最適治療体制の価値関数は,文献上に存在するものよりも優れていることを示す。
論文参考訳（メタデータ） (2022-12-19T14:29:25Z)
Mitigating Algorithmic Bias with Limited Annotations [65.060639928772]
機密属性が公開されていない場合、バイアスを軽減するために、トレーニングデータの小さな部分を手動でアノテートする必要がある。本稿では,アルゴリズムバイアスの影響を最大限に排除するために,限定アノテーションを誘導する対話型フレームワークであるアクティブペナライゼーション・オブ・差別(APOD)を提案する。 APODは完全なアノテートバイアス緩和と同等のパフォーマンスを示しており、機密情報が制限された場合、APODが現実世界のアプリケーションに利益をもたらすことを実証している。
論文参考訳（メタデータ） (2022-07-20T16:31:19Z)
Byzantine-Robust Online and Offline Distributed Reinforcement Learning [60.970950468309056]
本稿では,複数のエージェントが環境を探索し,その経験を中央サーバを通じて伝達する分散強化学習環境について考察する。エージェントの$alpha$-fractionは敵対的であり、任意の偽情報を報告することができる。我々は、これらの対立エージェントの存在下で、マルコフ決定プロセスの根底にある準最適政策を特定することを模索する。
論文参考訳（メタデータ） (2022-06-01T00:44:53Z)
Sparse Feature Selection Makes Batch Reinforcement Learning More Sample Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文参考訳（メタデータ） (2020-11-08T16:48:02Z)
What are the Statistical Limits of Offline RL with Linear Function Approximation? [70.33301077240763]
オフライン強化学習は、オフライン(観測的)データを活用して、シーケンシャルな意思決定戦略の学習を導く。本研究は,提案可能なサンプル効率のオフライン強化学習を可能にする表現条件と分布条件の基本的な問題に焦点を当てる。
論文参考訳（メタデータ） (2020-10-22T17:32:13Z)
Privacy Preserving Recalibration under Domain Shift [119.21243107946555]
本稿では,差分プライバシー制約下での校正問題の性質を抽象化する枠組みを提案する。また、新しいリカレーションアルゴリズム、精度温度スケーリングを設計し、プライベートデータセットの事前処理より優れています。
論文参考訳（メタデータ） (2020-08-21T18:43:37Z)
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning [70.01650994156797]
教育医療などのバッチ強化学習において、観察データからのシーケンシャルな意思決定方針のオフ・アセスメントが必要である。我々は、ある政策の境界を推定するアプローチを開発する。より凝縮したデータを集めることで、シャープな境界への収束を証明します。
論文参考訳（メタデータ） (2020-02-11T16:18:14Z)
The Simulator: Understanding Adaptive Sampling in the Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文参考訳（メタデータ） (2017-02-16T23:42:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。