論文の概要: Fixing Inventory Inaccuracies At Scale
- arxiv url: http://arxiv.org/abs/2006.13126v3
- Date: Wed, 13 Jul 2022 22:32:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 22:18:31.329976
- Title: Fixing Inventory Inaccuracies At Scale
- Title(参考訳): 在庫不正確性を大規模に修正する
- Authors: Vivek F. Farias, Andrew A. Li, Tianyi Peng
- Abstract要約: 不正確な在庫記録が頻繁に発生し、一部では小売業者が年商の約4%を負担している。
店舗とSKUの横断的なデータに基づくソリューションを提案する。
提案手法は,既存の異常検出手法に比べて最大10倍のコスト削減を実現する。
- 参考スコア(独自算出の注目度): 8.347058637480506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inaccurate records of inventory occur frequently, and by some measures cost
retailers approximately 4% in annual sales. Detecting inventory inaccuracies
manually is cost-prohibitive, and existing algorithmic solutions rely almost
exclusively on learning from longitudinal data, which is insufficient in the
dynamic environment induced by modern retail operations. Instead, we propose a
solution based on cross-sectional data over stores and SKUs, observing that
detecting inventory inaccuracies can be viewed as a problem of identifying
anomalies in a (low-rank) Poisson matrix. State-of-the-art approaches to
anomaly detection in low-rank matrices apparently fall short. Specifically,
from a theoretical perspective, recovery guarantees for these approaches
require that non-anomalous entries be observed with vanishingly small noise
(which is not the case in our problem, and indeed in many applications).
So motivated, we propose a conceptually simple entry-wise approach to anomaly
detection in low-rank Poisson matrices. Our approach accommodates a general
class of probabilistic anomaly models. We show that the cost incurred by our
algorithm approaches that of an optimal algorithm at a min-max optimal rate.
Using synthetic data and real data from a consumer goods retailer, we show that
our approach provides up to a 10x cost reduction over incumbent approaches to
anomaly detection. Along the way, we build on recent work that seeks entry-wise
error guarantees for matrix completion, establishing such guarantees for
sub-exponential matrices, a result of independent interest.
- Abstract(参考訳): 不正確な在庫記録が頻繁に発生し、一部では小売業者が年商の約4%を負担している。
在庫の不正確さを手動で検出するコストは高く、既存のアルゴリズムソリューションは、現代の小売業務によって引き起こされる動的環境に不足する縦断データからの学習にほとんど依存している。
代わりに、店舗やSKU上の断面データに基づくソリューションを提案し、在庫不正確な検出を(低ランクの)ポアソン行列における異常を識別する問題とみなすことができる。
低ランク行列における異常検出に対する最先端のアプローチは、明らかに不足している。
具体的には、理論的な観点からは、これらのアプローチのリカバリの保証は、消失するほど小さなノイズ(我々の問題ではそうではないし、多くのアプリケーションではそうではない)で非異常なエントリを観察する必要がある。
そこで我々は,低ランクポアソン行列における異常検出に対する概念的に簡単なエントリーワイズアプローチを提案する。
本手法は確率的異常モデルの一般的なクラスに対応する。
提案手法では, 最適アルゴリズムのコストを min-max の最適速度で近似する。
消費者商品小売業者の合成データと実データを用いて,本手法が既存の異常検出手法に比べて最大10倍のコスト削減をもたらすことを示す。
その過程で,行列完備化のエントリーワイドなエラー保証を求める最近の研究に基づいて,独立な関心の結果として,部分指数行列の保証を確立する。
関連論文リスト
- Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Minimax and Communication-Efficient Distributed Best Subset Selection with Oracle Property [0.358439716487063]
大規模データの爆発はシングルマシンシステムの処理能力を上回っている。
分散推論への伝統的なアプローチは、高次元データセットにおいて真の疎性を達成するのにしばしば苦労する。
そこで本稿では,これらの問題に対処する2段階分散ベストサブセット選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-30T13:22:08Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - RoSAS: Deep Semi-Supervised Anomaly Detection with
Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。
当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文 参考訳(メタデータ) (2023-07-25T04:04:49Z) - Active Learning in the Predict-then-Optimize Framework: A Margin-Based
Approach [5.371816551086118]
本研究では,ラベルのないデータストリームから特徴サンプルのラベルを要求するかどうかを逐次決定する学習手法を開発した。
我々の能動学習法は,予測パラメータによって引き起こされる決定誤差によって直接情報を得る最初の方法である。
論文 参考訳(メタデータ) (2023-05-11T05:44:36Z) - Explaining Anomalies using Denoising Autoencoders for Financial Tabular
Data [5.071227866936205]
本稿では,混合型表型データ用に設計された自動エンコーダを用いて,異常を記述するためのフレームワークを提案する。
これは、個々のサンプル列を潜在的なエラーでローカライズし、対応する信頼スコアを割り当てることによって達成される。
本フレームワークは,データ品質管理プロセスの改善とともに,異常の異常な特徴をドメインの専門家が理解できるように設計されている。
論文 参考訳(メタデータ) (2022-09-21T21:02:22Z) - Minimax rate of consistency for linear models with missing values [0.0]
多くの実世界のデータセットでは、複数のソースが集約され、本質的に欠落した情報(センサーの故障、調査における未回答の疑問...)が欠落する。
本稿では,広範に研究された線形モデルに焦点をあてるが,不足する値が存在する場合には,非常に難しい課題であることが判明した。
最終的には、多くの学習タスクを解決し、入力機能の数を指数関数的にすることで、現在の現実世界のデータセットでは予測が不可能になる。
論文 参考訳(メタデータ) (2022-02-03T08:45:34Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。