論文の概要: Applying Machine Learning for Duplicate Detection, Throttling and
Prioritization of Equipment Commissioning Audits at Fulfillment Network
- arxiv url: http://arxiv.org/abs/2209.14409v1
- Date: Wed, 28 Sep 2022 20:40:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 16:45:55.130984
- Title: Applying Machine Learning for Duplicate Detection, Throttling and
Prioritization of Equipment Commissioning Audits at Fulfillment Network
- Title(参考訳): フルフィルメントネットワークにおける監査機器の重複検出・スロットリング・優先化のための機械学習の適用
- Authors: Farouq Halawa, Majid Abdul, Raashid Mohammed
- Abstract要約: VQ(Vendor Qualification)とIOQ(Installation and Operation Qualification)監査は倉庫で実施され、すべての機器が品質基準を満たしている。
この作業では、自然言語処理と機械学習を使用して、倉庫のネットワーク用の大規模なチェックリストデータセットをトリムする。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: VQ (Vendor Qualification) and IOQ (Installation and Operation Qualification)
audits are implemented in warehouses to ensure all equipment being turned over
in the fulfillment network meets the quality standards. Audit checks are likely
to be skipped if there are many checks to be performed in a short time. In
addition, exploratory data analysis reveals several instances of similar checks
being performed on the same assets and thus, duplicating the effort. In this
work, Natural Language Processing and Machine Learning are applied to trim a
large checklist dataset for a network of warehouses by identifying similarities
and duplicates, and predict the non-critical ones with a high passing rate. The
study proposes ML classifiers to identify checks which have a high passing
probability of IOQ and VQ and assign priorities to checks to be prioritized
when the time is not available to perform all checks. This research proposes
using NLP-based BlazingText classifier to throttle the checklists with a high
passing rate, which can reduce 10%-37% of the checks and achieve significant
cost reduction. The applied algorithm over performs Random Forest and Neural
Network classifiers and achieves an area under the curve of 90%. Because of
imbalanced data, down-sampling and upweighting have shown a positive impact on
the models' accuracy using F1 score, which improve from 8% to 75%. In addition,
the proposed duplicate detection process identifies 17% possible redundant
checks to be trimmed.
- Abstract(参考訳): VQ (Vendor Qualification) とIOQ (Installation and Operation Qualification) の監査は倉庫で実施され、フルフィルメントネットワークにあるすべての機器が品質基準を満たすことを保証する。
短時間で実施すべき多くのチェックがある場合、監査チェックはスキップされる可能性が高い。
さらに、探索データ分析により、類似したチェックが同じ資産で実施されているいくつかの事例が明らかになった。
本研究は,自然言語処理と機械学習を適用し,類似点や重複点を識別することで,倉庫網の大規模チェックリストデータセットをトリミングし,非クリティカルなデータセットを高いパスレートで予測する。
本研究は,IOQとVQの確率が高いチェックを識別するML分類器を提案する。
本研究では,NLPベースのBlazingText分類器を用いて,チェックリストの10%~37%を削減し,大幅なコスト削減を実現することを提案する。
適用されたアルゴリズムはランダムフォレストとニューラルネットワークの分類を行い、曲線の90%以下の領域を達成する。
不均衡なデータのため、ダウンサンプリングとアップウェイトはF1スコアを使用してモデルの精度に肯定的な影響を示し、8%から75%に改善した。
さらに,提案する重複検出プロセスでは,冗長なチェックをトリミングする可能性のある17%を同定する。
関連論文リスト
- Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Fake detection in imbalance dataset by Semi-supervised learning with GAN [1.4542411354617986]
本研究は,100個のラベル付きサンプルを用いた偽アカウントの検出において,81%の精度を達成し,この分野に寄与する。
これは、マイノリティクラスを扱い、偽アカウント検出におけるビッグデータの問題に対処するための強力なツールとしてのSGANの可能性を示している。
論文 参考訳(メタデータ) (2022-12-02T10:22:18Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - Anomaly Detection with Test Time Augmentation and Consistency Evaluation [13.709281244889691]
本稿では,TTA-AD(Test Time Augmentation Anomaly Detection)と呼ばれる簡易かつ効果的な異常検出アルゴリズムを提案する。
我々は、分散データよりもトレーニングされたネットワーク上でのオリジナルバージョンと拡張バージョンについて、分散データの方が一貫性のある予測を楽しむことを観察した。
様々な高解像度画像ベンチマークデータセットの実験は、TTA-ADが同等またはより良い検出性能を達成することを示した。
論文 参考訳(メタデータ) (2022-06-06T04:27:06Z) - Certified Error Control of Candidate Set Pruning for Two-Stage Relevance
Ranking [57.42241521034744]
本稿では、妥当性ランキングのための候補セットプルーニングの認証エラー制御の概念を提案する。
提案手法は,第1段階から抽出した候補集合を抽出し,第2段階の復位速度を向上する。
論文 参考訳(メタデータ) (2022-05-19T16:00:13Z) - Little Help Makes a Big Difference: Leveraging Active Learning to
Improve Unsupervised Time Series Anomaly Detection [2.1684857243537334]
予期せぬネットワークインシデントを検出するために,多数の異常検出アルゴリズムがデプロイされている。
教師なし異常検出アルゴリズムは、しばしば過度の誤報に悩まされる。
本稿では,オペレータのフィードバックの導入とメリットをアクティブな学習に活用することを提案する。
論文 参考訳(メタデータ) (2022-01-25T13:54:19Z) - Decision-forest voting scheme for classification of rare classes in
network intrusion detection [0.0]
本研究の目的は,オペレーティングマルウェア検出システムの検出能力を向上することである。
このアルゴリズムは、大量のデータを効果的に処理し、意思決定林の訓練に使用される最先端のアルゴリズムのほとんどと併用することができる。
論文 参考訳(メタデータ) (2021-07-25T18:01:12Z) - Enabling certification of verification-agnostic networks via
memory-efficient semidefinite programming [97.40955121478716]
本稿では,ネットワークアクティベーションの総数にのみ線形なメモリを必要とする一階二重SDPアルゴリズムを提案する。
L-inf の精度は 1% から 88% ,6% から 40% に改善した。
また,変分オートエンコーダの復号器に対する2次安定性仕様の厳密な検証を行った。
論文 参考訳(メタデータ) (2020-10-22T12:32:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。