論文の概要: Data Quality Over Quantity: Pitfalls and Guidelines for Process
Analytics
- arxiv url: http://arxiv.org/abs/2211.06440v2
- Date: Wed, 5 Apr 2023 23:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 17:43:45.496189
- Title: Data Quality Over Quantity: Pitfalls and Guidelines for Process
Analytics
- Title(参考訳): 量を超えるデータ品質: プロセス分析のための落とし穴とガイドライン
- Authors: Lim C. Siang, Shams Elnawawi, Lee D. Rippon, Daniel L. O'Connor and R.
Bhushan Gopaluni
- Abstract要約: データ前処理は、現実の人工知能アプリケーションの成功に大きな影響を与えている。
本稿では,産業時系列データの事前処理に関する実践的考察を行い,信頼性の高いソフトセンサの効率的な開発について報告する。
- 参考スコア(独自算出の注目度): 0.8399688944263843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A significant portion of the effort involved in advanced process control,
process analytics, and machine learning involves acquiring and preparing data.
Literature often emphasizes increasingly complex modelling techniques with
incremental performance improvements. However, when industrial case studies are
published they often lack important details on data acquisition and
preparation. Although data pre-processing is unfairly maligned as trivial and
technically uninteresting, in practice it has an out-sized influence on the
success of real-world artificial intelligence applications. This work describes
best practices for acquiring and preparing operating data to pursue data-driven
modelling and control opportunities in industrial processes. We present
practical considerations for pre-processing industrial time series data to
inform the efficient development of reliable soft sensors that provide valuable
process insights.
- Abstract(参考訳): 高度なプロセス制御、プロセス分析、マシンラーニングに関わる作業の大部分は、データの取得と準備に関するものだ。
文学は、インクリメンタルなパフォーマンス改善を伴う、ますます複雑なモデリング技術を強調している。
しかし、産業ケーススタディが発行されると、しばしばデータ取得と準備に関する重要な詳細が欠落する。
データ前処理は不公平に自明で技術的に興味をそそらないものだが、実際には現実世界の人工知能アプリケーションの成功に大きな影響を与えている。
本研究は,産業プロセスにおけるデータ駆動モデリングと制御機会を追求するための運用データの獲得と準備のためのベストプラクティスについて述べる。
本稿では,産業時系列データの事前処理に関する実践的考察を行い,重要なプロセスインサイトを提供する信頼性の高いソフトセンサの開発について報告する。
関連論文リスト
- Machine learning for industrial sensing and control: A survey and
practical perspective [7.678648424345052]
プロセス産業で実際に成功している重要な統計および機械学習技術を特定する。
ソフトセンシングは、統計学と機械学習の手法の多くの産業応用を含んでいる。
データ駆動最適化と制御のための2つの異なるフレーバーについて考察する。
論文 参考訳(メタデータ) (2024-01-24T22:27:04Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM
for Cyber-Physical Production Systems [63.62764375279861]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - Tailoring Machine Learning for Process Mining [5.237999056930947]
我々は、プロセスマイニングと機械学習の健全な統合を構築する上で、機械学習モデルをプロセスデータでトレーニングすることで生じる問題に対する深い洞察が不可欠であると主張している。
本研究の目的は,機械学習とプロセスマイニングの要件を正しく整合させることを目的とした方法論の基礎を構築することである。
論文 参考訳(メタデータ) (2023-06-17T12:59:51Z) - On Efficient Training of Large-Scale Deep Learning Models: A Literature
Review [90.87691246153612]
ディープラーニングの分野は特にコンピュータビジョン(CV)、自然言語処理(NLP)、音声などにおいて大きな進歩を遂げている。
大量のデータに基づいてトレーニングされた大規模なモデルを使用することは、実用的なアプリケーションにとって大きな可能性を秘めている。
計算能力の需要が増大する中で、ディープラーニングモデルの訓練の加速技術に関する包括的な要約が期待されている。
論文 参考訳(メタデータ) (2023-04-07T11:13:23Z) - Explainable Artificial Intelligence for Improved Modeling of Processes [6.29494485203591]
我々は,現代的なトランスフォーマーアーキテクチャと,より古典的なプロセス規則性モデリングの機械学習技術の性能を評価する。
MLモデルは重要な結果を予測することができ、注意機構やXAIコンポーネントが基礎となるプロセスに新たな洞察を与えることを示す。
論文 参考訳(メタデータ) (2022-12-01T17:56:24Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Process-BERT: A Framework for Representation Learning on Educational
Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。
我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。
当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文 参考訳(メタデータ) (2022-04-28T16:07:28Z) - Generating Privacy-Preserving Process Data with Deep Generative Models [7.3268099910347715]
プロセスデータ生成のための逆生成ネットワーク(ProcessGAN)を導入する。
我々は6つの実世界のデータセット上でProcessGANと従来のモデルを評価する。
我々は,プロセスGANが,認証データと区別できない大量の共有可能な合成プロセスデータを生成することができると結論付けた。
論文 参考訳(メタデータ) (2022-03-15T14:29:54Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - AI-based Modeling and Data-driven Evaluation for Smart Manufacturing
Processes [56.65379135797867]
本稿では,半導体製造プロセスに関する有用な知見を得るための動的アルゴリズムを提案する。
本稿では,遺伝的アルゴリズムとニューラルネットワークを利用して,知的特徴選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-29T14:57:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。