論文の概要: Data Quality Over Quantity: Pitfalls and Guidelines for Process
Analytics
- arxiv url: http://arxiv.org/abs/2211.06440v1
- Date: Fri, 11 Nov 2022 19:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 20:20:01.809435
- Title: Data Quality Over Quantity: Pitfalls and Guidelines for Process
Analytics
- Title(参考訳): 量を超えるデータ品質: プロセス分析のための落とし穴とガイドライン
- Authors: Lim C. Siang, Shams Elnawawi, Lee D. Rippon, Daniel L. O'Connor and R.
Bhushan Gopaluni
- Abstract要約: データ前処理は、現実の人工知能アプリケーションの成功に大きな影響を与えている。
本研究は,産業プロセスにおけるデータ駆動型モデリングと制御の機会を追求するために,運用データの取得と準備を行うベストプラクティスについて述べる。
- 参考スコア(独自算出の注目度): 0.8399688944263843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A significant portion of the effort involved in advanced process control,
process analytics, and machine learning involves acquiring and preparing data.
The published literature often emphasizes increasingly complex modeling
techniques with incremental performance improvements. However, when industrial
case studies are published they often lack important details on data
acquisition and preparation. Although data pre-processing is often unfairly
maligned as trivial and technically uninteresting, in practice it has an
out-sized influence on the success of real-world artificial intelligence
applications. This work describes best practices for acquiring and preparing
operating data to pursue data-driven modelling and control opportunities in
industrial processes. We present practical considerations for pre-processing
industrial time series data to inform the efficient development of reliable
soft sensors that provide valuable process insights.
- Abstract(参考訳): 高度なプロセス制御、プロセス分析、マシンラーニングに関わる作業の大部分は、データの取得と準備に関するものだ。
出版された文献は、漸進的なパフォーマンス改善を伴う、ますます複雑なモデリング技術を強調している。
しかし、産業ケーススタディが発行されると、しばしばデータ取得と準備に関する重要な詳細が欠落する。
データ前処理はしばしば、自明で技術的には興味のないものとして不公平に調整されるが、現実の人工知能アプリケーションの成功に大きな影響を与えている。
本研究は,産業プロセスにおけるデータ駆動モデリングと制御機会を追求するための運用データの獲得と準備のためのベストプラクティスについて述べる。
本稿では,産業時系列データの事前処理に関する実践的考察を行い,重要なプロセスインサイトを提供する信頼性の高いソフトセンサの開発について報告する。
関連論文リスト
- Sparse Attention-driven Quality Prediction for Production Process Optimization in Digital Twins [53.70191138561039]
データ駆動方式で運用ロジックを符号化することで,生産ラインのディジタルツインをデプロイすることを提案する。
我々は,自己注意型時間畳み込みニューラルネットワークに基づく生産プロセスの品質予測モデルを採用する。
本手法は,本手法により,仮想及び実生産ライン間のシームレスな統合を促進できることを示す。
論文 参考訳(メタデータ) (2024-05-20T09:28:23Z) - AI Competitions and Benchmarks: Dataset Development [42.164845505628506]
本章では,我々の実践経験に富んだ,確立した方法論ツールの概要について概観する。
データセット開発に関わるタスクを開発し、その効果的な管理に関する洞察を提供する。
次に、データ収集、変換、品質評価を含む実装プロセスの詳細について述べる。
論文 参考訳(メタデータ) (2024-04-15T12:01:42Z) - Leveraging Data Augmentation for Process Information Extraction [0.0]
自然言語テキストデータに対するデータ拡張の適用について検討する。
データ拡張は、自然言語テキストからビジネスプロセスモデルを生成するタスクのための機械学習メソッドを実現する上で重要なコンポーネントである。
論文 参考訳(メタデータ) (2024-04-11T06:32:03Z) - The Artificial Neural Twin -- Process Optimization and Continual Learning in Distributed Process Chains [3.79770624632814]
本稿では,モデル予測制御,ディープラーニング,センサネットワークの概念を組み合わせた人工ニューラルツインを提案する。
我々のアプローチでは、分散プロセスのステップの状態を推定するために、微分可能なデータ融合を導入します。
相互接続されたプロセスステップを準ニューラルネットワークとして扱うことで、プロセス最適化やモデル微調整のための損失勾配をプロセスパラメータにバックプロパゲートすることができる。
論文 参考訳(メタデータ) (2024-03-27T08:34:39Z) - Machine learning for industrial sensing and control: A survey and
practical perspective [7.678648424345052]
プロセス産業で実際に成功している重要な統計および機械学習技術を特定する。
ソフトセンシングは、統計学と機械学習の手法の多くの産業応用を含んでいる。
データ駆動最適化と制御のための2つの異なるフレーバーについて考察する。
論文 参考訳(メタデータ) (2024-01-24T22:27:04Z) - On Efficient Training of Large-Scale Deep Learning Models: A Literature
Review [90.87691246153612]
ディープラーニングの分野は特にコンピュータビジョン(CV)、自然言語処理(NLP)、音声などにおいて大きな進歩を遂げている。
大量のデータに基づいてトレーニングされた大規模なモデルを使用することは、実用的なアプリケーションにとって大きな可能性を秘めている。
計算能力の需要が増大する中で、ディープラーニングモデルの訓練の加速技術に関する包括的な要約が期待されている。
論文 参考訳(メタデータ) (2023-04-07T11:13:23Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Process-BERT: A Framework for Representation Learning on Educational
Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。
我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。
当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文 参考訳(メタデータ) (2022-04-28T16:07:28Z) - Generating Privacy-Preserving Process Data with Deep Generative Models [7.3268099910347715]
プロセスデータ生成のための逆生成ネットワーク(ProcessGAN)を導入する。
我々は6つの実世界のデータセット上でProcessGANと従来のモデルを評価する。
我々は,プロセスGANが,認証データと区別できない大量の共有可能な合成プロセスデータを生成することができると結論付けた。
論文 参考訳(メタデータ) (2022-03-15T14:29:54Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - AI-based Modeling and Data-driven Evaluation for Smart Manufacturing
Processes [56.65379135797867]
本稿では,半導体製造プロセスに関する有用な知見を得るための動的アルゴリズムを提案する。
本稿では,遺伝的アルゴリズムとニューラルネットワークを利用して,知的特徴選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-29T14:57:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。