Fugu-MT 論文翻訳(概要): Data Quality Over Quantity: Pitfalls and Guidelines for Process Analytics

論文の概要: Data Quality Over Quantity: Pitfalls and Guidelines for Process Analytics

arxiv url: http://arxiv.org/abs/2211.06440v2
Date: Wed, 5 Apr 2023 23:56:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-07 17:43:45.496189
Title: Data Quality Over Quantity: Pitfalls and Guidelines for Process Analytics
Title（参考訳）: 量を超えるデータ品質: プロセス分析のための落とし穴とガイドライン
Authors: Lim C. Siang, Shams Elnawawi, Lee D. Rippon, Daniel L. O'Connor and R. Bhushan Gopaluni
Abstract要約: データ前処理は、現実の人工知能アプリケーションの成功に大きな影響を与えている。本稿では,産業時系列データの事前処理に関する実践的考察を行い,信頼性の高いソフトセンサの効率的な開発について報告する。
参考スコア（独自算出の注目度）: 0.8399688944263843
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A significant portion of the effort involved in advanced process control, process analytics, and machine learning involves acquiring and preparing data. Literature often emphasizes increasingly complex modelling techniques with incremental performance improvements. However, when industrial case studies are published they often lack important details on data acquisition and preparation. Although data pre-processing is unfairly maligned as trivial and technically uninteresting, in practice it has an out-sized influence on the success of real-world artificial intelligence applications. This work describes best practices for acquiring and preparing operating data to pursue data-driven modelling and control opportunities in industrial processes. We present practical considerations for pre-processing industrial time series data to inform the efficient development of reliable soft sensors that provide valuable process insights.
Abstract（参考訳）: 高度なプロセス制御、プロセス分析、マシンラーニングに関わる作業の大部分は、データの取得と準備に関するものだ。文学は、インクリメンタルなパフォーマンス改善を伴う、ますます複雑なモデリング技術を強調している。しかし、産業ケーススタディが発行されると、しばしばデータ取得と準備に関する重要な詳細が欠落する。データ前処理は不公平に自明で技術的に興味をそそらないものだが、実際には現実世界の人工知能アプリケーションの成功に大きな影響を与えている。本研究は,産業プロセスにおけるデータ駆動モデリングと制御機会を追求するための運用データの獲得と準備のためのベストプラクティスについて述べる。本稿では,産業時系列データの事前処理に関する実践的考察を行い,重要なプロセスインサイトを提供する信頼性の高いソフトセンサの開発について報告する。

関連論文リスト

Advancements in synthetic data extraction for industrial injection molding [0.0]
射出成形プロセスのトレーニングプロセスに合成データを組み込むことの可能性を検討する。以上の結果から,合成データを含めることで,異なるシナリオを扱えるモデルの性能が向上することが示唆された。
論文参考訳（メタデータ） (2025-11-11T11:19:54Z)
More Data or Better Data? A Critical Analysis of Data Selection and Synthesis for Mathematical Reasoning [47.13636836547429]
我々は,オープンソースのデータセットと数学的推論のためのデータ合成手法を包括的に分析する。以上の結果から,より解釈可能な形式のデータ構築や,より強力なモデルからの抽出は,単にデータボリュームをスケールアップするよりも優れていることが示唆された。
論文参考訳（メタデータ） (2025-10-08T16:07:26Z)
Sparse Attention-driven Quality Prediction for Production Process Optimization in Digital Twins [53.70191138561039]
データ駆動方式で運用ロジックを符号化することで,生産ラインのディジタルツインをデプロイすることを提案する。我々は,自己注意型時間畳み込みニューラルネットワークに基づく生産プロセスの品質予測モデルを採用する。本手法は,本手法により,仮想及び実生産ライン間のシームレスな統合を促進できることを示す。
論文参考訳（メタデータ） (2024-05-20T09:28:23Z)
AI Competitions and Benchmarks: Dataset Development [42.164845505628506]
本章では,我々の実践経験に富んだ,確立した方法論ツールの概要について概観する。データセット開発に関わるタスクを開発し、その効果的な管理に関する洞察を提供する。次に、データ収集、変換、品質評価を含む実装プロセスの詳細について述べる。
論文参考訳（メタデータ） (2024-04-15T12:01:42Z)
Leveraging Data Augmentation for Process Information Extraction [0.0]
自然言語テキストデータに対するデータ拡張の適用について検討する。データ拡張は、自然言語テキストからビジネスプロセスモデルを生成するタスクのための機械学習メソッドを実現する上で重要なコンポーネントである。
論文参考訳（メタデータ） (2024-04-11T06:32:03Z)
The Artificial Neural Twin -- Process Optimization and Continual Learning in Distributed Process Chains [3.79770624632814]
本稿では,モデル予測制御,ディープラーニング,センサネットワークの概念を組み合わせた人工ニューラルツインを提案する。我々のアプローチでは、分散プロセスのステップの状態を推定するために、微分可能なデータ融合を導入します。相互接続されたプロセスステップを準ニューラルネットワークとして扱うことで、プロセス最適化やモデル微調整のための損失勾配をプロセスパラメータにバックプロパゲートすることができる。
論文参考訳（メタデータ） (2024-03-27T08:34:39Z)
Machine learning for industrial sensing and control: A survey and practical perspective [7.678648424345052]
プロセス産業で実際に成功している重要な統計および機械学習技術を特定する。ソフトセンシングは、統計学と機械学習の手法の多くの産業応用を含んでいる。データ駆動最適化と制御のための2つの異なるフレーバーについて考察する。
論文参考訳（メタデータ） (2024-01-24T22:27:04Z)
On Efficient Training of Large-Scale Deep Learning Models: A Literature Review [90.87691246153612]
ディープラーニングの分野は特にコンピュータビジョン(CV)、自然言語処理(NLP)、音声などにおいて大きな進歩を遂げている。大量のデータに基づいてトレーニングされた大規模なモデルを使用することは、実用的なアプリケーションにとって大きな可能性を秘めている。計算能力の需要が増大する中で、ディープラーニングモデルの訓練の加速技術に関する包括的な要約が期待されている。
論文参考訳（メタデータ） (2023-04-07T11:13:23Z)
Deep Learning based pipeline for anomaly detection and quality enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文参考訳（メタデータ） (2022-09-21T08:14:34Z)
Process-BERT: A Framework for Representation Learning on Educational Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文参考訳（メタデータ） (2022-04-28T16:07:28Z)
Generating Privacy-Preserving Process Data with Deep Generative Models [7.3268099910347715]
プロセスデータ生成のための逆生成ネットワーク(ProcessGAN)を導入する。我々は6つの実世界のデータセット上でProcessGANと従来のモデルを評価する。我々は,プロセスGANが,認証データと区別できない大量の共有可能な合成プロセスデータを生成することができると結論付けた。
論文参考訳（メタデータ） (2022-03-15T14:29:54Z)
Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文参考訳（メタデータ） (2021-06-14T11:42:46Z)
AI-based Modeling and Data-driven Evaluation for Smart Manufacturing Processes [56.65379135797867]
本稿では,半導体製造プロセスに関する有用な知見を得るための動的アルゴリズムを提案する。本稿では,遺伝的アルゴリズムとニューラルネットワークを利用して,知的特徴選択アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-08-29T14:57:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。