論文の概要: Big Machinery Data Preprocessing Methodology for Data-Driven Models in
Prognostics and Health Management
- arxiv url: http://arxiv.org/abs/2110.04256v1
- Date: Fri, 8 Oct 2021 17:10:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-11 14:15:08.661334
- Title: Big Machinery Data Preprocessing Methodology for Data-Driven Models in
Prognostics and Health Management
- Title(参考訳): 予後と健康管理におけるデータ駆動モデルのためのビッグデータ前処理手法
- Authors: Sergio Cofre-Martel, Enrique Lopez Droguett, Mohammad Modarres
- Abstract要約: 本稿では,複雑なシステムからの監視データの事前処理のための包括的,ステップバイステップパイプラインを提案する。
データ選択とラベル生成の文脈で専門家の知識の重要性を論じる。
検証のために2つのケーススタディが提示され、最終的な目標は、健全で不健康なラベルでクリーンなデータセットを作成することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sensor monitoring networks and advances in big data analytics have guided the
reliability engineering landscape to a new era of big machinery data. Low-cost
sensors, along with the evolution of the internet of things and industry 4.0,
have resulted in rich databases that can be analyzed through prognostics and
health management (PHM) frameworks. Several da-ta-driven models (DDMs) have
been proposed and applied for diagnostics and prognostics purposes in complex
systems. However, many of these models are developed using simulated or
experimental data sets, and there is still a knowledge gap for applications in
real operating systems. Furthermore, little attention has been given to the
required data preprocessing steps compared to the training processes of these
DDMs. Up to date, research works do not follow a formal and consistent data
preprocessing guideline for PHM applications. This paper presents a
comprehensive, step-by-step pipeline for the preprocessing of monitoring data
from complex systems aimed for DDMs. The importance of expert knowledge is
discussed in the context of data selection and label generation. Two case
studies are presented for validation, with the end goal of creating clean data
sets with healthy and unhealthy labels that are then used to train machinery
health state classifiers.
- Abstract(参考訳): センサ監視ネットワークとビッグデータ分析の進歩は、信頼性エンジニアリングの展望を、ビッグデータデータの新たな時代へと導いてきた。
低コストのセンサーはモノのインターネットと産業の4.0の進化と共に、予後と健康管理(PHM)フレームワークを通して分析できる豊富なデータベースを生み出した。
いくつかのda-ta-driven model (DDM) が提案され、複雑なシステムにおける診断と予後のために応用されている。
しかし、これらのモデルの多くはシミュレーションや実験的なデータセットを使って開発されており、実際のオペレーティングシステムにおけるアプリケーションには依然として知識ギャップがある。
さらに、これらのDDMのトレーニングプロセスと比較して、必要なデータ前処理ステップにはほとんど注意が払われていない。
これまでの研究は、PHMアプリケーションのための形式的で一貫したデータ前処理ガイドラインに従っていない。
本稿では,DDMを対象とした複雑なシステムからの監視データを前処理するための,包括的でステップバイステップのパイプラインを提案する。
専門家の知識の重要性は、データ選択とラベル生成の文脈で議論される。
検証のために2つのケーススタディが提示され、最終目標は、健全で不健全なラベルでクリーンなデータセットを作成し、機械の健康状態分類器を訓練することである。
関連論文リスト
- Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - An Integrated Data Processing Framework for Pretraining Foundation Models [57.47845148721817]
研究者や実践者は、しばしば異なるソースからデータセットを手動でキュレートする必要がある。
本稿では,処理モジュールと解析モジュールを統合したデータ処理フレームワークを提案する。
提案されたフレームワークは使いやすく、柔軟です。
論文 参考訳(メタデータ) (2024-02-26T07:22:51Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - Design & Implementation of Automatic Machine Condition Monitoring and
Maintenance System in Limited Resource Situations [0.0]
第4次産業革命の時代には,機械の故障検出と診断の自動化が不可欠である。
一部の機械の健康モニタリングシステムは世界中で使用されているが、高価であり、操作と分析のために訓練された人員を必要としている。
発展途上国では、インフラの不十分、熟練した人材の不足、金融危機などの理由から、予測的保守と労働安全文化は利用できない。
論文 参考訳(メタデータ) (2024-01-22T08:06:04Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM for Cyber-Physical Production Systems [45.05372822216111]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - Optimizing the AI Development Process by Providing the Best Support
Environment [0.756282840161499]
機械学習の主なステージは、問題理解、データ管理、モデル構築、モデル展開、メンテナンスである。
このフレームワークは、ディープラーニングの進歩を使ってデータ拡張を実行するために、python言語を使用して構築された。
論文 参考訳(メタデータ) (2023-04-29T00:44:50Z) - SensorSCAN: Self-Supervised Learning and Deep Clustering for Fault
Diagnosis in Chemical Processes [2.398451252047814]
本研究では,教師なし故障検出・診断のための新しい手法であるSensorSCANを提案する。
我々は、テネシー・イーストマン・プロセスの2つの公開データセットに、さまざまな欠点のあるモデルの性能を実演する。
本手法は,故障の数が事前に分かっていない実世界のアプリケーションに適している。
論文 参考訳(メタデータ) (2022-08-17T10:24:37Z) - Deep Reinforcement Learning Assisted Federated Learning Algorithm for
Data Management of IIoT [82.33080550378068]
産業用IoT(Industrial Internet of Things)の継続的な拡大により、IIoT機器は毎回大量のユーザデータを生成する。
IIoTの分野で、これらの時系列データを効率的かつ安全な方法で管理する方法は、依然として未解決の問題である。
本稿では,無線ネットワーク環境におけるIIoT機器データ管理におけるFL技術の適用について検討する。
論文 参考訳(メタデータ) (2022-02-03T07:12:36Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z) - Sampling for Deep Learning Model Diagnosis (Technical Report) [5.8057675678464555]
ディープニューラルネットワークのブラックボックスの性質は、医学的診断などの応用における採用の障壁である。
我々は,これらのモデルデバッグクエリに対して,近似的だが正確な結果を生成する新しいデータサンプリング手法を開発した。
本手法は,1つの標準的なコンピュータビジョンと1つの科学的データセットで評価し,クエリの精度において,サンプリング手法が様々な最先端の代替技術より優れていることを示す。
論文 参考訳(メタデータ) (2020-02-22T19:24:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。