論文の概要: Integration of Domain Expert-Centric Ontology Design into the CRISP-DM
for Cyber-Physical Production Systems
- arxiv url: http://arxiv.org/abs/2307.11637v1
- Date: Fri, 21 Jul 2023 15:04:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-24 12:04:17.770750
- Title: Integration of Domain Expert-Centric Ontology Design into the CRISP-DM
for Cyber-Physical Production Systems
- Title(参考訳): サイバー物理生産システムにおけるドメインエキスパートオントロジー設計のCRISP-DMへの統合
- Authors: Milapji Singh Gill, Tom Westermann, Marvin Schieseck, Alexander Fay
- Abstract要約: 機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
- 参考スコア(独自算出の注目度): 63.62764375279861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the age of Industry 4.0 and Cyber-Physical Production Systems (CPPSs) vast
amounts of potentially valuable data are being generated. Methods from Machine
Learning (ML) and Data Mining (DM) have proven to be promising in extracting
complex and hidden patterns from the data collected. The knowledge obtained can
in turn be used to improve tasks like diagnostics or maintenance planning.
However, such data-driven projects, usually performed with the Cross-Industry
Standard Process for Data Mining (CRISP-DM), often fail due to the
disproportionate amount of time needed for understanding and preparing the
data. The application of domain-specific ontologies has demonstrated its
advantageousness in a wide variety of Industry 4.0 application scenarios
regarding the aforementioned challenges. However, workflows and artifacts from
ontology design for CPPSs have not yet been systematically integrated into the
CRISP-DM. Accordingly, this contribution intends to present an integrated
approach so that data scientists are able to more quickly and reliably gain
insights into the CPPS. The result is exemplarily applied to an anomaly
detection use case.
- Abstract(参考訳): 産業 4.0 とサイバー物理生産システム (CPPS) の時代には、膨大な量の潜在的価値のあるデータが生成される。
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
得られた知識は、診断やメンテナンス計画などのタスクを改善するために使用できる。
しかし、このようなデータ駆動プロジェクトは、通常CRISP-DM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間が不均等であるために失敗することが多い。
ドメイン固有のオントロジーの応用は、上記の課題に関する様々な業界 4.0 アプリケーションシナリオにおいて、その優位性を示している。
しかし、CPPSのオントロジー設計のワークフローやアーティファクトは、まだCRISP-DMに体系的に統合されていない。
したがって、このコントリビューションは、データサイエンティストがCPPSに関するより迅速かつ確実な洞察を得られるように、統合されたアプローチを提案することを目的としている。
その結果は、異常検出ユースケースに例示的に適用される。
関連論文リスト
- Integrating Ontology Design with the CRISP-DM in the context of Cyber-Physical Systems Maintenance [41.85920785319125]
提案手法は3つの段階に分けられる。
フェーズ1では、オントロジーの要件を体系的に指定し、関連する知識範囲を定義する。
フェーズ2では、CPSライフサイクルデータは、ドメイン固有のオントロジアーティファクトを使用してコンテキスト化される。
この形式化されたドメイン知識は、データマイニングのためのクロス産業標準プロセス(CRISP-DM)で利用され、データから新しい洞察を効率的に抽出する。
論文 参考訳(メタデータ) (2024-07-09T15:06:47Z) - AI Competitions and Benchmarks: Dataset Development [42.164845505628506]
本章では,我々の実践経験に富んだ,確立した方法論ツールの概要について概観する。
データセット開発に関わるタスクを開発し、その効果的な管理に関する洞察を提供する。
次に、データ収集、変換、品質評価を含む実装プロセスの詳細について述べる。
論文 参考訳(メタデータ) (2024-04-15T12:01:42Z) - Leveraging Large Language Model for Automatic Evolving of Industrial
Data-Centric R&D Cycle [20.30730316993658]
データ駆動型ソリューションは、無数の産業課題に対処するための強力なツールとして登場しています。
データ中心のR&Dはこれらのソリューションを活用する上で重要な役割を担っているが、人間、計算、時間資源といった面では大きなコストが伴うことが多い。
本稿では,データ中心R&Dの進化サイクルを早めるために,大規模言語モデル(LLM)の可能性について検討する。
論文 参考訳(メタデータ) (2023-10-17T13:18:02Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Time-Series Pattern Recognition in Smart Manufacturing Systems: A
Literature Review and Ontology [3.5097082077065003]
本稿では,製造における時系列パターン認識の現状について,構造化された視点を提供する。
それは、実用的で実用的なガイドラインと、時系列分析の進歩のための推奨を提供することを目的としている。
論文 参考訳(メタデータ) (2023-01-29T17:18:59Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Big Machinery Data Preprocessing Methodology for Data-Driven Models in
Prognostics and Health Management [0.0]
本稿では,複雑なシステムからの監視データの事前処理のための包括的,ステップバイステップパイプラインを提案する。
データ選択とラベル生成の文脈で専門家の知識の重要性を論じる。
検証のために2つのケーススタディが提示され、最終的な目標は、健全で不健康なラベルでクリーンなデータセットを作成することである。
論文 参考訳(メタデータ) (2021-10-08T17:10:12Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。