論文の概要: CPSLint: A Domain-Specific Language Providing Data Validation and Sanitisation for Industrial Cyber-Physical Systems
- arxiv url: http://arxiv.org/abs/2510.18651v1
- Date: Tue, 21 Oct 2025 13:59:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.721097
- Title: CPSLint: A Domain-Specific Language Providing Data Validation and Sanitisation for Industrial Cyber-Physical Systems
- Title(参考訳): CPSLint:産業用サイバー物理システムのためのデータ検証と衛生を提供するドメイン特化言語
- Authors: Uraz Odyurt, Ömer Sayilir, Mariëlle Stoelinga, Vadim Zaytsev,
- Abstract要約: 本稿では,産業用CPSのデータ準備を目的としたドメイン特化言語CPSLintを紹介する。
主な機能は型チェックとデータ列の検証と修正による制約の強制である。
より高度な機能は、カラムワイドと行ワイドの両方で追加のCPS固有のデータ構造を推測する。
- 参考スコア(独自算出の注目度): 0.5499796332553707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Raw datasets are often too large and unstructured to work with directly, and require a data preparation process. The domain of industrial Cyber-Physical Systems (CPS) is no exception, as raw data typically consists of large amounts of time-series data logging the system's status in regular time intervals. Such data has to be sanity checked and preprocessed to be consumable by data-centric workflows. We introduce CPSLint, a Domain-Specific Language designed to provide data preparation for industrial CPS. We build up on the fact that many raw data collections in the CPS domain require similar actions to render them suitable for Machine-Learning (ML) solutions, e.g., Fault Detection and Identification (FDI) workflows, yet still vary enough to hope for one universally applicable solution. CPSLint's main features include type checking and enforcing constraints through validation and remediation for data columns, such as imputing missing data from surrounding rows. More advanced features cover inference of extra CPS-specific data structures, both column-wise and row-wise. For instance, as row-wise structures, descriptive execution phases are an effective method of data compartmentalisation are extracted and prepared for ML-assisted FDI workflows. We demonstrate CPSLint's features through a proof of concept implementation.
- Abstract(参考訳): 生データセットは、しばしば大きすぎるため、直接処理するには構造化されていないため、データ準備プロセスが必要である。
CPS(Industrial Cyber-Physical Systems)のドメインは例外ではない。
このようなデータは、データ中心のワークフローによって消費されるように、健全性をチェックし、事前処理する必要がある。
本稿では,産業用CPSのデータ準備を目的としたドメイン特化言語CPSLintを紹介する。
私たちは、CPSドメインの多くの生データ収集が、機械学習(ML)ソリューション、例えば障害検出と識別(FDI)ワークフローに適合するように、同様のアクションを必要とするという事実に基づいています。
CPSLintの主な特徴は、型チェックとデータ列の検証と修正による制約の強制である。
より高度な機能は、カラムワイドと行ワイドの両方で追加のCPS固有のデータ構造を推測する。
例えば、行単位の構造として、記述実行フェーズはデータ分割の効果的な方法であり、ML支援FDIワークフローのために準備される。
CPSLintの特徴を概念的実装の実証を通じて実証する。
関連論文リスト
- Agentic AI framework for End-to-End Medical Data Inference [5.871161259593687]
我々は、摂取から推論まで、臨床データパイプライン全体を自動化するエージェントAIフレームワークを導入する。
本システムは, 高齢者, 緩和ケア, 大腸内視鏡検査から入手可能なデータセットを用いて評価した。
論文 参考訳(メタデータ) (2025-07-24T05:56:25Z) - Efficient Conformance Checking of Rich Data-Aware Declare Specifications (Extended) [49.46686813437884]
一般的なデータ型やデータ条件とリッチな設定で,データを考慮した最適アライメントを計算可能であることを示す。
これは、制御フローとデータ依存関係を扱うために、よく知られた2つのアプローチを慎重に組み合わせることで達成される。
論文 参考訳(メタデータ) (2025-06-30T10:16:21Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Retrieval-Augmented Mining of Temporal Logic Specifications from Data [0.46040036610482665]
この研究は、観測された振る舞いからデータ駆動的な方法でSTL要求を学習するタスクに対処する。
本稿では,ベイズ最適化(BO)と情報検索(IR)技術を組み合わせて,STL式の構造とパラメータを同時に学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T09:29:00Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM for Cyber-Physical Production Systems [45.05372822216111]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - Scalable Discovery and Continuous Inventory of Personal Data at Rest in
Cloud Native Systems [0.0]
クラウドネイティブシステムは、多数の多パラダイムデータストアを通じて大量の個人データを処理している。
プライバシーエンジニアリングの観点では、個人情報が保存されているすべての正確な場所を追跡することが重要な課題だ。
i) 個人データの安静時のスケーラブルな発見のためのワークフローパターンと,i) クラウドネイティブシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装からなるTeresiasを提案する。
論文 参考訳(メタデータ) (2022-09-09T10:45:34Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - Learning to Limit Data Collection via Scaling Laws: Data Minimization
Compliance in Practice [62.44110411199835]
我々は機械学習法における文献に基づいて、データとシステム性能を結びつけるデータ解釈に基づく収集を制限するフレームワークを提案する。
我々は、性能曲線微分に基づくデータ最小化基準を定式化し、有効かつ解釈可能な分数法法技術を提供する。
論文 参考訳(メタデータ) (2021-07-16T19:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。