論文の概要: CIPCaD-Bench: Continuous Industrial Process datasets for benchmarking
Causal Discovery methods
- arxiv url: http://arxiv.org/abs/2208.01529v1
- Date: Tue, 2 Aug 2022 15:30:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 12:58:15.990464
- Title: CIPCaD-Bench: Continuous Industrial Process datasets for benchmarking
Causal Discovery methods
- Title(参考訳): CIPCaD-Bench:因果探索法ベンチマークのための連続産業プロセスデータセット
- Authors: Giovanni Menegozzo, Diego Dall'Alba, Paolo Fiorini
- Abstract要約: 因果関係は製造工程で調査され、断層調査を支援し、介入を行い、戦略的決定を行う。
業界 4.0 はデータ駆動因果発見 (CD) を可能にするデータ量を増やした。
本研究は、連続製造プロセスにおけるCDのための2つの新しいパブリックデータセットを紹介する。
- 参考スコア(独自算出の注目度): 2.7071541526963805
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Causal relationships are commonly examined in manufacturing processes to
support faults investigations, perform interventions, and make strategic
decisions. Industry 4.0 has made available an increasing amount of data that
enable data-driven Causal Discovery (CD). Considering the growing number of
recently proposed CD methods, it is necessary to introduce strict benchmarking
procedures on publicly available datasets since they represent the foundation
for a fair comparison and validation of different methods. This work introduces
two novel public datasets for CD in continuous manufacturing processes. The
first dataset employs the well-known Tennessee Eastman simulator for fault
detection and process control. The second dataset is extracted from an
ultra-processed food manufacturing plant, and it includes a description of the
plant, as well as multiple ground truths. These datasets are used to propose a
benchmarking procedure based on different metrics and evaluated on a wide
selection of CD algorithms. This work allows testing CD methods in realistic
conditions enabling the selection of the most suitable method for specific
target applications. The datasets are available at the following link:
https://github.com/giovanniMen
- Abstract(参考訳): 因果関係は、断層調査を支援し、介入を行い、戦略的決定を下すために、製造プロセスにおいてよく検討される。
業界 4.0 はデータ駆動の因果発見(CD)を可能にするデータ量を増やした。
近年提案されているCD手法が増えていることを考えると、異なる手法の公正な比較と検証の基礎となるため、公開データセットに厳密なベンチマーク手順を導入する必要がある。
本研究は, 連続製造プロセスにおけるcdの公開データセットを2つ導入する。
最初のデータセットは、有名なテネシー・イーストマンシミュレータを使って断層検出とプロセス制御を行っている。
第2のデータセットは、超加工食品製造プラントから抽出され、植物の説明と複数の地上の真実を含む。
これらのデータセットは、異なるメトリクスに基づくベンチマーク手順を提案し、幅広いcdアルゴリズムに基づいて評価される。
この作業により、特定のターゲットアプリケーションに適した方法を選択することができる現実の環境でcdメソッドをテストすることができる。
データセットは以下のリンクで利用可能である。
関連論文リスト
- Bluetooth Low Energy Dataset Using In-Phase and Quadrature Samples for Indoor Localization [1.8896440571956592]
本稿では,Bluetooth低エネルギー(BLE)技術を用いて,到着角(AoA)を決定するために設計されたデータセットの収集と検証について概説する。
実験室で収集されたデータは、現実の工業シナリオを近似することを目的としている。
論文 参考訳(メタデータ) (2024-12-02T18:05:35Z) - Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - ADs: Active Data-sharing for Data Quality Assurance in Advanced Manufacturing Systems [8.739325218880815]
複数のマシン間で共有データの品質を確保するために、アクティブデータ共有(AD)フレームワークが提案されている。
ダウンストリームタスクの恩恵を受ける最も情報性の高いデータポイントを同時に選択するように設計されている。
本手法は, 3つの添加製造工程のその場モニタリングデータから異常検出を行う。
論文 参考訳(メタデータ) (2024-03-31T06:08:01Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - SoK: Privacy-Preserving Data Synthesis [72.92263073534899]
本稿では,プライバシ保護データ合成(PPDS)に注目し,その分野の総合的な概要,分析,議論を行う。
PPDSでは,統計的手法と深層学習(DL)に基づく手法の2つの顕著な研究を統一するマスターレシピを作成した。
論文 参考訳(メタデータ) (2023-07-05T08:29:31Z) - $\texttt{causalAssembly}$: Generating Realistic Production Data for
Benchmarking Causal Discovery [1.3048920509133808]
我々は、因果探索手法のベンチマークをサポートする半合成製造データを生成するシステムを構築した。
我々は、柔軟に推定し、条件分布を表すために分布ランダムな森林を用いる。
このライブラリを用いて、よく知られた因果探索アルゴリズムをベンチマークする方法を示す。
論文 参考訳(メタデータ) (2023-06-19T10:05:54Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Extending the WILDS Benchmark for Unsupervised Adaptation [186.90399201508953]
We present the WILDS 2.0 update, which extends 8 of the 10 datasets in the WILDS benchmark of distribution shifts to include curated unlabeled data。
これらのデータセットは、組織学から野生生物保護まで幅広い応用、タスク(分類、回帰、検出)、モダリティにまたがる。
ドメイン不変量や自己学習,自己管理など,ラベルのないデータを活用する最先端の手法を体系的にベンチマークする。
論文 参考訳(メタデータ) (2021-12-09T18:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。