論文の概要: Automated Batch Distillation Process Simulation for a Large Hybrid Dataset for Deep Anomaly Detection
- arxiv url: http://arxiv.org/abs/2604.09166v1
- Date: Fri, 10 Apr 2026 09:51:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.810228
- Title: Automated Batch Distillation Process Simulation for a Large Hybrid Dataset for Deep Anomaly Detection
- Title(参考訳): 深部異常検出のための大規模ハイブリッドデータセットの自動バッチ蒸留プロセスシミュレーション
- Authors: Jennifer Werner, Justus Arweiler, Indra Jungjohann, Jochen Schmid, Fabian Jirasek, Hans Hasse, Michael Bortz,
- Abstract要約: 深層学習に基づく化学プロセスにおける異常検出(AD)は重要な機会となる。
正常および異常な操作条件下でのバッチ蒸留のための大規模な完全注釈付き実験データセットを提案する。
我々は、このデータセットを対応するシミュレーションデータセットで拡張し、新しいハイブリッドデータセットを作成します。
- 参考スコア(独自算出の注目度): 0.813052640532324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection (AD) in chemical processes based on deep learning offers significant opportunities but requires large, diverse, and well-annotated training datasets that are rarely available from industrial operations. In a recent work, we introduced a large, fully annotated experimental dataset for batch distillation under normal and anomalous operating conditions. In the present study, we augment this dataset with a corresponding simulation dataset, creating a novel hybrid dataset. The simulation data is generated in an automated workflow with a novel Python-based process simulator that employs a tailored index-reduction strategy for the underlying differential-algebraic equations. Leveraging the rich metadata and structured anomaly annotations of the experimental database, experimental records are automatically translated into simulation scenarios. After calibration to a single reference experiment, the dynamics of the other experiments are well predicted. This enabled the fully automated, consistent generation of time-series data for a large number of experimental runs, covering both normal operation and a wide range of actuator- and control-related anomalies. The resulting hybrid dataset is released openly. From a process simulation perspective, this work demonstrates the automated, consistent simulation of large-scale experimental campaigns, using batch distillation as an example. From a data-driven AD perspective, the hybrid dataset provides a unique basis for simulation-to-experiment style transfer, the generation of pseudo-experimental data, and future research on deep AD methods in chemical process monitoring.
- Abstract(参考訳): 深層学習に基づく化学プロセスの異常検出(AD)は、大きな機会を提供するが、工業的操作からはほとんど得られない、大きく、多様で、注釈の付いたトレーニングデータセットを必要とする。
近年の研究では,正常および異常な操作条件下でのバッチ蒸留のための大規模な完全注釈付き実験データセットを導入している。
本研究では、このデータセットを対応するシミュレーションデータセットで拡張し、新しいハイブリッドデータセットを作成する。
シミュレーションデータは、基礎となる微分代数方程式に対して調整されたインデックス推論戦略を利用する新しいPythonベースのプロセスシミュレータを用いて、自動化されたワークフローで生成される。
実験データベースの豊富なメタデータと構造化された異常アノテーションを活用すると、実験記録は自動的にシミュレーションシナリオに変換される。
単一の基準実験を校正した後、他の実験の力学はよく予測される。
これにより、多数の実験走行のための完全に自動化された一貫した時系列データ生成が可能となり、通常の動作と幅広いアクチュエータおよび制御関連異常の両方をカバーした。
結果として得られたハイブリッドデータセットは、公開されている。
プロセスシミュレーションの観点から、この研究はバッチ蒸留を例として、大規模な実験キャンペーンの自動化された一貫したシミュレーションを実証する。
データ駆動型ADの観点から、ハイブリッドデータセットは、シミュレーションから実験スタイルへの移行、擬似実験データの生成、化学プロセス監視における深部AD手法の今後の研究のユニークな基礎を提供する。
関連論文リスト
- Bridging the Simulation-to-Experiment Gap with Generative Models using Adversarial Distribution Alignment [51.246114581338865]
科学と工学における根本的な課題は、シミュレーションと実験のギャップである。
このギャップを埋めるデータ駆動型分散アライメントフレームワークを提案する。
本手法は,複数個の相関した観測可能値であっても,対象の観測可能分布を復元できることを実証する。
論文 参考訳(メタデータ) (2026-04-01T17:21:33Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Fusing Neural and Physical: Augment Protein Conformation Sampling with
Tractable Simulations [27.984190594059868]
生成モデルは サロゲートサンプルとして利用され コンフォメーションアンサンブルを 桁違いに速く得る
本研究では,MDシミュレーションを抽出可能な方法で組み込んだ,事前学習型ジェネレーティブ・サンプリング器の少数ショット設定について検討する。
論文 参考訳(メタデータ) (2024-02-16T03:48:55Z) - Lamarr: LHCb ultra-fast simulation based on machine learning models deployed within Gauss [0.0]
LHCb実験における検出器応答と再構成アルゴリズムの両方をパラメータ化するシミュレーション生成を高速化するフレームワークであるLamarrについて論じる。
複数のアルゴリズムと戦略を駆使した深部生成モデルを用いて、LHCb検出器の単一成分の高レベル応答を効果的にパラメータ化する。
論文 参考訳(メタデータ) (2023-03-20T20:18:04Z) - Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。
能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。
その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文 参考訳(メタデータ) (2021-06-05T01:31:51Z) - Deep Transformer Networks for Time Series Classification: The NPP Safety
Case [59.20947681019466]
時間依存nppシミュレーションデータをモデル化するために、教師付き学習方法でトランスフォーマと呼ばれる高度なテンポラルニューラルネットワークを使用する。
トランスはシーケンシャルデータの特性を学習し、テストデータセット上で約99%の分類精度で有望な性能が得られる。
論文 参考訳(メタデータ) (2021-04-09T14:26:25Z) - Cognitive simulation models for inertial confinement fusion: Combining
simulation and experimental data [0.0]
研究者は、高性能な爆発を求めて設計空間を探索するためにコンピュータシミュレーションに大きく依存しています。
より効果的な設計と調査のために、シミュレーションは過去の実験データからの入力を必要とする。
本稿では,シミュレーションと実験データを共通の予測モデルに組み合わせた認知シミュレーション手法について述べる。
論文 参考訳(メタデータ) (2021-03-19T02:00:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。