論文の概要: CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data
- arxiv url: http://arxiv.org/abs/2603.11745v1
- Date: Thu, 12 Mar 2026 09:49:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.003381
- Title: CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data
- Title(参考訳): CINDI:電力グリッドデータ内の流れに対する条件付きインプットとノイズデータの統合性
- Authors: David Baumgartner, Helge Langseth, Heri Ramampiaro,
- Abstract要約: Conditional Imputation and Noisy Data Integrity (CINDI) は、複雑な時系列におけるデータの完全性を取り戻すために設計された教師なし確率的フレームワークである。
CINDIは、条件付き正規化フロー上に構築された単一エンドツーエンドシステムに異常検出と計算を統一する。
ノルウェーの電力配電事業者による実世界のグリッド損失データを用いて,本フレームワークの評価を行った。
- 参考スコア(独自算出の注目度): 0.6991281327290525
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Real-world multivariate time series, particularly in critical infrastructure such as electrical power grids, are often corrupted by noise and anomalies that degrade the performance of downstream tasks. Standard data cleaning approaches often rely on disjoint strategies, which involve detecting errors with one model and imputing them with another. Such approaches can fail to capture the full joint distribution of the data and ignore prediction uncertainty. This work introduces Conditional Imputation and Noisy Data Integrity (CINDI), an unsupervised probabilistic framework designed to restore data integrity in complex time series. Unlike fragmented approaches, CINDI unifies anomaly detection and imputation into a single end-to-end system built on conditional normalizing flows. By modeling the exact conditional likelihood of the data, the framework identifies low-probability segments and iteratively samples statistically consistent replacements. This allows CINDI to efficiently reuse learned information while preserving the underlying physical and statistical properties of the system. We evaluate the framework using real-world grid loss data from a Norwegian power distribution operator, though the methodology is designed to generalize to any multivariate time series domain. The results demonstrate that CINDI yields robust performance compared to competitive baselines, offering a scalable solution for maintaining reliability in noisy environments.
- Abstract(参考訳): 実世界の多変量時系列は、特に電力網のような重要なインフラにおいて、下流のタスクの性能を低下させるノイズや異常によってしばしば悪化する。
標準的なデータクリーニングアプローチは、しばしば、あるモデルでエラーを検出し、別のモデルで警告する、相反する戦略に依存する。
このような手法はデータの完全結合分布を捉えることができず、予測の不確実性を無視することができる。
この研究は、複雑な時系列におけるデータの完全性を取り戻すために設計された教師なし確率的フレームワーク、Conditional Imputation and Noisy Data Integrity (CINDI)を導入している。
断片化アプローチとは異なり、CINDIは条件付き正規化フロー上に構築された単一エンドツーエンドシステムに異常検出と計算を統一する。
このフレームワークは、データの正確な条件付き確率をモデル化することにより、低確率セグメントを特定し、統計的に一貫した置換を反復的にサンプリングする。
これにより、CINDIは学習した情報を効率よく再利用し、システムの基盤となる物理的・統計的特性を保存できる。
ノルウェーの電力配電事業者による実世界のグリッド損失データを用いてフレームワークの評価を行うが,この手法は任意の多変量時系列領域に一般化するように設計されている。
その結果、CINDIは競合するベースラインに比べて堅牢な性能を示し、ノイズの多い環境で信頼性を維持するスケーラブルなソリューションを提供する。
関連論文リスト
- Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Stress-Testing ML Pipelines with Adversarial Data Corruption [11.91482648083998]
規制当局は現在、ハイテイクシステムは現実的で相互依存的なエラーに耐えられるという証拠を要求している。
SAVAGEは依存性グラフとフレキシブルな汚いテンプレートを通じて、データ品質の問題を正式にモデル化するフレームワークです。
Savanageは、脆弱性のあるデータサブポピュレーションと微調整による汚職の深刻度を効率的に識別するために、双方向の最適化アプローチを採用している。
論文 参考訳(メタデータ) (2025-06-02T00:41:24Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Measuring and Mitigating Local Instability in Deep Neural Networks [23.342675028217762]
モデルが同じデータ上で再トレーニングされた場合でも,トレーニングプロセスにおける原理性の結果,モデルがどう変化するかを検討する。
自然言語理解(NLU)タスクでは,クエリのかなりの部分の予測が不安定であることがわかった。
局所的な安定性を推定する新たなデータ中心手法を提案する。
論文 参考訳(メタデータ) (2023-05-18T00:34:15Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。