論文の概要: Picid: A Modular Evaluation Infrastructure for Reproducible PHM Across Tasks and Domains
- arxiv url: http://arxiv.org/abs/2605.28345v1
- Date: Wed, 27 May 2026 11:50:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.014456
- Title: Picid: A Modular Evaluation Infrastructure for Reproducible PHM Across Tasks and Domains
- Title(参考訳): Picid: タスクとドメイン間の再現可能なPHMのためのモジュール評価基盤
- Authors: Lev Telyatnikov, Raffael Theiler, Leandro Von Krannichfeldt, Olga Fink,
- Abstract要約: 我々は、PHM評価パイプラインを明示的で実行可能で再現可能なプロトコルとして形式化するモジュール評価基盤であるpicidを紹介する。
picidは決定論的でリークセーフなデータセットの構築を強制すると同時に、さまざまなPHM設定でフレキシブルに維持する。
電池, ベアリング, ターボファンエンジン, 油圧, 濾過システム, 建物にまたがる12のデータセットの13モデルについて, 実験的検討を行った。
- 参考スコア(独自算出の注目度): 13.382059615065167
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Progress in Prognostics and Health Management (PHM) is hindered by the lack of standardized and reusable evaluation practices across tasks, datasets, and application domains. Reported results are often difficult to reproduce and compare, as key protocol choices, such as data splits, preprocessing, label alignment, temporal windowing, and metrics, are often implicit or implemented ad hoc. We introduce \picid, a modular evaluation infrastructure that formalizes the PHM evaluation pipeline as an explicit, executable, and reproducible protocol. Through well-defined abstractions, \picid enforces deterministic, leakage-safe dataset construction while remaining flexible across diverse PHM settings. The framework supports fault detection, diagnostics, and prognostics through a unified interface and can be extended to new datasets and model classes without violating protocol invariants. By standardizing data contracts and evaluation boundaries, \picid also enables fair cross-task comparisons across diagnostics (classification) and prognostics (regression), allowing identical model families to be evaluated consistently across heterogeneous settings. We demonstrate \picid through an empirical evaluation of thirteen models on twelve datasets spanning batteries, bearings, turbofan engines, hydraulics, filtration systems, and buildings. This work establishes a reusable foundation for standardized, fair and reproducible evaluation in PHM.
- Abstract(参考訳): PHM(Prognostics and Health Management)の進歩は、タスク、データセット、アプリケーションドメインにまたがる標準化された再利用可能な評価プラクティスの欠如によって妨げられている。
データ分割、前処理、ラベルアライメント、時間ウィンドウ化、メトリクスといった重要なプロトコル選択は、しばしば暗黙的あるいはアドホックに実装されるため、報告された結果の再現と比較は困難である。
本稿では,PHM評価パイプラインを明示的で実行可能で再現可能なプロトコルとして形式化するモジュール評価基盤である \picid を紹介する。
明確に定義された抽象化を通じて、 \picidは決定論的でリークセーフなデータセットの構築を強制すると同時に、さまざまなPHM設定でフレキシブルに維持する。
このフレームワークは、統一インターフェースを通じて障害検出、診断、予後をサポートし、プロトコル不変性に違反することなく、新しいデータセットやモデルクラスに拡張することができる。
データコントラクトと評価境界の標準化により、 \picidは診断(分類)と予後(回帰)をまたいだ公正なクロスタスク比較を可能にし、同一のモデルファミリを不均一な設定で一貫して評価することができる。
電池, ベアリング, ターボファンエンジン, 油圧, 濾過システム, 建物にまたがる12のデータセットの13モデルについて, 実験的検討を行った。
この研究は、PHMにおける標準化、公正、再現可能な評価のための再利用可能な基盤を確立する。
関連論文リスト
- CellScientist: Dual-Space Hierarchical Orchestration for Closed-Loop Refinement of Virtual Cell Models [62.281480231694]
VCM(Virtual Cell Modeling)は、摂動応答を予測できるだけでなく、予測が失敗した場合にターゲットリビジョンをサポートするモデルを必要とする。
現在のLCM支援モデリングでは、予測誤差が実行可能実装を通して観測されるという改善ルーティング問題に直面している。
提案するCellScientistは,高レベル仮説空間と低レベル実行可能実装空間を結合した,二重空間階層型フレームワークである。
論文 参考訳(メタデータ) (2026-05-08T06:40:24Z) - LiveFMBench: Unveiling the Power and Limits of Agentic Workflows in Specification Generation [75.05397479715576]
大規模言語モデル(LLM)とエージェントは有望な進歩を示しているが、その真の能力と失敗モードは未だ不明である。
CプログラムのためのLCMおよびエージェントベースの形式仕様生成に関する、最初の体系的および汚染に配慮した研究を提案する。
論文 参考訳(メタデータ) (2026-05-02T11:31:33Z) - bioLeak: Leakage-Aware Modeling and Diagnostics for Machine Learning in R [0.0]
BioLeak(バイオリーク)は、共通リーク機構に適合したモデルの構築と監査を行うRパッケージである。
この実装はバイナリ分類、マルチクラス分類、回帰分析、生存分析をサポートし、タスク固有のメトリクスと分割、適合、監査、インフレーションの要約のためのS4コンテナを提供する。
論文 参考訳(メタデータ) (2026-04-13T04:01:31Z) - UniDial-EvalKit: A Unified Toolkit for Evaluating Multi-Faceted Conversational Abilities [70.79422099851506]
対話型AIシステム評価のための統合評価ツールキットUniDial-EvalKit(UDE)を提案する。
UDEは異種データフォーマットを普遍的なスキーマに標準化し、モジュールアーキテクチャを通じて複雑な評価パイプラインを合理化し、一貫したスコアリングインターフェースの下でメートル法計算を調整する。
論文 参考訳(メタデータ) (2026-03-24T13:01:31Z) - PIDSMaker: Building and Evaluating Provenance-based Intrusion Detection Systems [0.5830619388189558]
PIDSMakerは、一貫した視覚化プロトコルの下でPIDSを開発し評価するためのオープンソースのフレームワークである。
最先端の8つのシステムを、標準化された事前処理と基盤トラストラベルを備えたモジュラーアーキテクチャに統合する。
YAMLベースの設定インターフェースは、コード変更なしにシステム間でコンポーネントを構成することで、迅速なプロトタイピングをサポートする。
論文 参考訳(メタデータ) (2026-01-30T13:45:33Z) - Procrustean Bed for AI-Driven Retrosynthesis: A Unified Framework for Reproducible Evaluation [0.0]
RetroCastは、異種モデルの出力を共通スキーマに標準化する統合評価スイートである。
我々は、新しい標準ベンチマークスイートを用いて、検索ベースおよびシーケンスベースの主要なアルゴリズムを評価する。
論文 参考訳(メタデータ) (2025-12-08T01:26:39Z) - Generating Highly Structured Test Inputs Leveraging Constraint-Guided Graph Refinement [4.121384394709256]
本研究では,グラフベース表現を用いて,構造化ドメインに対するテスト入力を統一できるかどうかを検討する。
我々は,8つのAIシステムにおける入力妥当性とセマンティックな保存性を高めるために,このアプローチの有効性を評価する。
論文 参考訳(メタデータ) (2025-07-28T18:54:04Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Concurrent Misclassification and Out-of-Distribution Detection for
Semantic Segmentation via Energy-Based Normalizing Flow [0.0]
最近のセマンティックセグメンテーションモデルは、トレーニングデータセットの分布に類似したテスト時間例を正確に分類する。
本稿では,正規化フローフレームワークに依存するIDMとOOD検出を同時に行うための生成モデルを提案する。
FlowEneDetは、事前トレーニングされたDeepLabV3+およびSegFormerセマンティックセグメンテーションモデルに適用した場合、IDM/OOD検出におけるCityscapes、Cityscapes-C、FishyScapes、SegmentMeIfYouCanベンチマークの有望な結果を達成する。
論文 参考訳(メタデータ) (2023-05-16T17:02:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。