論文の概要: Benchmarking Machine Learning Uncertainty Quantification Methodologies for Predicting Turbine Gas Temperature Degradation
- arxiv url: http://arxiv.org/abs/2605.30585v1
- Date: Thu, 28 May 2026 21:25:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.243067
- Title: Benchmarking Machine Learning Uncertainty Quantification Methodologies for Predicting Turbine Gas Temperature Degradation
- Title(参考訳): タービンガス温度劣化予測のためのベンチマーク機械学習不確かさ定量手法
- Authors: Jostein Barry-Straume, Changmin Son, Adrian Sandu, Gavan Burke, Rekha Sundararajan, Andrew Rimell, James G. Steinrock,
- Abstract要約: 本稿では,予測区間を構築するための5つの主要なアプローチについて検討する。
それぞれのアプローチは、統一された実験フレームワークで実装される。
代表的タービンガス温度データセットで実施された試験は、明確なトレードオフを明らかにしている。
- 参考スコア(独自算出の注目度): 0.5621251909851629
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Effective prognostics and health management of modern engines relies on accurate turbine gas temperature predictions and robust uncertainty quantification to ensure reliability and safety. This paper investigates five major approaches for constructing prediction intervals -- namely the Delta method, Bayesian Monte Carlo Dropout, Bootstrap method, Lower-Upper Bound Estimation, and Mean-Variance Estimation -- as a means of capturing the uncertainty in neural network predictions of turbine gas temperature. Each approach is implemented within a unified experimental framework that employs cross-validation for hyperparameter selection, repeated train-test splits for performance robustness, and multiple metrics to evaluate both the accuracy and tightness of the intervals. In particular, Coverage Probability, Normalized Mean Prediction Interval Width, and the Coverage Width-based Criterion are measured to comprehensively assess each method's reliability and sharpness. Experiments conducted on a representative turbine gas temperature dataset reveal distinct trade-offs among the five methods in terms of interval coverage, width, and stability. These findings provide a practical guide for selecting and tuning prediction interval methods in engine health management and prognostics, ensuring both interpretability and precision in real-world applications.
- Abstract(参考訳): 現代のエンジンの効果的な予後と健康管理は、信頼性と安全性を確保するために正確なタービンガス温度予測と堅牢な不確実性定量化に依存している。
本稿では,タービンガス温度のニューラルネットワーク予測の不確実性を把握する手段として,デルタ法,ベイジアンモンテカルロ降下法,ブートストラップ法,ローワー・アップパー境界推定,平均変動推定の5つの主要な手法について検討する。
それぞれのアプローチは、ハイパーパラメータ選択のためのクロスバリデーション、パフォーマンスロバストネスのための繰り返し列車-テスト分割、インターバルの正確性と厳密性の両方を評価するための複数のメトリクスを利用する統一的な実験フレームワークで実装されている。
特に、各手法の信頼性と鋭さを総合的に評価するために、カバレッジ確率、正規化平均予測間隔幅、カバー幅に基づく基準を測定した。
代表的タービンガス温度データセットを用いた実験により, 間隔範囲, 幅, 安定性の点で, 5つの方法のトレードオフが明らかとなった。
これらの知見は,エンジンの健康管理と診断における予測間隔法の選択と調整の実践的ガイドであり,実世界の応用における解釈可能性と精度の両立を保証している。
関連論文リスト
- Forecasting threshold exceedance of atmospheric variables at a specific location [0.15039745292757667]
完全分布確率法は, 極端に稀な事象に対して, 直接的手法よりも常に優れていることを示す。
この利点は、完全な分布アプローチが中等度および軽度な強度事象から条件分布のパラメータを効果的に学習するから生じる。
選択した分布のパラメトリックな形状は, バルク特性の予測可能なシフトを正確に把握するよりも, 二次的な役割を担っていることがわかった。
論文 参考訳(メタデータ) (2026-05-29T09:46:03Z) - Scientific Machine Learning for Engine Health Management and Remaining Useful Life Prediction [0.5621251909851629]
本稿では,タービン診断のためのマルチタスク科学機械学習フレームワークを提案する。
TGTU、デルタタービンガス温度(DTGT)、Remaining Useful Life(RUL)を共同で予測する。
平均絶対誤差(MAE)、予測区間カバレッジ確率(PICP)、平均区間幅(MPIW)、カバレッジ幅基準(CWC)などの点と間隔の指標を用いて評価する。
論文 参考訳(メタデータ) (2026-05-28T21:39:53Z) - Tyche: One Step Flow for Efficient Probabilistic Weather Forecasting [48.263481135566316]
我々は,効率的な確率的天気予報のための一段階条件付き流れモデルであるTycheを提案する。
ERA5の1.5ドル(約1万2000円)と6時間の解像度での実験では、たった1つのNFEを使って、最先端の多段階生成ベースラインの予測スキルとキャリブレーションを一致または超過していることが示されています。
論文 参考訳(メタデータ) (2026-05-07T20:25:28Z) - Improving Semantic Uncertainty Quantification in Language Model Question-Answering via Token-Level Temperature Scaling [55.29156356409814]
現状のアプローチ,特に温度の固定化は,系統的に誤校正され,識別性に欠けるセマンティックな信頼性分布を生じさせることを示す。
一つの温度を最適化することは、適切な帰納バイアスをもたらすと我々は主張するが、驚くほど単純だが効果的な解であることを示した。
論文 参考訳(メタデータ) (2026-04-08T15:00:32Z) - Bridging the Gap Between Bayesian Deep Learning and Ensemble Weather Forecasts [100.26854618129039]
天気予報は、大気のカオス的な性質によって根本的に挑戦されている。
ベイジアンディープラーニング(BDL)の最近の進歩は、有望だがしばしば非接続な代替手段を提供する。
気象予報のための統合型BDLフレームワークにより,これらのパラダイムを橋渡しする。
論文 参考訳(メタデータ) (2025-11-18T07:49:52Z) - Km-scale dynamical downscaling through conformalized latent diffusion models [45.94979929172337]
高分解能気象場を粗大なシミュレーションから導き出すためには, 動的ダウンスケーリングが不可欠である。
Generative Diffusion Model(DM)は、最近、このタスクのための強力なデータ駆動ツールとして登場した。
しかし、DMは過信予測に対する有限サンプル保証を欠いているため、グリッドポイントレベルの不確実性推定が誤って行われる。
我々は、コンフォーマルな予測フレームワークでダウンスケーリングパイプラインを拡張することで、この問題に対処する。
論文 参考訳(メタデータ) (2025-10-15T08:41:36Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Uncertainty Quantification for Traffic Forecasting: A Unified Approach [21.556559649467328]
不確実性は時系列予測タスクに不可欠な考慮事項である。
本研究では,交通予測の不確かさの定量化に焦点をあてる。
STUQ(Deep S-Temporal Uncertainity Quantification)を開発した。
論文 参考訳(メタデータ) (2022-08-11T15:21:53Z) - Theory of versatile fidelity estimation with confidence [1.9573380763700712]
本稿では,任意の特定の測定設定に対して,ほぼ最小限の信頼区間を持つ推定器を構成する手法を提案する。
理論的および数値的な結果を組み合わせることで,提案手法の様々な望ましい特性を実証する。
我々の手法は、同じ保証でオブザーバブルの期待値を推定するためにも利用できる。
論文 参考訳(メタデータ) (2021-12-15T08:03:05Z) - Quantifying Uncertainty in Deep Spatiotemporal Forecasting [67.77102283276409]
本稿では,正規格子法とグラフ法という2種類の予測問題について述べる。
我々はベイジアンおよび頻繁な視点からUQ法を解析し、統計的決定理論を通じて統一的な枠組みを提示する。
実際の道路ネットワークのトラフィック、疫病、空気質予測タスクに関する広範な実験を通じて、異なるUQ手法の統計計算トレードオフを明らかにする。
論文 参考訳(メタデータ) (2021-05-25T14:35:46Z) - Conformal Inference of Counterfactuals and Individual Treatment Effects [6.810856082577402]
そこで本研究では,反ファクトや個々の治療効果について,信頼できる間隔を推定できる共形推論に基づく手法を提案する。
既存の手法は、単純なモデルであってもかなりのカバレッジの欠陥に悩まされる。
論文 参考訳(メタデータ) (2020-06-11T01:03:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。