論文の概要: Trustworthy and Explainable Deep Reinforcement Learning for Safe and Energy-Efficient Process Control: A Use Case in Industrial Compressed Air Systems
- arxiv url: http://arxiv.org/abs/2512.18317v1
- Date: Sat, 20 Dec 2025 11:11:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.288067
- Title: Trustworthy and Explainable Deep Reinforcement Learning for Safe and Energy-Efficient Process Control: A Use Case in Industrial Compressed Air Systems
- Title(参考訳): 安全かつエネルギー効率の良いプロセス制御のための信頼性と説明可能な深部強化学習:産業用圧縮空気システムにおける一事例
- Authors: Vincent Bezold, Patrick Wagner, Jakob Hofmann, Marco Huber, Alexander Sauer,
- Abstract要約: 本稿では,産業用圧縮空気システムの制御における信頼性の高い強化学習手法を提案する。
本研究では,現実的な境界条件下での安全かつエネルギー効率の高い運転を可能にする枠組みを開発する。
実証的な評価は、学習されたポリシーが物理的に妥当であり、将来の需要を予想し、一貫してシステムの境界を尊重していることを示している。
- 参考スコア(独自算出の注目度): 40.329506465917646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a trustworthy reinforcement learning approach for the control of industrial compressed air systems. We develop a framework that enables safe and energy-efficient operation under realistic boundary conditions and introduce a multi-level explainability pipeline combining input perturbation tests, gradient-based sensitivity analysis, and SHAP (SHapley Additive exPlanations) feature attribution. An empirical evaluation across multiple compressor configurations shows that the learned policy is physically plausible, anticipates future demand, and consistently respects system boundaries. Compared to the installed industrial controller, the proposed approach reduces unnecessary overpressure and achieves energy savings of approximately 4\,\% without relying on explicit physics models. The results further indicate that system pressure and forecast information dominate policy decisions, while compressor-level inputs play a secondary role. Overall, the combination of efficiency gains, predictive behavior, and transparent validation supports the trustworthy deployment of reinforcement learning in industrial energy systems.
- Abstract(参考訳): 本稿では,産業用圧縮空気システムの制御における信頼性の高い強化学習手法を提案する。
我々は,現実的な境界条件下での安全かつエネルギー効率の高い操作を可能にするフレームワークを開発し,入力摂動試験,勾配に基づく感度解析,SHAP(SHapley Additive ExPlanations)特徴属性を組み合わせた多レベル説明可能性パイプラインを導入する。
複数の圧縮機構成にまたがる実証的な評価は、学習されたポリシーが物理的に妥当であり、将来の需要を予測し、システムの境界を常に尊重していることを示している。
設置された産業用制御装置と比較して、提案手法は不要な過圧を低減し、明示的な物理モデルに頼ることなく約4\,\%の省エネを実現する。
さらに、システム圧力と予測情報が政策決定を支配し、圧縮機レベルの入力が二次的な役割を果たすことを示す。
全体として、効率向上、予測行動、透明な検証の組み合わせは、産業エネルギーシステムにおける強化学習の信頼性の高い展開を支持している。
関連論文リスト
- A Comparative Study of Rule-Based and Data-Driven Approaches in Industrial Monitoring [2.320417845168326]
ルールベースのシステムは、高い解釈可能性、決定論的振る舞い、安定した環境における実装の容易さを提供する。
データ駆動システムは隠れた異常を検知し、予測保守と新しい条件への動的適応を可能にする。
本稿では、ルールベースの論理の透明性と機械学習の分析能力を組み合わせたハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2025-09-19T10:31:59Z) - Space-scale Exploration of the Poor Reliability of Deep Learning Models: the Case of the Remote Sensing of Rooftop Photovoltaic Systems [0.7499722271664147]
ディープラーニングを用いた屋上PVシステムのリモートセンシングが有望なソリューションとして浮上した。
既存の技術は、屋上PVの最新の統計を構築するのに十分な信頼性を持っていない。
本研究では,屋上PVパネルの検出を訓練したディープラーニングモデルの分類精度に及ぼす分布シフトの影響を網羅的に評価する。
論文 参考訳(メタデータ) (2024-07-31T14:34:18Z) - Enhancing Security in Federated Learning through Adaptive
Consensus-Based Model Update Validation [2.28438857884398]
本稿では,ラベルフリップ攻撃に対して,FL(Federated Learning)システムを構築するための高度なアプローチを提案する。
本稿では,適応的しきい値設定機構と統合されたコンセンサスに基づく検証プロセスを提案する。
以上の結果から,FLシステムのレジリエンスを高め,ラベルフリップ攻撃の顕著な緩和効果が示唆された。
論文 参考訳(メタデータ) (2024-03-05T20:54:56Z) - Conformal Policy Learning for Sensorimotor Control Under Distribution
Shifts [61.929388479847525]
本稿では,センサコントローラの観測値の分布変化を検知・応答する問題に焦点をあてる。
鍵となる考え方は、整合量子を入力として取ることができるスイッチングポリシーの設計である。
本稿では, 基本方針を異なる特性で切り替えるために, 共形量子関数を用いてこのようなポリシーを設計する方法を示す。
論文 参考訳(メタデータ) (2023-11-02T17:59:30Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - An Energy and Carbon Footprint Analysis of Distributed and Federated
Learning [42.37180749113699]
古典的で中央集権的な人工知能(AI)手法では、生産者(センサー、マシン)からエネルギー空腹のデータセンターへデータを移動する必要がある。
このような高エネルギーコストを緩和する新たな代替手段は、デバイス間で学習タスクを効率的に分散またはフェデレートすることを提案している。
本稿では,分散学習におけるエネルギーおよび炭素フットプリントの分析のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-06-21T13:28:49Z) - Forced Variational Integrator Networks for Prediction and Control of
Mechanical Systems [7.538482310185133]
強制的変動積分器ネットワーク(FVIN)アーキテクチャにより,エネルギー散逸と外部強制を正確に考慮できることを示す。
これにより、高データ効率のモデルベース制御が可能となり、実際の非保守的なシステムで予測できる。
論文 参考訳(メタデータ) (2021-06-05T21:39:09Z) - Enforcing Policy Feasibility Constraints through Differentiable
Projection for Energy Optimization [57.88118988775461]
本稿では,ニューラルポリシー内での凸操作制約を強制するために,PROF(Projected Feasibility)を提案する。
エネルギー効率の高い建築操作とインバータ制御の2つの応用についてPROFを実証する。
論文 参考訳(メタデータ) (2021-05-19T01:58:10Z) - Cautious Reinforcement Learning with Logical Constraints [78.96597639789279]
適応型安全なパッドディングは、学習プロセス中の安全性を確保しつつ、RL(Reinforcement Learning)に最適な制御ポリシーの合成を強制する。
理論的な保証は、合成されたポリシーの最適性と学習アルゴリズムの収束について利用できる。
論文 参考訳(メタデータ) (2020-02-26T00:01:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。