論文の概要: Interpretable reinforcement learning for heat pump control through asymmetric differentiable decision trees
- arxiv url: http://arxiv.org/abs/2506.01641v1
- Date: Mon, 02 Jun 2025 13:16:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.305673
- Title: Interpretable reinforcement learning for heat pump control through asymmetric differentiable decision trees
- Title(参考訳): 非対称微分決定木によるヒートポンプ制御の解釈型強化学習
- Authors: Toon Van Puyvelde, Mehran Zareh, Chris Develder,
- Abstract要約: そこで本研究では,非対称なソフトDDT構築法を提案する。
従来のソフトなDDTとは異なり、我々の手法は必要に応じてノードを拡大することで木を適応的に構築する。
家庭用エネルギー管理システムにおいて, 透明性, 効率, 高性能な意思決定を実現するための非対称DDTの可能性を示す。
- 参考スコア(独自算出の注目度): 4.573008040057806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, deep reinforcement learning (DRL) algorithms have gained traction in home energy management systems. However, their adoption by energy management companies remains limited due to the black-box nature of DRL, which fails to provide transparent decision-making feedback. To address this, explainable reinforcement learning (XRL) techniques have emerged, aiming to make DRL decisions more transparent. Among these, soft differential decision tree (DDT) distillation provides a promising approach due to the clear decision rules they are based on, which can be efficiently computed. However, achieving high performance often requires deep, and completely full, trees, which reduces interpretability. To overcome this, we propose a novel asymmetric soft DDT construction method. Unlike traditional soft DDTs, our approach adaptively constructs trees by expanding nodes only when necessary. This improves the efficient use of decision nodes, which require a predetermined depth to construct full symmetric trees, enhancing both interpretability and performance. We demonstrate the potential of asymmetric DDTs to provide transparent, efficient, and high-performing decision-making in home energy management systems.
- Abstract(参考訳): 近年、家庭エネルギー管理システムにおいて、深層強化学習(DRL)アルゴリズムが注目を集めている。
しかし、DRLのブラックボックス性のため、エネルギー管理会社による採用は限定的であり、透明な意思決定フィードバックの提供に失敗している。
これを解決するために、DRL決定をより透明にすることを目的として、説明可能な強化学習(XRL)技術が登場した。
これらのうち、ソフトディファレンシャル決定木 (DDT) の蒸留は、それらがベースとしている明確な決定規則のために有望なアプローチを提供し、効率的に計算することができる。
しかし、高いパフォーマンスを達成するには、しばしば深い、完全に満ちた木を必要とするため、解釈容易性が低下する。
そこで本研究では,非対称なソフトDDT構築法を提案する。
従来のソフトなDDTとは異なり、我々の手法は必要に応じてノードを拡大することで木を適応的に構築する。
これにより、完全な対称木を構築するために所定の深さを必要とする決定ノードの効率が向上し、解釈可能性と性能が向上する。
家庭用エネルギー管理システムにおいて, 透明性, 効率, 高性能な意思決定を実現するための非対称DDTの可能性を示す。
関連論文リスト
- Monte Carlo Tree Diffusion for System 2 Planning [57.50512800900167]
モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
MCTDは拡散フレームワーク内での探索・探索トレードオフの制御などのMCTSの利点を享受する。
論文 参考訳(メタデータ) (2025-02-11T02:51:42Z) - Enhance Learning Efficiency of Oblique Decision Tree via Feature Concatenation [16.81813720905545]
特徴連結を用いた拡張ODT法(textttFC-ODT)を提案する。
textttFC-ODTは、決定経路に沿って投影を送信するためのモデル内の特徴変換を可能にする。
実験により、textttFC-ODTは、木深が制限された他の最先端の決定木よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-01T15:49:18Z) - RL-LLM-DT: An Automatic Decision Tree Generation Method Based on RL Evaluation and LLM Enhancement [82.02155942106877]
RL評価とLLM強調に基づく自動決定木生成法であるRL-LLM-DTを提案する。
この統合手法の有効性を評価するため,カーリングゲームで実験を行った。
論文 参考訳(メタデータ) (2024-12-16T03:33:49Z) - RGMDT: Return-Gap-Minimizing Decision Tree Extraction in Non-Euclidean Metric Space [28.273737052758907]
オラクルの専門家政策と最適決定木政策のリターンギャップの上限について紹介する。
これにより、各エージェントの局所的な観測と行動値空間上で、DT抽出問題を新しい非ユークリッドクラスタリング問題に再キャストすることができる。
また,Return-Gap-Minimization Decision Tree (RGMDT)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-21T21:19:49Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Breiman meets Bellman: Non-Greedy Decision Trees with MDPs [8.530182510074983]
我々は、欲求と最適なアプローチのギャップを埋めるフレームワークDPDT(Dynamic Programming Decision Trees)を提案する。
DPDTはマルコフ決定プロセスの定式化と分割生成を組み合わせ、ほぼ最適決定木を構築する。
実験の結果,DPDTは既存の最適解法よりも桁違いに少ない演算でほぼ最適損失を達成できた。
論文 参考訳(メタデータ) (2023-09-22T08:18:08Z) - Optimal Planning of Hybrid Energy Storage Systems using Curtailed
Renewable Energy through Deep Reinforcement Learning [0.0]
エネルギー貯蔵システム(ESS)を計画するためのポリシーに基づくアルゴリズムを用いた高度な深層強化学習手法を提案する。
定量的性能比較の結果、DRLエージェントはシナリオベース最適化(SO)アルゴリズムよりも優れていた。
その結果、DRLエージェントは人間の専門家が行うように学習し、提案手法の信頼性が示唆された。
論文 参考訳(メタデータ) (2022-12-12T02:24:50Z) - Knowledge Distillation Decision Tree for Unravelling Black-box Machine Learning Models [0.0]
我々は知識蒸留決定木(KDDT)の方法を紹介する。
KDDTは、ブラックボックスモデルから決定木へのデータに関する知識の蒸留を可能にする。
ハイブリッドKDDTを構築するための効率的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-06-09T17:57:37Z) - Rectified Decision Trees: Exploring the Landscape of Interpretable and
Effective Machine Learning [66.01622034708319]
我々は,reDT(rerectified decision tree)と呼ばれる知識蒸留に基づく決定木拡張を提案する。
我々は,ソフトラベルを用いたトレーニングを可能にする標準決定木の分割基準と終了条件を拡張した。
次に,教師モデルから抽出したソフトラベルに基づいて,新しいジャックニフェ法を用いてReDTを訓練する。
論文 参考訳(メタデータ) (2020-08-21T10:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。