論文の概要: Quantifying the Energy Floor: Direct Measurement and Replay Buffer Bias in SAC-Based HVAC Control on sbsim
- arxiv url: http://arxiv.org/abs/2606.01665v1
- Date: Mon, 01 Jun 2026 04:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.97178
- Title: Quantifying the Energy Floor: Direct Measurement and Replay Buffer Bias in SAC-Based HVAC Control on sbsim
- Title(参考訳): エネルギーフロアの定量化:SACによるSbsim上のHVAC制御におけるバッファバイアスの直接測定と再生
- Authors: Bo Li, Chen Zhang,
- Abstract要約: 我々は、作用空間の制約が与えられた最小の達成可能なコストであるエネルギーフロアを定量化する。
アルゴリズム設計ではなく,機器の最小電力が結合制約を課していることを示す。
- 参考スコア(独自算出の注目度): 11.786187674492558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We quantify the energy floor -- the minimum achievable cost given action space constraints -- for Soft Actor-Critic (SAC) HVAC control on the sbsim calibrated building simulator. Through minimum-action experiments, we directly measure this floor at USD 35.51/day, dominated by continuous electrical loads (USD 35.44, 99.8%) with negligible gas consumption. The standard SAC baseline, initialized with schedule-policy replay buffer transitions, converges to USD 37.18/day, 4.7% above the floor. We identify buffer initialization as the dominant source of sub-optimality in this scenario: training from an empty buffer reduces cost to USD 35.57/day, eliminating 96% of the gap. Expanding the supply water temperature range by 10 K yields negligible additional savings (USD 0.03/day), and further expansion triggers physical constraint violations. We additionally uncover a discount factor coupling (gamma_eff = 0.891) shrinking the effective planning horizon from 8.3 h to 46 min -- a benchmark-wide issue warranting audit. Systematic ablation across planning horizon, reward weights, and observation enrichment confirms all pre-filled-buffer configurations cluster within 0.7% (USD 37.18--USD 37.42), demonstrating that equipment minimum power -- not algorithmic design -- imposes the binding constraint.
- Abstract(参考訳): SAC(Soft Actor-Critic) HVAC (Soft Actor-Critic) HVAC Control on the sbsim calibrated building simulator。
最低限の実験を通じて、我々はこのフロアを1日35.51 USDで直接測定し、連続的な電気負荷(USD 35.44, 99.8%)と無視できないガス消費によって支配する。
標準のSACベースラインは、スケジュールポリシーのバッファー遷移で初期化され、37.18/日、フロアの4.7%まで収束する。
このシナリオではバッファの初期化をサブ最適化の主流の源としており、空のバッファからのトレーニングは1日あたり35.57USドルまでコストを削減し、ギャップの96%を排除している。
10Kの供給水温範囲を拡大すると、無視できる追加貯水量(USD 0.03/日)が増加し、さらなる拡張は物理的制約違反を引き起こす。
さらに, 有効計画地平線を8.3hから46分に縮小する割引係数結合 (gamma_eff = 0.891) を, ベンチマークワイド問題保証監査により明らかにした。
計画地平線、報酬重量、観測量による体系的アブレーションにより、0.7%(USD 37.18--USD 37.42)以内の全てのプレフィルドバッファ構成が確認され、アルゴリズム設計ではなく機器の最小出力が結合制約を課すことを示した。
関連論文リスト
- ActQuant: Sub-4-bit Action-Guided Quantization for Vision-Language-Action Models [45.62029693245481]
本稿では,アクション誘導型混合精度PTQフレームワークであるActQuantを紹介する。
ActQuant は、(1) エージェントの動作の予測にどの程度貢献するかに基づいて、各重み行列に1ビット幅を割り当てるテンソル間ビットアロケータである。
我々はまた、効率的な低ビットカーネルを持つネイティブC/C++にポートするエージェント変換パイプラインであるOmniModelも導入した。
論文 参考訳(メタデータ) (2026-05-19T19:57:26Z) - BitCal-TTS: Bit-Calibrated Test-Time Scaling for Quantized Reasoning Models [0.0]
BitCal-TTSは、greedy 4ビット推論のための軽量ランタイムコントローラである。
標準のHugging Face 4ビット推論と統合され、フォワードフックを使ってログとラストレイヤーの隠蔽状態を生成する。
Qwen2.5インストラクトモデルによるGSM8Kの評価シャードについて、BitCal-TTSは、非ビット対応ベースラインよりも正確なマッチング精度を向上させる。
論文 参考訳(メタデータ) (2026-05-07T01:10:34Z) - SPLICE: Latent Diffusion over JEPA Embeddings for Conformal Time-Series Inpainting [0.5076419064097734]
時系列計算のための生成モデルは、強い復元精度を実現するが、有限サンプル信頼性保証は提供しない。
SPLICEは分散のないオンライン適応予測区間と遅延生成計算を結合したモジュラーフレームワークである。
プールされたJEPAエンコーダは、9つのフィードでトレーニングされ、4つの見えないドメインに転送される。
論文 参考訳(メタデータ) (2026-04-30T18:27:08Z) - Green MLOps: Closed-Loop, Energy-Aware Inference with NVIDIA Triton, FastAPI, and Bio-Inspired Thresholding [0.0]
バイオインスパイアされたフレームワークは、タンパク質の折りたたみエネルギー盆地をコストの展望にマッピングする。
電力対エネルギーのトレードオフが望ましい場合にのみ、要求が認められます。
結果は、バイオ物理エネルギーモデルとグリーンMLORTOpsを結びつけ、生産におけるクローズドループエネルギー認識推論の実践的で監査可能な基礎を提供する。
論文 参考訳(メタデータ) (2026-01-06T15:50:11Z) - Low-cost Embedded Breathing Rate Determination Using 802.15.4z IR-UWB Hardware for Remote Healthcare [2.6066253940276347]
本稿では,超広帯域(UWB)チャネルインパルス応答(CIR)データから呼吸速度を予測するための畳み込みニューラルネットワーク(CNN)を提案する。
46KBのメモリを必要とするnRF52840システムにアルゴリズムをデプロイし,192msの推論時間で動作可能であることを示す。
論文 参考訳(メタデータ) (2025-04-03T07:54:25Z) - RULSurv: A probabilistic survival-based method for early censoring-aware prediction of remaining useful life in ball bearings [39.58317527488534]
Kullback-Leibler分散とRUL推定を用いた早期故障検出のための新しいフレキシブルな手法を提案する。
我々は,XJTU-SYデータセットにおいて,3つの異なる操作条件にまたがる5倍のクロスバリデーション戦略を用いてアプローチを実証する。
提案手法は,最大荷重下での5軸受の平均累積相対精度(CRA)を0.7586で達成し,複数の最先端ベースラインを改良する。
論文 参考訳(メタデータ) (2024-05-02T16:17:29Z) - KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization [67.74400574357472]
LLMは、大きなコンテキストウィンドウを必要とするアプリケーションでの利用が増えており、この大きなコンテキストウィンドウでは、KVキャッシュのアクティベーションが推論時のメモリ消費の主要な要因として表面化している。
量子化はKVキャッシュのアクティベーションを圧縮する上で有望な手法であるが、既存のソリューションは4ビット以下の精度でアクティベーションを正確に表現できない。
我々の研究であるKVQuantは、いくつかの新しい手法を取り入れることで、低精度のKVキャッシュ量子化を容易にする。
論文 参考訳(メタデータ) (2024-01-31T18:58:14Z) - Quantized Neural Networks for Low-Precision Accumulation with Guaranteed
Overflow Avoidance [68.8204255655161]
本稿では,推定時のアキュムレータの精度を下げる際に,数値オーバーフローを回避する量子化学習アルゴリズムを提案する。
本手法は,浮動小数点点ベースラインに対するモデル精度を維持しつつ,アキュムレータの精度を低減できることを示す。
論文 参考訳(メタデータ) (2023-01-31T02:46:57Z) - Efficient Speech Representation Learning with Low-Bit Quantization [32.75829498841329]
音声表現学習モデルにおける最近の量子化手法を適用し,検討する。
1ビットへのアグレッシブ量子化により、86.32%のストレージ削減(4.42 -> 25.23)、88%のランタイム削減(1.00 -> 0.12)とワードエラー率(7.06 -> 15.96)を達成した。
モデル圧縮も目的とするDistillHuBERTと比較すると、2ビット構成ではストレージがわずかに小さく(35.84対46.98)、ワードエラー率(12.68対13.37)、ランタイム推定(0.15対0.73)が向上した。
論文 参考訳(メタデータ) (2022-12-14T06:09:08Z) - Simple Baselines for Image Restoration [79.48718779396971]
本稿では,SOTA(State-of-the-art)法を超越した,計算効率の高い単純なベースラインを提案する。
我々は、ベースラインからActivation Free Network、すなわちNAFNetを導出する。
SOTAの結果は、GoProの33.69dB PSNR(画像劣化)、計算コストのわずか8.4%のSOTA 0.38dB、SIDDの40.30dB PSNR(画像劣化)、計算コストの半分未満のSOTA 0.28dBといった、様々な挑戦的なベンチマークで達成されている。
論文 参考訳(メタデータ) (2022-04-10T12:48:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。