論文の概要: Extracting Actionable Insights from Building Energy Data using Vision LLMs on Wavelet and 3D Recurrence Representations
- arxiv url: http://arxiv.org/abs/2509.21934v1
- Date: Fri, 26 Sep 2025 06:18:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.229893
- Title: Extracting Actionable Insights from Building Energy Data using Vision LLMs on Wavelet and 3D Recurrence Representations
- Title(参考訳): ウェーブレットと3次元再帰表現を用いたビルエネルギーデータからの実用的な洞察抽出
- Authors: Amine Bechar, Adel Oulefki, Abbes Amira, Fatih Kurogollu, Yassine Himeur,
- Abstract要約: データの3次元グラフィカル表現に基づいて視覚言語大モデル(VLLM)を微調整するフレームワークを提案する。
連続ウェーブレット変換(CWT)と繰り返しプロット(RP)を用いた1次元時系列を3次元表現に変換する手法
これらの3Dエンコーディングにより、VLLMはエネルギー消費パターンを視覚的に解釈し、異常を検出し、エネルギー効率を推奨できる。
- 参考スコア(独自算出の注目度): 4.65346771370866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The analysis of complex building time-series for actionable insights and recommendations remains challenging due to the nonlinear and multi-scale characteristics of energy data. To address this, we propose a framework that fine-tunes visual language large models (VLLMs) on 3D graphical representations of the data. The approach converts 1D time-series into 3D representations using continuous wavelet transforms (CWTs) and recurrence plots (RPs), which capture temporal dynamics and localize frequency anomalies. These 3D encodings enable VLLMs to visually interpret energy-consumption patterns, detect anomalies, and provide recommendations for energy efficiency. We demonstrate the framework on real-world building-energy datasets, where fine-tuned VLLMs successfully monitor building states, identify recurring anomalies, and generate optimization recommendations. Quantitatively, the Idefics-7B VLLM achieves validation losses of 0.0952 with CWTs and 0.1064 with RPs on the University of Sharjah energy dataset, outperforming direct fine-tuning on raw time-series data (0.1176) for anomaly detection. This work bridges time-series analysis and visualization, providing a scalable and interpretable framework for energy analytics.
- Abstract(参考訳): 動作可能な洞察とレコメンデーションのための複雑なビルディング時系列の分析は、エネルギーデータの非線形およびマルチスケール特性のため、依然として困難なままである。
そこで本研究では,データの3次元グラフィカル表現に基づいて,視覚言語大モデル(VLLM)を微調整するフレームワークを提案する。
この手法は1次元時系列を連続ウェーブレット変換(CWT)と繰り返しプロット(RP)を用いて3次元表現に変換する。
これらの3Dエンコーディングにより、VLLMはエネルギー消費パターンを視覚的に解釈し、異常を検出し、エネルギー効率を推奨できる。
実世界のビルディングエネルギデータセットのフレームワークを実演し、細調整されたVLLMが構築状態の監視に成功し、繰り返し発生する異常を特定し、最適化レコメンデーションを生成する。
定量的に、Idefics-7B VLLMは、CWTによる0.0952、Sharjah大学のエネルギーデータセットにおけるRPによる0.1064の検証損失を達成し、異常検出のための生の時系列データ(0.1176)を直接微調整する。
この作業は時系列分析と可視化を橋渡しし、エネルギー分析のためのスケーラブルで解釈可能なフレームワークを提供する。
関連論文リスト
- DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos [52.46386528202226]
Deformable Gaussian Splats Large Reconstruction Model (DGS-LRM)を紹介する。
動的シーンのモノクロポーズビデオから変形可能な3Dガウススプラットを予測する最初のフィードフォワード法である。
最先端のモノクロビデオ3D追跡手法と同等の性能を発揮する。
論文 参考訳(メタデータ) (2025-06-11T17:59:58Z) - Generating Synthetic Stereo Datasets using 3D Gaussian Splatting and Expert Knowledge Transfer [16.040335263873278]
ステレオデータセット生成のための3D Gaussian Splatting(3DGS)ベースのパイプラインを導入し、Neural Radiance Fields(NeRF)ベースの手法の効率的な代替手段を提供する。
3DGS生成データセット上でのステレオモデルを微調整すると、ゼロショット一般化ベンチマークにおいて競合性能を示す。
論文 参考訳(メタデータ) (2025-06-05T11:41:09Z) - Dynamic Graph Induced Contour-aware Heat Conduction Network for Event-based Object Detection [42.021851148914145]
イベントベースのビジョンセンサー(EVS)は、低照度環境で従来のRGBフレームベースのカメラに対して大きな優位性を示している。
本稿では,イベントストリームに基づく物体検出のための動的グラフ誘導輪郭対応熱伝導ネットワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T09:44:01Z) - MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion [118.74385965694694]
我々は動的シーンから時間ステップごとの幾何を直接推定する新しい幾何学的アプローチであるMotion DUSt3R(MonST3R)を提案する。
各タイムステップのポイントマップを単純に推定することで、静的シーンにのみ使用されるDUST3Rの表現を動的シーンに効果的に適応させることができる。
我々は、問題を微調整タスクとしてポーズし、いくつかの適切なデータセットを特定し、この制限されたデータ上でモデルを戦略的に訓練することで、驚くほどモデルを動的に扱えることを示す。
論文 参考訳(メタデータ) (2024-10-04T18:00:07Z) - Deep learning-based deconvolution for interferometric radio transient
reconstruction [0.39259415717754914]
LOFAR、MeerKAT/SKA、ASKAP/SKA、そして将来のSKA-LOWのような電波天文学施設は、時間と周波数に大きな感度をもたらす。
これらの施設は、自然によって揮発し、データに検出または見逃される無線過渡現象の高度な研究を可能にする。
これらのトランジェントは、電子の高エネルギー加速のマーカーであり、幅広い時間スケールで表される。
論文 参考訳(メタデータ) (2023-06-24T08:58:52Z) - EasyDGL: Encode, Train and Interpret for Continuous-time Dynamic Graph Learning [92.71579608528907]
本稿では,3つのモジュールから構成される使い勝手の良いパイプライン(EasyDGL)を設計することを目的とする。
EasyDGLは、進化するグラフデータからモデルが学習する周波数コンテンツの予測力を効果的に定量化することができる。
論文 参考訳(メタデータ) (2023-03-22T06:35:08Z) - Exploring Point-BEV Fusion for 3D Point Cloud Object Tracking with
Transformer [62.68401838976208]
3Dオブジェクトトラッキングは、オブジェクトテンプレートが与えられた連続したフレームにおけるオブジェクトの位置と向きを予測することを目的としている。
トランスの成功に触発されたPTTR(Point Tracking TRansformer)を提案する。
論文 参考訳(メタデータ) (2022-08-10T08:36:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。