論文の概要: A Highly Configurable Framework for Large-Scale Thermal Building Data Generation to drive Machine Learning Research
- arxiv url: http://arxiv.org/abs/2512.00483v1
- Date: Sat, 29 Nov 2025 13:31:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.261153
- Title: A Highly Configurable Framework for Large-Scale Thermal Building Data Generation to drive Machine Learning Research
- Title(参考訳): 機械学習研究を駆動する大規模熱建築データ生成のための高構成可能なフレームワーク
- Authors: Thomas Krug, Fabian Raisch, Dominik Aimer, Markus Wirnsberger, Ferdinand Sigg, Felix Koch, Benjamin Schäfer, Benjamin Tischler,
- Abstract要約: BuilDaは、機械学習(ML)研究に十分な品質と量の合成データを生成するように設計されている。
大量のデータを生成するために、深いシミュレーション知識を必要としない。
本研究では,486データ駆動モデルの微調整を含む伝達学習において,データを生成して利用することによってBuilDaを実証する。
- 参考スコア(独自算出の注目度): 22.54521342959957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-driven modeling of building thermal dynamics is emerging as an increasingly important field of research for large-scale intelligent building control. However, research in data-driven modeling using machine learning (ML) techniques requires massive amounts of thermal building data, which is not easily available. Neither empirical public datasets nor existing data generators meet the needs of ML research in terms of data quality and quantity. Moreover, existing data generation approaches typically require expert knowledge in building simulation. To fill this gap, we present a thermal building data generation framework which we call BuilDa. BuilDa is designed to produce synthetic data of adequate quality and quantity for ML research. The framework does not require profound building simulation knowledge to generate large volumes of data. BuilDa uses a single-zone Modelica model that is exported as a Functional Mock-up Unit (FMU) and simulated in Python. We demonstrate BuilDa by generating data and utilizing it for a transfer learning study involving the fine-tuning of 486 data-driven models.
- Abstract(参考訳): 建築熱力学のデータ駆動モデリングは、大規模インテリジェントな建物制御のための研究分野としてますます重要になっている。
しかし、機械学習(ML)技術を用いたデータ駆動モデリングの研究は、大量のサーマルビルディングデータを必要とするため、簡単には利用できない。
実証的な公開データセットも既存のデータジェネレータも、データ品質と量の観点からMLリサーチのニーズを満たしていない。
さらに、既存のデータ生成アプローチは、一般的にシミュレーションを構築する際に専門家の知識を必要とする。
このギャップを埋めるために、BuilDaと呼ばれるサーマルビルディングデータ生成フレームワークを紹介します。
BuilDaは、ML研究に十分な品質と量の合成データを生成するように設計されている。
このフレームワークは大量のデータを生成するために、深いシミュレーション知識を必要としない。
BuilDaは単一ゾーンモデルを使用し、FMU(Functional Mock-up Unit)としてエクスポートされ、Pythonでシミュレートされる。
本研究では,486データ駆動モデルの微調整を含む伝達学習において,データを生成して利用することによってBuilDaを実証する。
関連論文リスト
- Generative Models for Synthetic Data: Transforming Data Mining in the GenAI Era [49.46005489386284]
このチュートリアルでは、合成データ生成の基礎と最新の進歩を紹介する。
Atendeesは、生成的合成データを活用してデータマイニングの研究と実践を強化する、実用的な洞察を得る。
論文 参考訳(メタデータ) (2025-08-27T05:04:07Z) - BUILDA: A Thermal Building Data Generation Framework for Transfer Learning [26.47874938214435]
トランスファーラーニングは、建築熱力学のデータ駆動モデリングを改善することができる。
本稿では,TL研究における適切な品質と量の合成データを生成するためのフレームワークであるBuilDaについて述べる。
論文 参考訳(メタデータ) (2025-08-18T08:01:37Z) - A preliminary data fusion study to assess the feasibility of Foundation Process-Property Models in Laser Powder Bed Fusion [0.0]
基礎プロセスプロパティモデルの構築を妨げる大きな課題は、データの不足である。
レーザー粉末層融合(LPBF)における17-4 PHおよび316Lステンレス鋼(SS)から実験データセットを生成する。
次に、ガウス過程(GP)を様々な構成のプロセス固有性モデリングに利用し、ある物質系や性質に関する知識を活用できるかどうかを検証し、他の物質系や特性のためのより正確な機械学習モデルを構築する。
論文 参考訳(メタデータ) (2025-03-20T19:29:38Z) - DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback [62.235925602004535]
DataEnvGymは、データ生成エージェントのための教師環境のテストベッドである。
エージェントとデータ生成エンジンを含むシーケンシャルな意思決定タスクとして、データ生成をフレーム化する。
学生は、生成されたデータに基づいて反復的に訓練され、評価され、各イテレーション後にエージェントにフィードバックが報告される。
論文 参考訳(メタデータ) (2024-10-08T17:20:37Z) - A Benchmark Time Series Dataset for Semiconductor Fabrication Manufacturing Constructed using Component-based Discrete-Event Simulation Models [0.0]
この研究はIntel半導体製造工場のベンチマークモデルに基づいている。
時系列データセットは離散時間軌道を用いて構築される。
データセットは、機械学習コミュニティで行動分析に利用することもできる。
論文 参考訳(メタデータ) (2024-08-17T23:05:47Z) - Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文 参考訳(メタデータ) (2024-08-01T21:38:09Z) - Scaling Data-Driven Building Energy Modelling using Large Language Models [3.0309252269809264]
本稿では,ビル管理システムにおけるデータ駆動型モデルの開発に伴うスケーラビリティ問題に対処する手法を提案する。
我々は、大規模言語モデル(LLM)を使用して、BMSから構造化データを処理するコードを生成し、BMS固有の要求に対してデータ駆動モデルを構築します。
ケーススタディでは、プロンプトテンプレートの下での双方向のプロンプトは、高いコード生成率とコード精度を実現し、人件費を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2024-07-03T19:34:24Z) - Scalable Diffusion for Materials Generation [99.71001883652211]
我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文 参考訳(メタデータ) (2023-10-18T15:49:39Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Optimizing the AI Development Process by Providing the Best Support
Environment [0.756282840161499]
機械学習の主なステージは、問題理解、データ管理、モデル構築、モデル展開、メンテナンスである。
このフレームワークは、ディープラーニングの進歩を使ってデータ拡張を実行するために、python言語を使用して構築された。
論文 参考訳(メタデータ) (2023-04-29T00:44:50Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。