論文の概要: On Designing Data Models for Energy Feature Stores
- arxiv url: http://arxiv.org/abs/2205.04267v1
- Date: Mon, 9 May 2022 13:35:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 16:51:01.010344
- Title: On Designing Data Models for Energy Feature Stores
- Title(参考訳): エネルギー機能ストアのためのデータモデル設計について
- Authors: Gregor Cerar, Bla\v{z} Bertalani\v{c}, An\v{z}e Pirnat, Andrej
\v{C}ampa, Carolina Fortuna
- Abstract要約: 我々は、MLベースのエネルギーアプリケーションを開発するためのデータモデル、エネルギー特徴工学および特徴管理ソリューションについて研究する。
まず、エネルギー応用に適したデータモデルを設計するための分類法を提案し、データモデルをMLモデルトレーニングに適した機能に変換することのできる特徴工学的手法を解析し、最後に特徴記憶のための利用可能な設計も分析する。
- 参考スコア(独自算出の注目度): 0.5809784853115825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The digitization of the energy infrastructure enables new, data driven,
applications often supported by machine learning models. However, domain
specific data transformations, pre-processing and management in modern data
driven pipelines is yet to be addressed. In this paper we perform a first time
study on data models, energy feature engineering and feature management
solutions for developing ML-based energy applications. We first propose a
taxonomy for designing data models suitable for energy applications, analyze
feature engineering techniques able to transform the data model into features
suitable for ML model training and finally also analyze available designs for
feature stores. Using a short-term forecasting dataset, we show the benefits of
designing richer data models and engineering the features on the performance of
the resulting models. Finally, we benchmark three complementary feature
management solutions, including an open-source feature store.
- Abstract(参考訳): エネルギーインフラのデジタル化は、機械学習モデルによってしばしばサポートされる新しいデータ駆動のアプリケーションを可能にする。
しかし、現在のデータ駆動パイプラインにおけるドメイン固有のデータ変換、前処理、管理はまだ解決されていない。
本稿では、MLベースのエネルギーアプリケーションを開発するためのデータモデル、エネルギー特徴工学および特徴管理ソリューションについて、初めて研究する。
まず、エネルギー応用に適したデータモデルを設計するための分類法を提案し、データモデルをmlモデルトレーニングに適した機能に変換する機能工学技術を分析し、最後に、機能ストアで利用可能な設計を分析する。
短期予測データセットを用いて、よりリッチなデータモデルを設計し、結果のモデルの性能に関する特徴をエンジニアリングする利点を示す。
最後に、オープンソース機能ストアを含む3つの補完的な機能管理ソリューションをベンチマークする。
関連論文リスト
- A Survey of Model Architectures in Information Retrieval [64.75808744228067]
機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。
現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。
本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文 参考訳(メタデータ) (2025-01-16T18:59:46Z) - On Foundation Models for Dynamical Systems from Purely Synthetic Data [5.004576576202551]
基礎モデルは、様々な領域にわたる顕著な一般化、データ効率、ロバスト性を示してきた。
これらのモデルは自然言語処理やコンピュータビジョンなどの分野で利用できるが、力学系には存在しない。
合成データのみに基づくトランスフォーマーベース基礎モデルを事前学習することで,この問題に対処する。
本研究は, 一般化, データ効率, 堅牢性の観点から, スペシャリストモデルを上回った力学系の基礎モデルの実現可能性を示すものである。
論文 参考訳(メタデータ) (2024-11-30T08:34:10Z) - Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches [64.42735183056062]
大規模言語モデル(LLM)は、特殊モデルから多目的基礎モデルへと移行してきた。
LLMは印象的なゼロショット能力を示すが、ローカルデータセットとデプロイメントのための重要なリソースを微調整する必要がある。
論文 参考訳(メタデータ) (2024-08-20T09:42:17Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - T-METASET: Task-Aware Generation of Metamaterial Datasets by
Diversity-Based Active Learning [14.668178146934588]
タスク対応データセット生成のためのインテリジェントなデータ取得フレームワークであるt-METASETを提案する。
提案するフレームワークを,汎用性,タスク認識性,カスタマイズ可能な3つのシナリオで検証する。
論文 参考訳(メタデータ) (2022-02-21T22:46:49Z) - Concept for a Technical Infrastructure for Management of Predictive
Models in Industrial Applications [0.0]
モデル管理システムの技術的概念について述べる。
このコンセプトには、データのバージョニングストレージ、さまざまな機械学習アルゴリズムのサポート、モデルの微調整、その後のモデルのデプロイ、デプロイ後のモデルパフォーマンスの監視が含まれる。
論文 参考訳(メタデータ) (2021-07-29T08:38:46Z) - Learning Discrete Energy-based Models via Auxiliary-variable Local
Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。
エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。
本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-11-10T19:31:29Z) - Gradient-Based Training and Pruning of Radial Basis Function Networks
with an Application in Materials Physics [0.24792948967354234]
本稿では,高速かつスケーラブルなオープンソース実装による放射状基底関数ネットワークのトレーニング手法を提案する。
連立データと連立データのモデル解析のための新しいクローズドフォーム最適化基準を導出する。
論文 参考訳(メタデータ) (2020-04-06T11:32:37Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。