論文の概要: On Designing Data Models for Energy Feature Stores
- arxiv url: http://arxiv.org/abs/2205.04267v1
- Date: Mon, 9 May 2022 13:35:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 16:51:01.010344
- Title: On Designing Data Models for Energy Feature Stores
- Title(参考訳): エネルギー機能ストアのためのデータモデル設計について
- Authors: Gregor Cerar, Bla\v{z} Bertalani\v{c}, An\v{z}e Pirnat, Andrej
\v{C}ampa, Carolina Fortuna
- Abstract要約: 我々は、MLベースのエネルギーアプリケーションを開発するためのデータモデル、エネルギー特徴工学および特徴管理ソリューションについて研究する。
まず、エネルギー応用に適したデータモデルを設計するための分類法を提案し、データモデルをMLモデルトレーニングに適した機能に変換することのできる特徴工学的手法を解析し、最後に特徴記憶のための利用可能な設計も分析する。
- 参考スコア(独自算出の注目度): 0.5809784853115825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The digitization of the energy infrastructure enables new, data driven,
applications often supported by machine learning models. However, domain
specific data transformations, pre-processing and management in modern data
driven pipelines is yet to be addressed. In this paper we perform a first time
study on data models, energy feature engineering and feature management
solutions for developing ML-based energy applications. We first propose a
taxonomy for designing data models suitable for energy applications, analyze
feature engineering techniques able to transform the data model into features
suitable for ML model training and finally also analyze available designs for
feature stores. Using a short-term forecasting dataset, we show the benefits of
designing richer data models and engineering the features on the performance of
the resulting models. Finally, we benchmark three complementary feature
management solutions, including an open-source feature store.
- Abstract(参考訳): エネルギーインフラのデジタル化は、機械学習モデルによってしばしばサポートされる新しいデータ駆動のアプリケーションを可能にする。
しかし、現在のデータ駆動パイプラインにおけるドメイン固有のデータ変換、前処理、管理はまだ解決されていない。
本稿では、MLベースのエネルギーアプリケーションを開発するためのデータモデル、エネルギー特徴工学および特徴管理ソリューションについて、初めて研究する。
まず、エネルギー応用に適したデータモデルを設計するための分類法を提案し、データモデルをmlモデルトレーニングに適した機能に変換する機能工学技術を分析し、最後に、機能ストアで利用可能な設計を分析する。
短期予測データセットを用いて、よりリッチなデータモデルを設計し、結果のモデルの性能に関する特徴をエンジニアリングする利点を示す。
最後に、オープンソース機能ストアを含む3つの補完的な機能管理ソリューションをベンチマークする。
関連論文リスト
- Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches [64.42735183056062]
大規模言語モデル(LLM)は、特殊モデルから多目的基礎モデルへと移行してきた。
LLMは印象的なゼロショット能力を示すが、ローカルデータセットとデプロイメントのための重要なリソースを微調整する必要がある。
論文 参考訳(メタデータ) (2024-08-20T09:42:17Z) - Code Generation for Machine Learning using Model-Driven Engineering and
SysML [0.0]
この研究は、機械学習タスクを形式化する以前の作業を拡張して、実践的なデータ駆動エンジニアリングの実装を促進することを目的としている。
本手法は,天気予報のためのケーススタディにおいて,実現可能性について評価した。
結果は、実装の労力を減らす方法の柔軟性と単純さを示します。
論文 参考訳(メタデータ) (2023-07-10T15:00:20Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - T-METASET: Task-Aware Generation of Metamaterial Datasets by
Diversity-Based Active Learning [14.668178146934588]
タスク対応データセット生成のためのインテリジェントなデータ取得フレームワークであるt-METASETを提案する。
提案するフレームワークを,汎用性,タスク認識性,カスタマイズ可能な3つのシナリオで検証する。
論文 参考訳(メタデータ) (2022-02-21T22:46:49Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - Concept for a Technical Infrastructure for Management of Predictive
Models in Industrial Applications [0.0]
モデル管理システムの技術的概念について述べる。
このコンセプトには、データのバージョニングストレージ、さまざまな機械学習アルゴリズムのサポート、モデルの微調整、その後のモデルのデプロイ、デプロイ後のモデルパフォーマンスの監視が含まれる。
論文 参考訳(メタデータ) (2021-07-29T08:38:46Z) - Learning Discrete Energy-based Models via Auxiliary-variable Local
Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。
エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。
本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-11-10T19:31:29Z) - Gradient-Based Training and Pruning of Radial Basis Function Networks
with an Application in Materials Physics [0.24792948967354234]
本稿では,高速かつスケーラブルなオープンソース実装による放射状基底関数ネットワークのトレーニング手法を提案する。
連立データと連立データのモデル解析のための新しいクローズドフォーム最適化基準を導出する。
論文 参考訳(メタデータ) (2020-04-06T11:32:37Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。