Fugu-MT 論文翻訳(概要): On Designing Data Models for Energy Feature Stores

論文の概要: On Designing Data Models for Energy Feature Stores

arxiv url: http://arxiv.org/abs/2205.04267v1
Date: Mon, 9 May 2022 13:35:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-10 16:51:01.010344
Title: On Designing Data Models for Energy Feature Stores
Title（参考訳）: エネルギー機能ストアのためのデータモデル設計について
Authors: Gregor Cerar, Bla\v{z} Bertalani\v{c}, An\v{z}e Pirnat, Andrej \v{C}ampa, Carolina Fortuna
Abstract要約: 我々は、MLベースのエネルギーアプリケーションを開発するためのデータモデル、エネルギー特徴工学および特徴管理ソリューションについて研究する。まず、エネルギー応用に適したデータモデルを設計するための分類法を提案し、データモデルをMLモデルトレーニングに適した機能に変換することのできる特徴工学的手法を解析し、最後に特徴記憶のための利用可能な設計も分析する。
参考スコア（独自算出の注目度）: 0.5809784853115825
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The digitization of the energy infrastructure enables new, data driven, applications often supported by machine learning models. However, domain specific data transformations, pre-processing and management in modern data driven pipelines is yet to be addressed. In this paper we perform a first time study on data models, energy feature engineering and feature management solutions for developing ML-based energy applications. We first propose a taxonomy for designing data models suitable for energy applications, analyze feature engineering techniques able to transform the data model into features suitable for ML model training and finally also analyze available designs for feature stores. Using a short-term forecasting dataset, we show the benefits of designing richer data models and engineering the features on the performance of the resulting models. Finally, we benchmark three complementary feature management solutions, including an open-source feature store.
Abstract（参考訳）: エネルギーインフラのデジタル化は、機械学習モデルによってしばしばサポートされる新しいデータ駆動のアプリケーションを可能にする。しかし、現在のデータ駆動パイプラインにおけるドメイン固有のデータ変換、前処理、管理はまだ解決されていない。本稿では、MLベースのエネルギーアプリケーションを開発するためのデータモデル、エネルギー特徴工学および特徴管理ソリューションについて、初めて研究する。まず、エネルギー応用に適したデータモデルを設計するための分類法を提案し、データモデルをmlモデルトレーニングに適した機能に変換する機能工学技術を分析し、最後に、機能ストアで利用可能な設計を分析する。短期予測データセットを用いて、よりリッチなデータモデルを設計し、結果のモデルの性能に関する特徴をエンジニアリングする利点を示す。最後に、オープンソース機能ストアを含む3つの補完的な機能管理ソリューションをベンチマークする。

関連論文リスト

DINOv3 [62.31809406012177]
自己教師型学習は、手動データアノテーションの必要性を排除し、巨大なデータセットやより大きなアーキテクチャにモデルを集中的にスケールできるようにするという約束を守ります。この技術レポートでは、シンプルだが効果的な戦略を活用することで、このビジョンを実現するための大きなマイルストーンであるDINOv3を紹介します。 DINOv3は高品位な高精細な特徴を生み出し、様々な視覚タスクにおいて優れた性能を発揮する。
論文参考訳（メタデータ） (2025-08-13T18:00:55Z)
Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study [55.09905978813599]
大規模言語モデル(LLM)は、データ分析タスクの自動化を約束する。しかし、オープンソースモデルは、このような推論集約的なシナリオにおいて、重大な制限に直面している。本研究では,オープンソースLLMのデータ解析機能を強化するための戦略について検討する。
論文参考訳（メタデータ） (2025-06-24T17:04:23Z)
Data Model Design for Explainable Machine Learning-based Electricity Applications [0.33554367023486936]
本稿では,エネルギー応用に関連する様々な種類のデータを特定し,構造する分類法を提案する。本研究では, 4つの解釈可能な機械学習手法の予測精度に及ぼすドメイン, コンテキスト, 行動特性の影響について検討した。
論文参考訳（メタデータ） (2025-05-29T16:16:16Z)
A Survey of Model Architectures in Information Retrieval [64.75808744228067]
機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文参考訳（メタデータ） (2025-02-20T18:42:58Z)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳（メタデータ） (2025-01-16T18:59:46Z)
On Foundation Models for Dynamical Systems from Purely Synthetic Data [5.004576576202551]
基礎モデルは、様々な領域にわたる顕著な一般化、データ効率、ロバスト性を示してきた。これらのモデルは自然言語処理やコンピュータビジョンなどの分野で利用できるが、力学系には存在しない。合成データのみに基づくトランスフォーマーベース基礎モデルを事前学習することで,この問題に対処する。本研究は, 一般化, データ効率, 堅牢性の観点から, スペシャリストモデルを上回った力学系の基礎モデルの実現可能性を示すものである。
論文参考訳（メタデータ） (2024-11-30T08:34:10Z)
Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳（メタデータ） (2024-10-22T06:43:28Z)
Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches [64.42735183056062]
大規模言語モデル(LLM)は、特殊モデルから多目的基礎モデルへと移行してきた。 LLMは印象的なゼロショット能力を示すが、ローカルデータセットとデプロイメントのための重要なリソースを微調整する必要がある。
論文参考訳（メタデータ） (2024-08-20T09:42:17Z)
Code Generation for Machine Learning using Model-Driven Engineering and SysML [0.0]
この研究は、機械学習タスクを形式化する以前の作業を拡張して、実践的なデータ駆動エンジニアリングの実装を促進することを目的としている。本手法は,天気予報のためのケーススタディにおいて,実現可能性について評価した。結果は、実装の労力を減らす方法の柔軟性と単純さを示します。
論文参考訳（メタデータ） (2023-07-10T15:00:20Z)
Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文参考訳（メタデータ） (2023-04-05T07:28:33Z)
T-METASET: Task-Aware Generation of Metamaterial Datasets by Diversity-Based Active Learning [14.668178146934588]
タスク対応データセット生成のためのインテリジェントなデータ取得フレームワークであるt-METASETを提案する。提案するフレームワークを,汎用性,タスク認識性,カスタマイズ可能な3つのシナリオで検証する。
論文参考訳（メタデータ） (2022-02-21T22:46:49Z)
SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文参考訳（メタデータ） (2021-12-22T14:45:37Z)
Towards Open-World Feature Extrapolation: An Inductive Graph Learning Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文参考訳（メタデータ） (2021-10-09T09:02:45Z)
Concept for a Technical Infrastructure for Management of Predictive Models in Industrial Applications [0.0]
モデル管理システムの技術的概念について述べる。このコンセプトには、データのバージョニングストレージ、さまざまな機械学習アルゴリズムのサポート、モデルの微調整、その後のモデルのデプロイ、デプロイ後のモデルパフォーマンスの監視が含まれる。
論文参考訳（メタデータ） (2021-07-29T08:38:46Z)
Learning Discrete Energy-based Models via Auxiliary-variable Local Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文参考訳（メタデータ） (2020-11-10T19:31:29Z)
Gradient-Based Training and Pruning of Radial Basis Function Networks with an Application in Materials Physics [0.24792948967354234]
本稿では,高速かつスケーラブルなオープンソース実装による放射状基底関数ネットワークのトレーニング手法を提案する。連立データと連立データのモデル解析のための新しいクローズドフォーム最適化基準を導出する。
論文参考訳（メタデータ） (2020-04-06T11:32:37Z)
From Data to Actions in Intelligent Transportation Systems: a Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。 ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文参考訳（メタデータ） (2020-02-06T12:02:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。