論文の概要: Machine Learning as a Service (MLaaS) Dataset Generator Framework for IoT Environments
- arxiv url: http://arxiv.org/abs/2601.12305v1
- Date: Sun, 18 Jan 2026 08:07:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.564087
- Title: Machine Learning as a Service (MLaaS) Dataset Generator Framework for IoT Environments
- Title(参考訳): IoT環境のための機械学習・アズ・ア・サービス(MLaaS)データセット生成フレームワーク
- Authors: Deepak Kanneganti, Sajib Mistry, Sheik Fattah, Joshua Boland, Aneesh Krishna,
- Abstract要約: 機械学習・アズ・ア・サービス(ML)を評価するための新しいフレームワークを提案する。
MDGは、複数の実世界のデータセットとデータ分散設定にわたる多様なモデルファミリーをトレーニングし、評価することで、現実的なMLの振る舞いをシミュレートする。
1万以上のMLサービスインスタンスを生成し、下流評価に適した大規模なベンチマークデータセットを構築します。
- 参考スコア(独自算出の注目度): 0.06157382820537719
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We propose a novel MLaaS Dataset Generator (MDG) framework that creates configurable and reproducible datasets for evaluating Machine Learning as a Service (MLaaS) selection and composition. MDG simulates realistic MLaaS behaviour by training and evaluating diverse model families across multiple real-world datasets and data distribution settings. It records detailed functional attributes, quality of service metrics, and composition-specific indicators, enabling systematic analysis of service performance and cross-service behaviour. Using MDG, we generate more than ten thousand MLaaS service instances and construct a large-scale benchmark dataset suitable for downstream evaluation. We also implement a built-in composition mechanism that models how services interact under varied Internet of Things conditions. Experiments demonstrate that datasets generated by MDG enhance selection accuracy and composition quality compared to existing baselines. MDG provides a practical and extensible foundation for advancing data-driven research on MLaaS selection and composition
- Abstract(参考訳): MLaaS(MLaaS as a Service)の選択と構成を評価するために、構成可能で再現可能なデータセットを作成する新しいMLaaSデータセットジェネレータ(MDG)フレームワークを提案する。
MDGは、複数の実世界のデータセットとデータ分散設定にわたる多様なモデルファミリーをトレーニングし、評価することで、現実的なMLaaSの振る舞いをシミュレートする。
詳細な機能属性、サービスメトリクスの品質、コンポジション固有の指標を記録し、サービスパフォーマンスとサービス間の振る舞いの体系的な分析を可能にします。
MDGを用いて1万以上のMLaaSサービスインスタンスを生成し、下流評価に適した大規模なベンチマークデータセットを構築する。
また、さまざまなモノのインターネット環境下でのサービスのインタラクションをモデル化する組み込みのコンポジション機構も実装しています。
MDGが生成したデータセットは,既存のベースラインと比較して選択精度と構成品質を向上することを示した。
MDGはMLaaSの選択と構成に関するデータ駆動研究を進めるための実用的で拡張可能な基盤を提供する
関連論文リスト
- From Parameters to Performance: A Data-Driven Study on LLM Structure and Development [73.67759647072519]
大規模言語モデル(LLM)は、様々な領域で大きな成功を収めている。
モデルスケールと能力の急激な成長にもかかわらず、構造構成がパフォーマンスに与える影響に関する体系的なデータ駆動の研究は依然として少ない。
多様なオープンソースLLM構造を含む大規模データセットと,その性能を複数のベンチマークで比較した。
論文 参考訳(メタデータ) (2025-09-14T12:20:39Z) - Data Requirement Goal Modeling for Machine Learning Systems [2.4140502941897544]
本研究は,機械学習システムにおけるデータ要件の特定において,非専門家を導くアプローチを提案する。
我々はまず,白書を調査し,データ要求目標モデル(DRGM)を開発した。
次に、実世界のプロジェクトに基づいた2つの実証的な例を通して、このアプローチを検証する。
論文 参考訳(メタデータ) (2025-04-10T11:30:25Z) - Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning [71.2981957820888]
本稿では,データセット間のデータ品質向上を自動化する新しいStar-Agentsフレームワークを提案する。
このフレームワークは最初,複数のLDMエージェントを用いた多様なインストラクションデータを生成する。
生成したデータは、難易度と品質の両方を評価する二重モデル法を用いて厳密な評価を行う。
論文 参考訳(メタデータ) (2024-11-21T02:30:53Z) - An Integrated Data Processing Framework for Pretraining Foundation Models [57.47845148721817]
研究者や実践者は、しばしば異なるソースからデータセットを手動でキュレートする必要がある。
本稿では,処理モジュールと解析モジュールを統合したデータ処理フレームワークを提案する。
提案されたフレームワークは使いやすく、柔軟です。
論文 参考訳(メタデータ) (2024-02-26T07:22:51Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - Meta-learning framework with applications to zero-shot time-series
forecasting [82.61728230984099]
この研究は幅広いメタラーニングフレームワークを使って肯定的な証拠を提供する。
残余接続はメタラーニング適応機構として機能する。
我々は、ソースTSデータセット上でニューラルネットワークをトレーニングし、異なるターゲットTSデータセット上で再トレーニングすることなくデプロイできることを示します。
論文 参考訳(メタデータ) (2020-02-07T16:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。