論文の概要: A Tool for Automatically Cataloguing and Selecting Pre-Trained Models and Datasets for Software Engineering
- arxiv url: http://arxiv.org/abs/2601.13460v1
- Date: Mon, 19 Jan 2026 23:34:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.095229
- Title: A Tool for Automatically Cataloguing and Selecting Pre-Trained Models and Datasets for Software Engineering
- Title(参考訳): ソフトウェア工学のための事前学習モデルとデータセットの自動解析・選択ツール
- Authors: Alexandra González, Oscar Cerezo, Xavier Franch, Silverio Martínez-Fernández,
- Abstract要約: MLAssetSelectionは,ソフトウェア工学(SE)資産を自動的に抽出するWebアプリケーションである。
スケジュールされたジョブによるリアルタイムの自動更新は、アセット情報を保持する。
ユーザ中心の機能としては、ログイン、パーソナライズされたアセットリスト、アラート通知などがある。
- 参考スコア(独自算出の注目度): 43.48024589076806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid growth of machine learning assets has made it increasingly difficult for software engineers to identify models and datasets that match their specific needs. Browsing large registries, such as Hugging Face, is time-consuming, error-prone, and rarely tailored to Software Engineering (SE) tasks. We present MLAssetSelection, a web application that automatically extracts SE assets and supports four key functionalities: (i) a configurable leaderboard for ranking models across multiple benchmarks and metrics; (ii) requirements-based selection of models and datasets; (iii) real-time automated updates through scheduled jobs that keep asset information current; and (iv) user-centric features including login, personalized asset lists, and configurable alert notifications. A demonstration video is available at https://youtu.be/t6CJ6P9asV4.
- Abstract(参考訳): 機械学習資産の急速な成長により、ソフトウェアエンジニアは、特定のニーズに合ったモデルやデータセットを識別することがますます困難になっている。
Hugging Faceのような大規模なレジストリをブラウジングすることは、時間がかかり、エラーが発生し、ソフトウェア工学(SE)のタスクに適合することが滅多にない。
MLAssetSelectionは,SE資産を自動的に抽出し,4つの重要な機能をサポートするWebアプリケーションである。
(i)複数のベンチマークとメトリクスにまたがるモデルランキングのための設定可能なリーダーボード。
(二 要求に基づくモデル及びデータセットの選択
三 資産情報の流れを維持する予定の業務によるリアルタイムの自動更新
(iv)ログイン、パーソナライズされたアセットリスト、設定可能なアラート通知など、ユーザー中心の機能。
デモビデオはhttps://youtu.be/t6CJ6P9asV4.comで公開されている。
関連論文リスト
- SEMODS: A Validated Dataset of Open-Source Software Engineering Models [46.647605887771284]
本報告では,Hugging Face (HF)から抽出した3,427モデルを対象としたSEMODSについて述べる。
我々のデータセットは、ソフトウェア開発ライフサイクルからSEタスクやアクティビティにモデルをリンクし、評価結果の標準化された表現を提供します。
論文 参考訳(メタデータ) (2026-01-02T10:38:24Z) - ELATE: Evolutionary Language model for Automated Time-series Engineering [2.121963121603413]
ELATE(Evolutionary Language Model for Automated Time-Series Engineering)を導入し、時系列データのための機能エンジニアリングを自動化する。
ELATEは時系列統計測度と特徴重要度を用いて特徴のガイドとプーンを行い、言語モデルは新しい文脈に関連のある特徴変換を提案する。
実験の結果,ELATEは様々な領域で平均8.4%の精度で予測精度を向上させることがわかった。
論文 参考訳(メタデータ) (2025-08-20T12:36:29Z) - CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2289822267563]
本稿では,実行すべきタスクを実演する少数のユーザ記述型少数ショットを前提として,合成データセットを生成する手法を提案する。
我々は, CRAFTが生物, 医学, 常識質問応答(QA)の4つのタスクに対して, 大規模タスク特化学習データセットを効率的に生成できることを実証した。
実験の結果, CRAFT を用いたモデルでは, 一般 LLM をQA タスクで上回ったり, 一致させたりしていることがわかった。
論文 参考訳(メタデータ) (2024-09-03T17:54:40Z) - Automated User Story Generation with Test Case Specification Using Large Language Model [0.0]
要件文書からユーザストーリーを自動生成するツール「GeneUS」を開発した。
アウトプットはフォーマットで提供され、ダウンストリーム統合の可能性は人気のあるプロジェクト管理ツールに開放されます。
論文 参考訳(メタデータ) (2024-04-02T01:45:57Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - Mining Robust Default Configurations for Resource-constrained AutoML [18.326426020906215]
本稿では,オフラインのAutoMLを実行し,多様なタスクに対してマイニングを行うことにより,与えられたタスクに対するパフォーマンス設定を選択する新しい方法を提案する。
当社のアプローチは,既存のAutoMLプラットフォームを温める上で有効であることを示す。
論文 参考訳(メタデータ) (2022-02-20T23:08:04Z) - Merlion: A Machine Learning Library for Time Series [73.46386700728577]
Merlionは時系列のためのオープンソースの機械学習ライブラリである。
モデルの統一インターフェースと、異常検出と予測のためのデータセットを備えている。
Merlionはまた、本番環境でのモデルのライブデプロイメントと再トレーニングをシミュレートするユニークな評価フレームワークも提供する。
論文 参考訳(メタデータ) (2021-09-20T02:03:43Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - AutoAI-TS: AutoAI for Time Series Forecasting [14.078195334596494]
ゼロ構成(ゼロコンフ)システムを提供するAutoAI for Time Series Forecasting(AutoAI-TS)を紹介します。
AutoAI-TSは、ユーザのデータ準備、モデル作成、パラメータ最適化、トレーニング、モデル選択を自動的に実行する。
そして、提案されているt-daubメカニズムを使ってパイプラインを評価しランク付けし、最適なパイプラインを選択する。
論文 参考訳(メタデータ) (2021-02-24T15:30:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。