論文の概要: MLmisFinder: A Specification and Detection Approach of Machine Learning Service Misuses
- arxiv url: http://arxiv.org/abs/2603.17330v1
- Date: Wed, 18 Mar 2026 03:48:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.503911
- Title: MLmisFinder: A Specification and Detection Approach of Machine Learning Service Misuses
- Title(参考訳): MLmisFinder: 機械学習サービスミスの仕様と検出アプローチ
- Authors: Hadil Ben Amor, Niruthiha Selvanayagam, Manel Abdellatif, Taher A. Ghaleb, Naouel Moha,
- Abstract要約: 機械学習(ML)クラウドサービスは、スクラッチからモデルを構築することなく、MLコンポーネントをソフトウェアシステムに統合することを可能にする。
MLサービスの迅速な導入は、広範囲にわたる誤用、品質、保守性、MLサービスベースのシステムの進化につながった。
ソフトウェアシステムにおけるMLサービスの誤用を自動検出するMLmisFinderを提案する。
- 参考スコア(独自算出の注目度): 1.2955713934068565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) cloud services, offered by leading providers such as Amazon, Google, and Microsoft, enable the integration of ML components into software systems without building models from scratch. However, the rapid adoption of ML services, coupled with the growing complexity of business requirements, has led to widespread misuses, compromising the quality, maintainability, and evolution of ML service-based systems. Though prior research has studied patterns and antipatterns in service-based and ML-based systems separately, automatic detection of ML service misuses remains a challenge. In this paper, we propose MLmisFinder, an automatic approach to detect ML service misuses in software systems, aiming to identify instances of improper use of ML services to help developers properly integrate ML components in ML service-based systems. We propose a metamodel that captures the data needed to detect misuses in ML service-based systems and apply a set of rule-based detection algorithms for seven misuse types. We evaluated MLmisFinder on 107 software systems collected from open-source GitHub repositories and compared it with a state-of-the-art baseline. Our results show that MLmisFinder effectively detects ML service misuses, achieving an average precision of 96.7\% and recall of 97\%, outperforming the state-of-the-art baseline. MLmisFinder also scaled efficiently to detect misuses across 817 ML service-based systems and revealed that such misuses are widespread, especially in areas such as data drift monitoring and schema validation.
- Abstract(参考訳): Amazon、Google、Microsoftといった主要なプロバイダによって提供される機械学習(ML)クラウドサービスは、スクラッチからモデルを構築することなく、MLコンポーネントをソフトウェアシステムに統合することができる。
しかし、MLサービスの急速な採用とビジネス要件の複雑化が相まって、幅広い誤用が発生し、MLサービスベースのシステムの品質、保守性、進化を損なうことになった。
従来の研究では、サービスベースのシステムとMLベースのシステムのパターンとアンチパターンを別々に研究してきたが、MLサービスの誤用を自動的に検出することは依然として課題である。
本稿では,ソフトウェアシステムにおけるMLサービス誤用を自動的に検出するMLmisFinderを提案する。
本稿では,MLサービスベースのシステムにおける誤用を検出するために必要なデータを取得するメタモデルを提案し,ルールベースの検出アルゴリズムを7種類の誤用に対して適用する。
オープンソースGitHubリポジトリから収集した107のソフトウェアシステム上でMLmisFinderを評価し、最先端のベースラインと比較した。
その結果,MLmisFinderはMLサービスの誤用を効果的に検出し,96.7\%の平均精度と97\%のリコールを実現し,最先端のベースラインを上回った。
MLmisFinderはまた、817のMLサービスベースのシステム間での誤用を検出するために効率よくスケールした。
関連論文リスト
- MLZero: A Multi-Agent System for End-to-end Machine Learning Automation [48.716299953336346]
MLZeroはLarge Language Models(LLM)を利用した新しいマルチエージェントフレームワークである。
認知認識モジュールが最初に使用され、生のマルチモーダル入力を知覚コンテキストに変換する。
MLZeroは、MLE-Bench Liteで優れたパフォーマンスを示し、成功率とソリューション品質の両方で競合他社を上回っている。
論文 参考訳(メタデータ) (2025-05-20T05:20:53Z) - A Comprehensive Multi-Vocal Empirical Study of ML Cloud Service Misuses [0.8156494881838944]
本稿では,これまで研究されていない20のMLクラウドサービスの誤用のカタログを提案する。
この結果から,MLサービスの誤用はオープンソースプロジェクトと業界の両方で一般的であることがわかった。
これはMLサービスのベストプラクティスにおける継続的な教育の重要性を強調している。
論文 参考訳(メタデータ) (2025-03-12T20:27:10Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - When Code Smells Meet ML: On the Lifecycle of ML-specific Code Smells in
ML-enabled Systems [13.718420553401662]
本研究の目的は、ML特有のコードの臭いとして知られる、特定の品質関連関心事の出現と進化を調査することである。
具体的には、実際のML対応システムにおいて、ML特有のコードの臭いを経験的に分析して研究する計画を提案する。
探索的研究を行い、ML対応システムの大規模なデータセットをマイニングし、約337のプロジェクトに関する400万件のコミットを分析します。
論文 参考訳(メタデータ) (2024-03-13T07:43:45Z) - ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文 参考訳(メタデータ) (2023-11-16T12:03:21Z) - Vulnerability of Machine Learning Approaches Applied in IoT-based Smart Grid: A Review [51.31851488650698]
機械学習(ML)は、IoT(Internet-of-Things)ベースのスマートグリッドでの使用頻度が高まっている。
電力信号に注入された逆方向の歪みは システムの正常な制御と操作に大きな影響を及ぼす
安全クリティカルパワーシステムに適用されたMLsgAPPの脆弱性評価を行うことが不可欠である。
論文 参考訳(メタデータ) (2023-08-30T03:29:26Z) - Bug Characterization in Machine Learning-based Systems [15.521925194920893]
本稿では,機械学習ベースのソフトウェアシステムにおけるバグの特徴と,メンテナンスの観点からMLと非MLのバグの違いについて検討する。
我々の分析によると、MLベースのシステムで報告されている実際の問題の半分はMLバグであり、MLコンポーネントが非MLコンポーネントよりもエラーを起こしやすいことを示している。
論文 参考訳(メタデータ) (2023-07-26T21:21:02Z) - Towards Perspective-Based Specification of Machine Learning-Enabled
Systems [1.3406258114080236]
本稿では、ML対応システムを特定するための視点に基づくアプローチに向けた取り組みについて述べる。
このアプローチでは、目標、ユーザエクスペリエンス、インフラストラクチャ、モデル、データという5つの視点にグループ化された45のML関心事のセットを分析する。
本論文の主な貢献は、ML対応システムを特定するのに役立つ2つの新しいアーティファクトを提供することである。
論文 参考訳(メタデータ) (2022-06-20T13:09:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。