論文の概要: Systematic Literature Review on Application of Machine Learning in
Continuous Integration
- arxiv url: http://arxiv.org/abs/2305.12695v2
- Date: Mon, 17 Jul 2023 06:38:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 22:19:34.519993
- Title: Systematic Literature Review on Application of Machine Learning in
Continuous Integration
- Title(参考訳): 継続的統合における機械学習の適用に関する体系的文献レビュー
- Authors: Ali Kazemi Arani, Triet Huynh Minh Le, Mansooreh Zahedi and Muhammad
Ali Babar
- Abstract要約: 本研究では過去22年間の継続的統合(CI)の文脈における機械学習(ML)に基づく手法に関する文献の体系的レビューを行った。
この研究は、CIのためのMLベースのソリューションで使用されるテクニックを特定し、記述することを目的としている。
- 参考スコア(独自算出の注目度): 7.180264400668846
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research conducted a systematic review of the literature on machine
learning (ML)-based methods in the context of Continuous Integration (CI) over
the past 22 years. The study aimed to identify and describe the techniques used
in ML-based solutions for CI and analyzed various aspects such as data
engineering, feature engineering, hyper-parameter tuning, ML models, evaluation
methods, and metrics. In this paper, we have depicted the phases of CI testing,
the connection between them, and the employed techniques in training the ML
method phases. We presented nine types of data sources and four taken steps in
the selected studies for preparing the data. Also, we identified four feature
types and nine subsets of data features through thematic analysis of the
selected studies. Besides, five methods for selecting and tuning the
hyper-parameters are shown. In addition, we summarised the evaluation methods
used in the literature and identified fifteen different metrics. The most
commonly used evaluation methods were found to be precision, recall, and
F1-score, and we have also identified five methods for evaluating the
performance of trained ML models. Finally, we have presented the relationship
between ML model types, performance measurements, and CI phases. The study
provides valuable insights for researchers and practitioners interested in
ML-based methods in CI and emphasizes the need for further research in this
area.
- Abstract(参考訳): 本研究では過去22年間の継続的統合(CI)の文脈における機械学習(ML)に基づく手法に関する文献の体系的レビューを行った。
この研究は、CIのためのMLベースのソリューションで使用されるテクニックを特定し、記述することを目的として、データエンジニアリング、機能エンジニアリング、ハイパーパラメータチューニング、MLモデル、評価方法、メトリクスなど、さまざまな側面を分析した。
本稿では,CIテストのフェーズ,それらの相互接続,およびMLメソッドフェーズのトレーニングにおける採用技術について述べる。
9種類のデータソースを提示し,選択したデータの準備に4つのステップを講じた。
また,選択した研究のテーマ分析により,4つの特徴タイプと9つのデータ特徴サブセットを同定した。
さらに、ハイパーパラメータの選択とチューニングの5つの方法を示す。
さらに,文献における評価手法を要約し,15種類の指標を同定した。
最も一般的な評価方法は精度、リコール、f1-scoreであり、訓練されたmlモデルの性能を評価するための5つの方法も特定した。
最後に、MLモデルタイプ、パフォーマンス測定、CIフェーズの関係について紹介した。
この研究は、CIにおけるMLベースの手法に興味を持つ研究者や実践者に貴重な洞察を与え、この分野におけるさらなる研究の必要性を強調している。
関連論文リスト
- Seeking Neural Nuggets: Knowledge Transfer in Large Language Models from
a Parametric Perspective [114.70886320845715]
大規模言語モデル(LLM)は本質的に、広範囲なコーパスの事前学習を通じて、パラメータ内の豊富な知識を符号化する。
本稿では,パラメトリックの観点から,大規模モデルから小規模モデルへの知識伝達を実証的に検討する。
論文 参考訳(メタデータ) (2023-10-17T17:58:34Z) - Visual Analytics For Machine Learning: A Data Perspective Survey [17.19676876329529]
この調査は、データの観点からVIS4MLの作業を要約することに焦点を当てている。
MLモデルで処理される共通データを5つのタイプに分類し、各タイプのユニークな特徴を説明し、それらから学習できる対応するMLモデルを強調する。
第2に、多数のVIS4ML作業から、MLパイプラインのさまざまな段階でこの種のデータを操作する6つのタスクをティースして、MLモデルを理解し、診断し、洗練します。
論文 参考訳(メタデータ) (2023-07-15T05:13:06Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - Learning continuous models for continuous physics [94.42705784823997]
本研究では,科学技術応用のための機械学習モデルを検証する数値解析理論に基づくテストを開発する。
本研究は,従来のMLトレーニング/テスト手法と一体化して,科学・工学分野におけるモデルの検証を行う方法である。
論文 参考訳(メタデータ) (2022-02-17T07:56:46Z) - Filter Methods for Feature Selection in Supervised Machine Learning
Applications -- Review and Benchmark [0.0]
本稿では,特徴選択ベンチマークに関する文献を合成し,広く使用されているR環境における58の手法の性能評価を行う。
MLモデルでは難しい4つの典型的なデータセットシナリオについて検討する。
論文 参考訳(メタデータ) (2021-11-23T20:20:24Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Supply of engineering techniques and software design patterns in
psychoanalysis and psychometrics sciences [0.0]
本研究の目的は、心理療法におけるCBT法(認知行動療法)の弱点を改善するために、ソフトウェア技術、モデル、人工知能アルゴリズムを導入することである。
本研究の目的は、隠れた人間の変数が検査結果から推測される心理測定実験の実装である。
論文 参考訳(メタデータ) (2021-08-16T08:36:37Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - Comprehensive Comparative Study of Multi-Label Classification Methods [1.1278903078792917]
マルチラベル分類(MLC)は最近、機械学習コミュニティから関心が高まっています。
この研究は、さまざまなドメインのデータセットの多さに関する幅広いMLCメソッドの包括的な実証的研究を提供する。
論文 参考訳(メタデータ) (2021-02-14T09:38:15Z) - Machine Learning for Detecting Data Exfiltration: A Review [1.949912057689623]
サイバーセキュリティ、機械学習(ML)、ソフトウェアエンジニアリング(SE)の交差点における研究は、最近、高度なデータ流出攻撃を検出するための対策を提案している。
本稿では,MLに基づくデータ抽出対策を体系的に検討し,機械学習アプローチ,特徴工学的手法,評価データセット,これらの対策に用いられるパフォーマンス指標を識別・分類することを目的とする。
論文 参考訳(メタデータ) (2020-12-17T01:05:50Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。