論文の概要: Understanding the Automated Parameter Optimization on Transfer Learning
for CPDP: An Empirical Study
- arxiv url: http://arxiv.org/abs/2002.03148v1
- Date: Sat, 8 Feb 2020 12:01:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 22:56:58.500760
- Title: Understanding the Automated Parameter Optimization on Transfer Learning
for CPDP: An Empirical Study
- Title(参考訳): CPDPの移動学習における自動パラメータ最適化の理解:実証的研究
- Authors: Ke Li, Zilin Xiang, Tao Chen, Shuo Wang, Kay Chen Tan
- Abstract要約: プロジェクト間の欠陥予測技術は、現在のプロジェクトにおけるモデル構築を容易にするために、他のプロジェクトからデータ/知識を借ります。
ほとんどのCPDP技術は、転送学習と分類の2つの主要なステップを含み、それぞれが最適な性能を達成するために調整すべきパラメータが少なくとも1つある。
自動パラメータ最適化が様々なCPDP技術に与える影響について、十分に理解されていない。
- 参考スコア(独自算出の注目度): 23.63984151792791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-driven defect prediction has become increasingly important in software
engineering process. Since it is not uncommon that data from a software project
is insufficient for training a reliable defect prediction model, transfer
learning that borrows data/knowledge from other projects to facilitate the
model building at the current project, namely cross-project defect prediction
(CPDP), is naturally plausible. Most CPDP techniques involve two major steps,
i.e., transfer learning and classification, each of which has at least one
parameter to be tuned to achieve their optimal performance. This practice fits
well with the purpose of automated parameter optimization. However, there is a
lack of thorough understanding about what are the impacts of automated
parameter optimization on various CPDP techniques. In this paper, we present
the first empirical study that looks into such impacts on 62 CPDP techniques,
13 of which are chosen from the existing CPDP literature while the other 49
ones have not been explored before. We build defect prediction models over 20
real-world software projects that are of different scales and characteristics.
Our findings demonstrate that: (1) Automated parameter optimization
substantially improves the defect prediction performance of 77\% CPDP
techniques with a manageable computational cost. Thus more efforts on this
aspect are required in future CPDP studies. (2) Transfer learning is of
ultimate importance in CPDP. Given a tight computational budget, it is more
cost-effective to focus on optimizing the parameter configuration of transfer
learning algorithms (3) The research on CPDP is far from mature where it is
"not difficult" to find a better alternative by making a combination of
existing transfer learning and classification techniques. This finding provides
important insights about the future design of CPDP techniques.
- Abstract(参考訳): データ駆動型欠陥予測はソフトウエアエンジニアリングプロセスにおいてますます重要になっている。
ソフトウェアプロジェクトのデータが信頼性のある欠陥予測モデルのトレーニングに不十分であることは珍しくないため、他のプロジェクトからデータ/知識を借りて現在のプロジェクトにおけるモデル構築、すなわちクロスプロジェクト欠陥予測(CPDP)を促進するトランスファー学習は、自然に妥当である。
ほとんどのCPDP技術は、転送学習と分類の2つの主要なステップを含み、それぞれが最適な性能を達成するために調整すべきパラメータが少なくとも1つある。
このプラクティスは、自動パラメータ最適化の目的に適しています。
しかし, 自動パラメータ最適化が様々なCPDP手法に与える影響について, 十分に理解されていない。
本稿では,既存のcpdp文献から13種が選択され,他の49種はこれまでに検討されていない62種のcpdp技術への影響を考察した最初の実証研究を行う。
私たちは、スケールと特性の異なる20の現実世界のソフトウェアプロジェクトに対して、欠陥予測モデルを構築します。
その結果, 1) 自動パラメータ最適化は, 管理可能な計算コストで, 77%のCPDP手法の欠陥予測性能を大幅に向上することがわかった。
したがって、今後のCPDP研究にはさらなる努力が必要である。
2)転帰学習はCPDPにおいて極めて重要である。
タイトな計算予算を考えると、転送学習アルゴリズムのパラメータ構成の最適化に重点を置く方が費用対効果が高い(3)cpdpの研究は、既存の転送学習と分類技術を組み合わせることでより良い選択肢を見つけることが「難しくない」ほど成熟していない。
この発見は,CPDP技術の将来設計に関する重要な知見を提供する。
関連論文リスト
- MBL-CPDP: A Multi-objective Bilevel Method for Cross-Project Defect Prediction via Automated Machine Learning [34.89241736003651]
クロスプロジェクト欠陥予測(CPDP)は、機械学習(ML)技術を活用して、特にプロジェクト固有のデータが不足しているソフトウェア欠陥を積極的に識別する。
本稿では,MBL-CPDPと呼ばれる多目的二段階最適化(MBLO)手法としてCPDPを定式化する。
これには、上層階、多目的最適化問題、下層階問題、高価な最適化問題という2つのネスト問題が含まれている。
論文 参考訳(メタデータ) (2024-11-10T15:17:15Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - PPI++: Efficient Prediction-Powered Inference [31.403415618169433]
PPI++: 小さなラベル付きデータセットと、通常より大きな機械学習予測データセットに基づく推定と推測の方法論を提案する。
これらの手法は、利用可能な予測の品質に自動的に適応し、容易に計算可能な信頼セットを得る。
PPI++は予測駆動推論(PPI)に基づいており、同じ問題設定をターゲットとし、計算効率と統計効率を改善している。
論文 参考訳(メタデータ) (2023-11-02T17:59:04Z) - Deep Incremental Learning of Imbalanced Data for Just-In-Time Software
Defect Prediction [3.2022080692044352]
この研究は、Just-In-Time Software Defect Prediction (JIT-SDP)モデルに関する3つの観測から生まれた。
まず,JIT-SDP問題を分類問題として扱う。
第二に、JIT-SDP 以前の研究では、クラスバランス処理がソフトウェア変更セットデータの基盤となる特性を変えるとは考えていない。
論文 参考訳(メタデータ) (2023-10-18T19:42:34Z) - Selectivity Drives Productivity: Efficient Dataset Pruning for Enhanced
Transfer Learning [66.20311762506702]
データセットプルーニング(DP)は、データ効率を改善する効果的な方法として登場した。
本稿では,ラベルマッピングと特徴マッピングという2つの新しいDP手法を提案する。
ダウンストリーム性能を犠牲にすることなく、ソースデータクラスを最大40%まで刈り取ることができることを示す。
論文 参考訳(メタデータ) (2023-10-13T00:07:49Z) - Online Learning and Optimization for Queues with Unknown Demand Curve
and Service Distribution [26.720986177499338]
サービス提供者が最適なサービス料金 p とサービス容量 mu を選択する待ち行列システムにおける最適化問題について検討する。
本研究では,パラメータ推定誤差を自動的に解法に組み込むオンライン学習フレームワークを開発した。
論文 参考訳(メタデータ) (2023-03-06T08:47:40Z) - Scalable PAC-Bayesian Meta-Learning via the PAC-Optimal Hyper-Posterior:
From Theory to Practice [54.03076395748459]
メタラーニング文学の中心的な疑問は、目に見えないタスクへの一般化を保証するために、いかに正規化するかである。
本稿では,Rothfussらによって最初に導かれたメタラーニングの一般化について述べる。
PAC-Bayesian per-task 学習境界におけるメタラーニングの条件と程度について,理論的解析および実証事例研究を行った。
論文 参考訳(メタデータ) (2022-11-14T08:51:04Z) - Evaluating natural language processing models with generalization
metrics that do not need access to any training or testing data [66.11139091362078]
本稿では,Hugingface から事前学習した大規模トランスフォーマーに対して,一般化指標を用いた最初のモデル選択結果を提案する。
ニッチな状況にもかかわらず、ヘビーテール(HT)の観点から派生したメトリクスは、特にNLPタスクにおいて有用である。
論文 参考訳(メタデータ) (2022-02-06T20:07:35Z) - Few-shot Quality-Diversity Optimization [50.337225556491774]
品質多様性(QD)の最適化は、強化学習における知覚的最小値とスパース報酬を扱う上で効果的なツールであることが示されている。
本稿では,タスク分布の例から,パラメータ空間の最適化によって得られる経路の情報を利用して,未知の環境でQD手法を初期化する場合,数発の適応が可能であることを示す。
ロボット操作とナビゲーションベンチマークを用いて、疎密な報酬設定と密集した報酬設定の両方で実施された実験は、これらの環境でのQD最適化に必要な世代数を著しく削減することを示している。
論文 参考訳(メタデータ) (2021-09-14T17:12:20Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Moving from Cross-Project Defect Prediction to Heterogeneous Defect
Prediction: A Partial Replication Study [0.0]
以前の研究では、しばしば機械学習技術を使ってバグ予測モデルを構築し、検証し、改善した。
これらのモデルから得られる知識は、ソースプロジェクトで十分なメトリクスが収集されていない場合、ターゲットプロジェクトと重複することはない。
得られた結果の再現と検証により,系統的に異種欠陥予測(HDP)を統合した。
その結果,hdpアルゴリズムはパラメータ選択に対する感度が高いため,多くのケースで実現不可能であることが判明した。
論文 参考訳(メタデータ) (2021-03-05T06:29:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。