論文の概要: Leveraging Data Mining Algorithms to Recommend Source Code Changes
- arxiv url: http://arxiv.org/abs/2305.00323v1
- Date: Sat, 29 Apr 2023 18:38:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 15:54:18.511157
- Title: Leveraging Data Mining Algorithms to Recommend Source Code Changes
- Title(参考訳): データマイニングアルゴリズムを活用してソースコードの変更を推奨
- Authors: AmirHossein Naghshzan, Saeed Khalilazar, Pierre Poilane, Olga Baysal,
Latifa Guerrouj, Foutse Khomh
- Abstract要約: 本論文では、4つのデータマイニングアルゴリズムを用いてソースコード変更を推奨する自動手法を提案する。
性能(精度,リコール,F測定)と実行時間の比較を行った。
Aprioriは大規模プロジェクトに適しているように見えるが、Eclatは小規模プロジェクトに適しているようだ。
- 参考スコア(独自算出の注目度): 7.959841510571622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Context: Recent research has used data mining to develop techniques that can
guide developers through source code changes. To the best of our knowledge,
very few studies have investigated data mining techniques and--or compared
their results with other algorithms or a baseline. Objectives: This paper
proposes an automatic method for recommending source code changes using four
data mining algorithms. We not only use these algorithms to recommend source
code changes, but we also conduct an empirical evaluation. Methods: Our
investigation includes seven open-source projects from which we extracted
source change history at the file level. We used four widely data mining
algorithms \ie{} Apriori, FP-Growth, Eclat, and Relim to compare the algorithms
in terms of performance (Precision, Recall and F-measure) and execution time.
Results: Our findings provide empirical evidence that while some Frequent
Pattern Mining algorithms, such as Apriori may outperform other algorithms in
some cases, the results are not consistent throughout all the software
projects, which is more likely due to the nature and characteristics of the
studied projects, in particular their change history. Conclusion: Apriori seems
appropriate for large-scale projects, whereas Eclat appears to be suitable for
small-scale projects. Moreover, FP-Growth seems an efficient approach in terms
of execution time.
- Abstract(参考訳): コンテキスト: 最近の研究では、開発者がソースコードの変更をガイドできる技術を開発するために、データマイニングが使われています。
私たちの知る限りでは、データマイニング技術を調査したり、他のアルゴリズムやベースラインと比較したりする研究はほとんどありません。
目的: 4つのデータマイニングアルゴリズムを用いてソースコード変更を推奨する自動手法を提案する。
これらのアルゴリズムはソースコードの変更を推奨するだけでなく、実証的な評価も行います。
方法: 調査には7つのオープンソースプロジェクトが含まれており、ファイルレベルでのソース変更履歴を抽出した。
4つの広範にわたるデータマイニングアルゴリズム \ie{} apriori, fp- growth, eclat, relimを用いて、アルゴリズムの性能(精度、リコール、f-測定)と実行時間の比較を行った。
結果:Aprioriのような頻繁なパターンマイニングアルゴリズムが,他のアルゴリズムよりも優れている場合もあるが,研究対象のプロジェクトの性質や特性,特に変更履歴が原因で,すべてのソフトウェアプロジェクトにおいて一貫性が保たれているという実証的証拠が得られた。
結論: aprioriは大規模プロジェクトに適しているが、eclatは小規模プロジェクトに適しているようだ。
さらに、FP-Growthは実行時間の面で効率的なアプローチである。
関連論文リスト
- RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation [54.707460684650584]
大きな言語モデル(LLM)は対話、推論、知識保持における人間レベルの能力を示す。
現在の研究は、LLMに外部知識を組み込むことによって、このボトルネックに対処している。
RAGLABはモジュール的で研究指向のオープンソースライブラリで、6つの既存のアルゴリズムを再現し、RAGアルゴリズムを調査するための包括的なエコシステムを提供する。
論文 参考訳(メタデータ) (2024-08-21T07:20:48Z) - Performance Evaluation and Comparison of a New Regression Algorithm [4.125187280299247]
新たに提案した回帰アルゴリズムの性能を,従来の4つの機械学習アルゴリズムと比較した。
GitHubリポジトリにソースコードを提供したので、読者は結果の複製を自由にできます。
論文 参考訳(メタデータ) (2023-06-15T13:01:16Z) - Improving and Benchmarking Offline Reinforcement Learning Algorithms [87.67996706673674]
この作業は、低レベルの選択とデータセットによって引き起こされるギャップを埋めることを目的としている。
3つの代表アルゴリズムを用いて20の実装選択を実証的に検討する。
CRR+とCQL+の2つの変種がD4RL上で新たな最先端を実現している。
論文 参考訳(メタデータ) (2023-06-01T17:58:46Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Can We Do Better Than Random Start? The Power of Data Outsourcing [9.677679780556103]
多くの組織は豊富なデータにアクセスできますが、データを処理するための計算能力がありません。
そこで本研究では,少量のアウトソースデータを用いて優れた初期点を求めるシミュレーションに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-17T05:34:36Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - A Pragmatic Look at Deep Imitation Learning [0.3626013617212666]
我々は6つの異なる対向的模倣学習アルゴリズムを再実装する。
広く使われている専門的軌跡データセットで評価する。
GAILは、様々なサンプルサイズにわたって、一貫してよく機能する。
論文 参考訳(メタデータ) (2021-08-04T06:33:10Z) - Identifying Co-Adaptation of Algorithmic and Implementational
Innovations in Deep Reinforcement Learning: A Taxonomy and Case Study of
Inference-based Algorithms [15.338931971492288]
我々は、アルゴリズムの革新と実装決定を分離するために、一連の推論に基づくアクター批判アルゴリズムに焦点を当てる。
実装の詳細がアルゴリズムの選択に一致すると、パフォーマンスが大幅に低下します。
結果は、どの実装の詳細がアルゴリズムと共適応され、共進化しているかを示す。
論文 参考訳(メタデータ) (2021-03-31T17:55:20Z) - Towards Understanding the Behaviors of Optimal Deep Active Learning
Algorithms [19.65665942630067]
アクティブラーニング(AL)アルゴリズムは、モデルがデータ選択プロセスを導くため、より少ないデータでより良いパフォーマンスを達成できます。
alの最適形状についてはほとんど研究されていないため、研究者たちはモデルがどこが不足しているかを理解するのに役立つだろう。
我々は,この最適オラクルを探索し,いくつかのタスクで解析するシミュレーションアニーリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-29T22:56:42Z) - Discovering Reinforcement Learning Algorithms [53.72358280495428]
強化学習アルゴリズムは、いくつかのルールの1つに従ってエージェントのパラメータを更新する。
本稿では,更新ルール全体を検出するメタラーニング手法を提案する。
これには、一連の環境と対話することで、"何を予測するか"(例えば、値関数)と"どのように学習するか"の両方が含まれている。
論文 参考訳(メタデータ) (2020-07-17T07:38:39Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。