論文の概要: Empirical Analysis on Effectiveness of NLP Methods for Predicting Code
Smell
- arxiv url: http://arxiv.org/abs/2108.04656v1
- Date: Sun, 8 Aug 2021 12:10:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 14:28:30.178343
- Title: Empirical Analysis on Effectiveness of NLP Methods for Predicting Code
Smell
- Title(参考訳): コードスメル予測におけるNLP法の有効性に関する実証分析
- Authors: Himanshu Gupta, Abhiram Anand Gulanikar, Lov Kumar and Lalita Bhanu
Murthy Neti
- Abstract要約: コードの臭いは、システムに固有の問題の表面的な指標である。
629パッケージ上に3つのExtreme機械学習マシンカーネルを使用して、8つのコードの臭いを識別します。
以上の結果から,放射基底関数型カーネルは,平均98.52の精度で3つのカーネル法のうち最高の性能を発揮することが示唆された。
- 参考スコア(独自算出の注目度): 3.2973778921083357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A code smell is a surface indicator of an inherent problem in the system,
most often due to deviation from standard coding practices on the developers
part during the development phase. Studies observe that code smells made the
code more susceptible to call for modifications and corrections than code that
did not contain code smells. Restructuring the code at the early stage of
development saves the exponentially increasing amount of effort it would
require to address the issues stemming from the presence of these code smells.
Instead of using traditional features to detect code smells, we use user
comments to manually construct features to predict code smells. We use three
Extreme learning machine kernels over 629 packages to identify eight code
smells by leveraging feature engineering aspects and using sampling techniques.
Our findings indicate that the radial basis functional kernel performs best out
of the three kernel methods with a mean accuracy of 98.52.
- Abstract(参考訳): コードの臭いはシステム固有の問題の表面的な指標であり、ほとんどの場合、開発フェーズにおいて、開発者の標準的なコーディングプラクティスから逸脱している。
研究によると、コードの臭いは、コードの臭いを含まないコードよりも、コードに修正や修正を呼びかけるのに敏感だった。
開発初期段階のコードの再構成は、コードの臭いの存在によって引き起こされる問題に対処するために、指数関数的に増加する労力を削減します。
従来の機能を使ってコードの臭いを検知する代わりに、ユーザコメントを使って手動でコードの臭いを予測します。
629パッケージ以上の3つの極端な機械学習マシンカーネルを使用して、8つのコードの臭いを識別します。
以上の結果から,ラジアル基底関数型カーネルは,平均98.52の精度で3つのカーネル法のうち最も優れた性能を示すことがわかった。
関連論文リスト
- EnseSmells: Deep ensemble and programming language models for automated code smells detection [3.974095344344234]
ソフトウェアソースコードの匂いは、最適な設計と実装上の決定を示す。
本稿では,構造的特徴と統計的意味論の融合に重きを置く深層学習アーキテクチャを構築するための新しい手法を提案する。
論文 参考訳(メタデータ) (2025-02-07T15:35:19Z) - How Propense Are Large Language Models at Producing Code Smells? A Benchmarking Study [45.126233498200534]
コードの臭いを生成するための大規模言語モデルの妥当性を評価するためのベンチマークであるCodeSmellEvalを紹介する。
当社のベンチマークには、Propensity Smelly Score (PSC) と、メソッドレベルのコードの臭いを収集したデータセットであるCodeSmellDataが含まれている。
CodeSmellEvalの使用を実証するために,CodeLlamaとMistralの2つの最先端LLMを用いてケーススタディを行った。
論文 参考訳(メタデータ) (2024-12-25T21:56:35Z) - Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.25533750469467]
低密度パリティ・チェック (LDPC) コードは、他の種類のコードに対していくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文 参考訳(メタデータ) (2024-06-09T12:08:56Z) - Learning Linear Block Error Correction Codes [62.25533750469467]
本稿では,バイナリ線形ブロック符号の統一エンコーダデコーダトレーニングを初めて提案する。
また,コード勾配の効率的なバックプロパゲーションのために,自己注意マスキングを行うトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2024-05-07T06:47:12Z) - Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文 参考訳(メタデータ) (2023-10-08T10:08:21Z) - Augmenting Diffs With Runtime Information [53.22981451758425]
Collector-Sahabは、コード差分をランタイム差分情報で拡張するツールである。
We run Collector-Sahab on 584 code diffs for Defects4J bugs and found it successfully augment the code diff for 95% (555/584)。
論文 参考訳(メタデータ) (2022-12-20T16:33:51Z) - An Empirical Study on Predictability of Software Code Smell Using Deep
Learning Models [3.2973778921083357]
コードの臭いは、汚染されたものの表面的な兆候ですが、ソフトウェア記述のプラクティスという意味では違います。
近年の研究では、コードの臭いを伴うコードは、ソフトウェア開発サイクルの変化の確率が高くなることが多いことが観察されている。
我々は、8種類のコードの臭いを予測するために、ソースコードから抽出した機能の助けを借りて、コードの臭い予測モデルを開発した。
論文 参考訳(メタデータ) (2021-08-08T12:36:23Z) - Deep Learning to Ternary Hash Codes by Continuation [8.920717493647121]
本稿では,スムーズな関数をネットワークに付加することで,特徴をコードと共同で学習することを提案する。
実験により、生成した符号は、実際に高い精度で取得できることが示されている。
論文 参考訳(メタデータ) (2021-07-16T16:02:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。