論文の概要: Empirical Analysis on Effectiveness of NLP Methods for Predicting Code
Smell
- arxiv url: http://arxiv.org/abs/2108.04656v1
- Date: Sun, 8 Aug 2021 12:10:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 14:28:30.178343
- Title: Empirical Analysis on Effectiveness of NLP Methods for Predicting Code
Smell
- Title(参考訳): コードスメル予測におけるNLP法の有効性に関する実証分析
- Authors: Himanshu Gupta, Abhiram Anand Gulanikar, Lov Kumar and Lalita Bhanu
Murthy Neti
- Abstract要約: コードの臭いは、システムに固有の問題の表面的な指標である。
629パッケージ上に3つのExtreme機械学習マシンカーネルを使用して、8つのコードの臭いを識別します。
以上の結果から,放射基底関数型カーネルは,平均98.52の精度で3つのカーネル法のうち最高の性能を発揮することが示唆された。
- 参考スコア(独自算出の注目度): 3.2973778921083357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A code smell is a surface indicator of an inherent problem in the system,
most often due to deviation from standard coding practices on the developers
part during the development phase. Studies observe that code smells made the
code more susceptible to call for modifications and corrections than code that
did not contain code smells. Restructuring the code at the early stage of
development saves the exponentially increasing amount of effort it would
require to address the issues stemming from the presence of these code smells.
Instead of using traditional features to detect code smells, we use user
comments to manually construct features to predict code smells. We use three
Extreme learning machine kernels over 629 packages to identify eight code
smells by leveraging feature engineering aspects and using sampling techniques.
Our findings indicate that the radial basis functional kernel performs best out
of the three kernel methods with a mean accuracy of 98.52.
- Abstract(参考訳): コードの臭いはシステム固有の問題の表面的な指標であり、ほとんどの場合、開発フェーズにおいて、開発者の標準的なコーディングプラクティスから逸脱している。
研究によると、コードの臭いは、コードの臭いを含まないコードよりも、コードに修正や修正を呼びかけるのに敏感だった。
開発初期段階のコードの再構成は、コードの臭いの存在によって引き起こされる問題に対処するために、指数関数的に増加する労力を削減します。
従来の機能を使ってコードの臭いを検知する代わりに、ユーザコメントを使って手動でコードの臭いを予測します。
629パッケージ以上の3つの極端な機械学習マシンカーネルを使用して、8つのコードの臭いを識別します。
以上の結果から,ラジアル基底関数型カーネルは,平均98.52の精度で3つのカーネル法のうち最も優れた性能を示すことがわかった。
関連論文リスト
- Between Lines of Code: Unraveling the Distinct Patterns of Machine and
Human Programmers [15.314580751870777]
機械と人為的なコードを特徴付ける特定のパターンについて検討する。
本研究では,DeuterCodeGPTと呼ばれる新しい機械生成コード検出手法を提案する。
提案手法は, 機械生成コードの検出における最先端技術よりも優れている。
論文 参考訳(メタデータ) (2024-01-12T09:15:20Z) - Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文 参考訳(メタデータ) (2023-10-08T10:08:21Z) - Augmenting Diffs With Runtime Information [53.22981451758425]
Collector-Sahabは、コード差分をランタイム差分情報で拡張するツールである。
We run Collector-Sahab on 584 code diffs for Defects4J bugs and found it successfully augment the code diff for 95% (555/584)。
論文 参考訳(メタデータ) (2022-12-20T16:33:51Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Improved decoding of circuit noise and fragile boundaries of tailored
surface codes [61.411482146110984]
高速かつ高精度なデコーダを導入し、幅広い種類の量子誤り訂正符号で使用することができる。
我々のデコーダは、信仰マッチングと信念フィンドと呼ばれ、すべてのノイズ情報を活用し、QECの高精度なデモを解き放つ。
このデコーダは, 標準の正方形曲面符号に対して, 整形曲面符号において, より高いしきい値と低い量子ビットオーバーヘッドをもたらすことがわかった。
論文 参考訳(メタデータ) (2022-03-09T18:48:54Z) - DeSkew-LSH based Code-to-Code Recommendation Engine [3.7011129410662558]
ソースコード上の機械学習のための新しいコード・ツー・コードレコメンデーションエンジンであるemphSenatusを紹介する。
SenatusのコアとなるemphDe-Skew LSHは、ローカリティに敏感なハッシュアルゴリズムで、高速(サブ線形時間)検索のためにデータをインデックスする。
コード・ツー・コード・レコメンデーションのタスクにおいて、Senatusはパフォーマンスを6.7%向上し、クエリ時間16xはFacebook Aromaよりも高速であることを示す。
論文 参考訳(メタデータ) (2021-11-05T16:56:28Z) - What do pre-trained code models know about code? [9.60966128833701]
事前に訓練されたコードモデルを調べるために、プローブと呼ばれる診断タスクを使用します。
BERT(英語で事前学習)、CodeBERT(ソースコードで事前学習)、CodeBERTa(自然言語で事前学習)、GraphCodeBERT(データフローでソースコードで事前学習)について検討した。
論文 参考訳(メタデータ) (2021-08-25T16:20:17Z) - An Empirical Study on Predictability of Software Code Smell Using Deep
Learning Models [3.2973778921083357]
コードの臭いは、汚染されたものの表面的な兆候ですが、ソフトウェア記述のプラクティスという意味では違います。
近年の研究では、コードの臭いを伴うコードは、ソフトウェア開発サイクルの変化の確率が高くなることが多いことが観察されている。
我々は、8種類のコードの臭いを予測するために、ソースコードから抽出した機能の助けを借りて、コードの臭い予測モデルを開発した。
論文 参考訳(メタデータ) (2021-08-08T12:36:23Z) - Deep Learning to Ternary Hash Codes by Continuation [8.920717493647121]
本稿では,スムーズな関数をネットワークに付加することで,特徴をコードと共同で学習することを提案する。
実験により、生成した符号は、実際に高い精度で取得できることが示されている。
論文 参考訳(メタデータ) (2021-07-16T16:02:08Z) - COSEA: Convolutional Code Search with Layer-wise Attention [90.35777733464354]
我々は、畳み込みニューラルネットワークを階層的注意で活用し、コード固有の構造論理をキャプチャする新しいディープラーニングアーキテクチャ、COSEAを提案する。
COSEAは、コード検索タスクの最先端メソッドよりも大幅に改善できる。
論文 参考訳(メタデータ) (2020-10-19T13:53:38Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。