Fugu-MT 論文翻訳(概要): On the Use of Deep Learning Models for Semantic Clone Detection

論文の概要: On the Use of Deep Learning Models for Semantic Clone Detection

arxiv url: http://arxiv.org/abs/2412.14739v1
Date: Thu, 19 Dec 2024 11:15:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 18:44:16.106825
Title: On the Use of Deep Learning Models for Semantic Clone Detection
Title（参考訳）: 意味クローン検出におけるディープラーニングモデルの利用について
Authors: Subroto Nag Pinku, Debajyoti Mondal, Chanchal K. Roy,
Abstract要約: 既存のベンチマークデータセットを利用した5つの最先端クローン検出モデルに対する多段階評価手法を提案する。具体的には,BigCloneBench,SemanticCloneBench,GPTCloneBenchの3つの高性能単一言語モデル(ASTNN,GMN,CodeBERT)について検討する。単一言語モデルはBigCloneBenchのF1スコアが高いが、SemanticCloneBenchのパフォーマンスは20%まで異なる。興味深いことに、クロス言語モデル(C4)は他のモデルよりもSemanticCloneBenchの方が優れたパフォーマンス(約7%)を示している。
参考スコア（独自算出の注目度）: 4.796947520072581
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Detecting and tracking code clones can ease various software development and maintenance tasks when changes in a code fragment should be propagated over all its copies. Several deep learning-based clone detection models have appeared in the literature for detecting syntactic and semantic clones, widely evaluated with the BigCloneBench dataset. However, class imbalance and the small number of semantic clones make BigCloneBench less ideal for interpreting model performance. Researchers also use other datasets such as GoogleCodeJam, OJClone, and SemanticCloneBench to understand model generalizability. To overcome the limitations of existing datasets, the GPT-assisted semantic and cross-language clone dataset GPTCloneBench has been released. However, how these models compare across datasets remains unclear. In this paper, we propose a multi-step evaluation approach for five state-of-the-art clone detection models leveraging existing benchmark datasets, including GPTCloneBench, and using mutation operators to study model ability. Specifically, we examine three highly-performing single-language models (ASTNN, GMN, CodeBERT) on BigCloneBench, SemanticCloneBench, and GPTCloneBench, testing their robustness with mutation operations. Additionally, we compare them against cross-language models (C4, CLCDSA) known for detecting semantic clones. While single-language models show high F1 scores for BigCloneBench, their performance on SemanticCloneBench varies (up to 20%). Interestingly, the cross-language model (C4) shows superior performance (around 7%) on SemanticCloneBench over other models and performs similarly on BigCloneBench and GPTCloneBench. On mutation-based datasets, C4 has more robust performance (less than 1% difference) compared to single-language models, which show high variability.
Abstract（参考訳）: コードクローンの検出と追跡は、コードフラグメントの変更がすべてのコピーに伝達されるようになれば、さまざまなソフトウェア開発やメンテナンス作業が容易になる。ディープラーニングに基づくいくつかのクローン検出モデルは、BigCloneBenchデータセットで広く評価されている構文的および意味的クローンの検出のための文献に現れている。しかし、クラスの不均衡と少数のセマンティッククローンにより、BigCloneBenchはモデルのパフォーマンスを解釈するのに理想的ではない。 GoogleCodeJam、OJClone、SemanticCloneBenchといった他のデータセットを使用して、モデルの一般化性も理解している。既存のデータセットの制限を克服するため、GPT支援セマンティックおよびクロス言語クローンデータセットであるGPTCloneBenchがリリースされた。しかし、これらのモデルがデータセット間でどのように比較されるのかは不明だ。本稿では,GPTCloneBenchを含む既存のベンチマークデータセットを利用した5つの最先端クローン検出モデルの多段階評価手法を提案する。具体的には,BigCloneBench,SemanticCloneBench,GPTCloneBenchの3つの高パフォーマンス単一言語モデル(ASTNN,GMN,CodeBERT)について検討し,突然変異操作による堅牢性を検証した。さらに,セマンティッククローンの検出で知られている言語間モデル (C4, CLCDSA) と比較した。シングル言語モデルはBigCloneBenchのF1スコアが高いが、SemanticCloneBenchのパフォーマンスは20%まで異なる。興味深いことに、クロス言語モデル(C4)は他のモデルよりもSemanticCloneBenchの方が優れたパフォーマンス(約7%)を示し、BigCloneBenchとGPTCloneBenchでも同じように動作する。突然変異ベースのデータセットでは、C4は単一言語モデルよりも堅牢なパフォーマンス(1%未満の違い)を持ち、高い可変性を示している。

関連論文リスト

How the Misuse of a Dataset Harmed Semantic Clone Detection [0.9361474110798144]
本稿では,BigCloneBenchが意味的コードの類似性を学習したり評価したりする上で,基礎的真理として用いることが問題であることを示す。 BigCloneBenchをデータセットとして使用する179の論文の文献レビューで、BigCloneBenchを使用してセマンティッククローン検出を評価する139の論文を発見した。 BigCloneBenchの使用は、Type-1、Type-2、Type-3クローンの構文的またはテキスト的クローン検出を評価する目的のために有効である、と強調する。
論文参考訳（メタデータ） (2025-05-07T10:52:28Z)
Evaluating Small-Scale Code Models for Code Clone Detection [0.0]
本研究の目的は、コードペアをクローンまたは非クローンとして分類する際に、新しく導入されたいくつかの小さなコードモデルの性能を測定することである。ほとんどのモデルは、精度、精度、リコール、F1スコアを含む標準メトリクスでよく機能した。クローンのごく一部は、特にコードが似ているが異なる操作を行う場合、検出が難しいままである。
論文参考訳（メタデータ） (2025-04-10T07:26:20Z)
Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.62857948698436]
大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳（メタデータ） (2025-02-20T18:32:19Z)
Large Language Models for cross-language code clone detection [3.5202378300682162]
言語間のコードクローン検出は、ソフトウェアエンジニアリングコミュニティで注目を集めている。機械学習の大幅な進歩にインスパイアされた本論文では、言語間コードクローン検出を再考する。
論文参考訳（メタデータ） (2024-08-08T12:57:14Z)
Assessing the Code Clone Detection Capability of Large Language Models [0.0]
評価には、さまざまなクローンタイプのコードペアと類似度のレベルでモデルをテストすることが含まれる。 GPT-4はすべてのクローンタイプでGPT-3.5を一貫して上回っている。
論文参考訳（メタデータ） (2024-07-02T16:20:44Z)
Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。 LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。 LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文参考訳（メタデータ） (2024-03-11T05:35:38Z)
Using Ensemble Inference to Improve Recall of Clone Detection [0.0]
大規模なソースコードクローン検出は難しい課題である。我々は、最先端のニューラルネットワークモデル4つを採用し、それらを個別に/または組み合わせて評価する。その結果、およそ5万行のC/C++コードからなるイラストレーションデータセット上で、アンサンブル推論は、すべての試行ケースで個々のモデルよりも優れていることが示唆された。
論文参考訳（メタデータ） (2024-02-12T09:44:59Z)
The Languini Kitchen: Enabling Language Modelling Research at Different Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文参考訳（メタデータ） (2023-09-20T10:31:17Z)
Unveiling the potential of large language models in generating semantic and cross-language clones [8.791710193028905]
OpenAIのGPTモデルは、テキスト生成に使用されるGPTのようなクローン生成の可能性を秘めている。セマンティッククローンの分野では、GPT-3の精度は62.14%と0.55 BLEUで、数発のプロンプトエンジニアリングによって達成されている。
論文参考訳（メタデータ） (2023-09-12T17:40:49Z)
GPTCloneBench: A comprehensive benchmark of semantic clones and cross-language clones using GPT-3 model and SemanticCloneBench [1.8687918300580921]
本稿では,SemanticCloneBenchとOpenAIのGPT-3モデルを利用して,包括的セマンティッククローンと言語間クローンベンチマークGPTCloneBenchを提案する。 GPT-3出力の79,928個のクローンペアから、37,149個の真のセマンティッククローンペア、19,288個の偽セマンティックペア(Type-1/Type-2)、および4言語(Java、C、C#、Python)にわたる20,770個のクロス言語クローンのベンチマークを作成しました。
論文参考訳（メタデータ） (2023-08-26T21:50:34Z)
ZC3: Zero-Shot Cross-Language Code Clone Detection [79.53514630357876]
ゼロショットクロスランゲージコードクローン検出のためのZC3という新しい手法を提案する。 ZC3は、異なるプログラミング言語間で同型表現空間を形成するために、対照的なスニペット予測を設計する。これに基づいて、ZC3はドメイン認識学習とサイクル一貫性学習を利用して、異なる言語間で整合した表現を生成する。
論文参考訳（メタデータ） (2023-08-26T03:48:10Z)
The CLEAR Benchmark: Continual LEArning on Real-World Imagery [77.98377088698984]
連続学習(CL)は、生涯AIにとって重要な課題であると考えられている。本稿では,視覚概念の自然な時間進化を伴う最初の連続画像分類ベンチマークであるCLEARを紹介する。単純な教師なし事前学習のステップで、最先端のCLアルゴリズムがすでに強化されていることが分かりました。
論文参考訳（メタデータ） (2022-01-17T09:09:09Z)
Semantic Clone Detection via Probabilistic Software Modeling [69.43451204725324]
本稿では,0%の構文的類似性を有するクローンを検出する意味的クローン検出手法を提案する。我々は,SCD-PSMをセマンティッククローン検出のための安定かつ高精度なソリューションとして提示する。
論文参考訳（メタデータ） (2020-08-11T17:54:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。