論文の概要: Zero-shot Evaluation of Deep Learning for Java Code Clone Detection
- arxiv url: http://arxiv.org/abs/2604.13783v1
- Date: Wed, 15 Apr 2026 12:17:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.523724
- Title: Zero-shot Evaluation of Deep Learning for Java Code Clone Detection
- Title(参考訳): Javaコードクローン検出のためのディープラーニングのゼロショット評価
- Authors: Thomas S. Heinze,
- Abstract要約: Java用のDLベースのクローン検出器の一般化性について検討する。
我々の実験は、モデルが見えないコードに対して一般化可能であることを実証している。
従来のクローン検出器NiCadは、そのようなゼロショット評価シナリオにおいて、DLベースのクローン検出器よりも優れている。
- 参考スコア(独自算出の注目度): 0.3158660750994145
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep Learning (DL) is becoming more and more widespread in clone detection, motivated by achieving near-perfect performance for this task. In particular in case of semantic code clones, which share only limited syntax but implement the same or similar functionality, Deep Learning appears to outperform conventional tools. In this paper, we want to investigate the generalizability of DL-based clone detectors for Java. We therefore replicate and evaluate the performance of five state-of-the-art DL-based clone detectors, including Transformers like CodeBERT and single-task models like FA-AST+GMN, in a zero-shot evaluation scenario, where we train/fine-tune and evaluate on different datasets and functionalities. Our experiments demonstrate that the models' generalizability to unseen code is limited. Further analysis reveals that the conventional clone detector NiCad even outperforms the DL-based clone detectors in such a zero-shot evaluation scenario.
- Abstract(参考訳): ディープ・ラーニング(DL)は、このタスクでほぼ完璧なパフォーマンスを達成したことで、クローン検出においてますます広まりつつある。
特に構文のみを共有できるセマンティックコードクローンでは、同じあるいは類似の機能を実装しているため、Deep Learningは従来のツールよりも優れています。
本稿では,Java 用の DL ベースのクローン検出器の一般化可能性について検討する。
そこで我々は,CodeBERTなどのトランスフォーマーやFA-AST+GMNのような単一タスクモデルを含む,最先端のDLベースの5つのクローン検出器の性能をゼロショット評価シナリオで再現し,評価する。
我々の実験は、モデルが見えないコードに対して一般化可能であることを実証している。
さらに分析したところ、従来のクローン検出器NiCadは、そのようなゼロショット評価シナリオにおいて、DLベースのクローン検出器よりも優れていることが判明した。
関連論文リスト
- Detecting Semantic Clones of Unseen Functionality [7.660632979515074]
我々は,未確認機能のクローンを検出するタスクにおいて,タスク固有モデルと生成LDMの両方を含む6つの最先端モデルを再評価する。
そこで本研究では,既存モデルの非可視機能のクローン上での性能向上を図るために,コントラッシブ・ラーニング(コントラッシブ・ラーニング)の使用法を提案し,評価する。
論文 参考訳(メタデータ) (2025-10-05T10:45:52Z) - DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - Assessing the Code Clone Detection Capability of Large Language Models [0.0]
評価には、さまざまなクローンタイプのコードペアと類似度のレベルでモデルをテストすることが含まれる。
GPT-4はすべてのクローンタイプでGPT-3.5を一貫して上回っている。
論文 参考訳(メタデータ) (2024-07-02T16:20:44Z) - Using Ensemble Inference to Improve Recall of Clone Detection [0.0]
大規模なソースコードクローン検出は難しい課題である。
我々は、最先端のニューラルネットワークモデル4つを採用し、それらを個別に/または組み合わせて評価する。
その結果、およそ5万行のC/C++コードからなるイラストレーションデータセット上で、アンサンブル推論は、すべての試行ケースで個々のモデルよりも優れていることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T09:44:59Z) - CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。
汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。
特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文 参考訳(メタデータ) (2023-06-05T20:39:08Z) - Partial Network Cloning [58.83278629019384]
PNCはソースネットワークから部分パラメトリックの「クローズニング」を実行し、クローン化されたモジュールをターゲットに注入する。
本手法はパラメータ調整法と比較して精度が5%向上し,局所性が50%向上した。
論文 参考訳(メタデータ) (2023-03-19T08:20:31Z) - Generalizability of Code Clone Detection on CodeBERT [0.0]
CodeBERTのようなトランスフォーマーネットワークは、ベンチマークデータセットのコードクローン検出において、すでに優れた結果が得られている。
我々は、BigCloneBenchからJavaコードクローンの2つの異なるサブセットを評価することで、CodeBERTの一般化性が低下することを示す。
論文 参考訳(メタデータ) (2022-08-26T11:24:20Z) - K-ASTRO: Structure-Aware Adaptation of LLMs for Code Vulnerability Detection [12.458619777971956]
K-ASTROは、大規模言語モデルからのセマンティック埋め込みと抽象構文木(AST)の構造的特徴を組み合わせた軽量なトランスフォーマーモデルで、コード脆弱性検出の効率と精度を向上させる。
提案手法では,突然変異検査にインスパイアされたASTベースの拡張手法,拡張AST機能を組み込んだ構造認識型アテンション機構,コードセマンティクスと構文を統一する共同適応パイプラインを導入している。
論文 参考訳(メタデータ) (2022-08-17T04:50:51Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Semantic Clone Detection via Probabilistic Software Modeling [69.43451204725324]
本稿では,0%の構文的類似性を有するクローンを検出する意味的クローン検出手法を提案する。
我々は,SCD-PSMをセマンティッククローン検出のための安定かつ高精度なソリューションとして提示する。
論文 参考訳(メタデータ) (2020-08-11T17:54:20Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。