論文の概要: Code Clone Detection based on Event Embedding and Event Dependency
- arxiv url: http://arxiv.org/abs/2111.14183v1
- Date: Sun, 28 Nov 2021 15:50:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 18:11:19.279403
- Title: Code Clone Detection based on Event Embedding and Event Dependency
- Title(参考訳): イベント埋め込みとイベント依存性に基づくコードクローン検出
- Authors: Cheng Huang, Hui Zhou, Chunyang Ye, Bingzhuo Li
- Abstract要約: 本稿では,意味的類似性に基づくコードクローン検出手法を提案する。
連続的に発生する一連の相互依存イベントとしてコードを扱うことにより、コードの意味情報をエンコードするモデル、EDAMを設計する。
実験の結果,我々のEDAMモデルは,コードクローン検出のための最先端のオープンソースモデルよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 7.652540019496754
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The code clone detection method based on semantic similarity has important
value in software engineering tasks (e.g., software evolution, software reuse).
Traditional code clone detection technologies pay more attention to the
similarity of code at the syntax level, and less attention to the semantic
similarity of the code. As a result, candidate codes similar in semantics are
ignored. To address this issue, we propose a code clone detection method based
on semantic similarity. By treating code as a series of interdependent events
that occur continuously, we design a model namely EDAM to encode code semantic
information based on event embedding and event dependency. The EDAM model uses
the event embedding method to model the execution characteristics of program
statements and the data dependence information between all statements. In this
way, we can embed the program semantic information into a vector and use the
vector to detect codes similar in semantics. Experimental results show that the
performance of our EDAM model is superior to state of-the-art open source
models for code clone detection.
- Abstract(参考訳): 意味的類似性に基づくコードクローン検出法は、ソフトウェア工学のタスク(例えば、ソフトウェア進化、ソフトウェア再利用)において重要な価値を持っている。
従来のコードクローン検出技術は、構文レベルでのコードの類似性に注目し、コードのセマンティックな類似性にはあまり注意を払わない。
その結果、意味論に類似する候補符号は無視される。
そこで本研究では,意味的類似性に基づくコードクローン検出手法を提案する。
連続的に発生する一連の相互依存イベントとしてコードを扱うことで、イベント埋め込みとイベント依存性に基づいたコード意味情報をエンコードするモデルEDAMを設計する。
EDAMモデルは、プログラムステートメントの実行特性と全てのステートメント間のデータ依存情報をモデル化するために、イベント埋め込み手法を使用する。
このようにして、プログラムの意味情報をベクターに埋め込み、ベクターを使ってセマンティクスに類似したコードを検出することができる。
実験の結果,EDAMモデルの性能は,コードクローン検出のための最先端のオープンソースモデルよりも優れていることがわかった。
関連論文リスト
- SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - Source Code Clone Detection Using Unsupervised Similarity Measures [0.0]
本研究は,ソースコードのクローン検出のための教師なし類似度尺度の比較分析を行う。
目標は、現在の最先端技術、その強み、弱点を概観することである。
論文 参考訳(メタデータ) (2024-01-18T10:56:27Z) - CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。
汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。
特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文 参考訳(メタデータ) (2023-06-05T20:39:08Z) - Tram: A Token-level Retrieval-augmented Mechanism for Source Code
Summarization [65.54811122644607]
新たなトレンドは、ニューラルモデルと外部知識を組み合わせることだ。
本稿では,バニラニューラルネットワークがより優れたコード要約を生成するのを支援するために,デコーダ側のトークンレベル検索強化機構について検討する。
論文 参考訳(メタデータ) (2023-05-18T16:02:04Z) - Probing Semantic Grounding in Language Models of Code with
Representational Similarity Analysis [0.11470070927586018]
本稿では,コード言語モデルにおける意味的グラウンドリングの探索にRepresentational similarity Analysisを用いることを提案する。
我々は,IBM CodeNetデータセットのデータを用いて,意味的接地のためのCodeBERTモデルから表現を探索する。
コード中の意味的摂動による実験により、CodeBERTは意味論的に正しいコードと正しくないコードとをしっかりと区別できることがわかった。
論文 参考訳(メタデータ) (2022-07-15T19:04:43Z) - Evaluation of Contrastive Learning with Various Code Representations for
Code Clone Detection [3.699097874146491]
コードスニペットの意味的クローンを検出するためのコントラスト学習の評価を行った。
CodeTransformatorを使って、競争力のあるプログラミングソリューションに基づいて、プラジャライズされたコードを模倣するデータセットを作成します。
評価の結果,提案手法は各タスクにおいて多種多様な性能を示すが,グラフベースモデルの性能は概して他のモデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-17T12:25:44Z) - Enhancing Semantic Code Search with Multimodal Contrastive Learning and
Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。
我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-07T08:49:27Z) - Self-Supervised Contrastive Learning for Code Retrieval and
Summarization via Semantic-Preserving Transformations [28.61567319928316]
Corderは、ソースコードモデルのための自己教師付きコントラスト学習フレームワークである。
重要なイノベーションは、ソースコードモデルをトレーニングし、類似した、異種のコードスニペットを認識するように要求することです。
Corderで事前訓練されたコードモデルは、コード・ツー・コード検索、テキスト・ツー・コード検索、およびコード・ツー・テキスト要約タスクにおいて、他のベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-09-06T13:31:16Z) - Semantic Clone Detection via Probabilistic Software Modeling [69.43451204725324]
本稿では,0%の構文的類似性を有するクローンを検出する意味的クローン検出手法を提案する。
我々は,SCD-PSMをセマンティッククローン検出のための安定かつ高精度なソリューションとして提示する。
論文 参考訳(メタデータ) (2020-08-11T17:54:20Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z) - Detecting Code Clones with Graph Neural Networkand Flow-Augmented
Abstract Syntax Tree [30.484662671342935]
フロー拡張抽象構文木(FA-AST)と呼ばれるプログラムのグラフ表現を構築する。
FA-ASTに2種類のグラフニューラルネットワークを適用し、コードペアの類似性を計測する。
当社のアプローチは,Google Code JamとBigCloneBenchタスクの両面で,最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-02-20T10:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。