論文の概要: Augmenting the Interpretability of GraphCodeBERT for Code Similarity Tasks
- arxiv url: http://arxiv.org/abs/2410.05275v1
- Date: Fri, 20 Sep 2024 12:09:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 15:26:59.064256
- Title: Augmenting the Interpretability of GraphCodeBERT for Code Similarity Tasks
- Title(参考訳): コード類似性タスクに対するGraphCodeBERTの解釈可能性の向上
- Authors: Jorge Martinez-Gil,
- Abstract要約: 本稿では,GraphCodeBERTを用いた類似性評価の透明性向上を目的としたアプローチを提案する。
このアプローチは、類似のコードフラグメントを特定し、その識別の背後にある理由を明らかにし、開発者が結果をよりよく理解し、信頼するのに役立つ。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Assessing the degree of similarity of code fragments is crucial for ensuring software quality, but it remains challenging due to the need to capture the deeper semantic aspects of code. Traditional syntactic methods often fail to identify these connections. Recent advancements have addressed this challenge, though they frequently sacrifice interpretability. To improve this, we present an approach aiming to improve the transparency of the similarity assessment by using GraphCodeBERT, which enables the identification of semantic relationships between code fragments. This approach identifies similar code fragments and clarifies the reasons behind that identification, helping developers better understand and trust the results. The source code for our implementation is available at https://www.github.com/jorge-martinez-gil/graphcodebert-interpretability.
- Abstract(参考訳): コードフラグメントの類似度を評価することは、ソフトウェアの品質を保証するために重要であるが、コードのより深いセマンティックな側面を捉える必要があるため、依然として難しい。
伝統的な構文的手法は、しばしばこれらの接続を特定するのに失敗する。
近年の進歩はこの課題に対処しているが、解釈可能性の犠牲になることが多い。
これを改善するために,コードフラグメント間の意味的関係の識別を可能にするGraphCodeBERTを用いて,類似度評価の透明性向上を目的としたアプローチを提案する。
このアプローチは、類似のコードフラグメントを特定し、その識別の背後にある理由を明らかにし、開発者が結果をよりよく理解し、信頼するのに役立つ。
実装のソースコードはhttps://www.github.com/jorge-martinez-gil/graphcodebert-interpretability.comで公開されています。
関連論文リスト
- When simplicity meets effectiveness: Detecting code comments coherence with word embeddings and LSTM [6.417777780911223]
コードコメントは、プログラマに実用的な情報を提供するため、ソフトウェア開発において重要な役割を果たす。
開発者はコードを更新した後、コメントをそのまま残す傾向があり、2つのアーティファクトの間に相違が生じます。
コードスニペットが与えられたら、そのコメントが一貫性があり、コードの背後にある意図をよく反映しているかどうかを特定することが重要です。
論文 参考訳(メタデータ) (2024-05-25T15:21:27Z) - Advanced Detection of Source Code Clones via an Ensemble of Unsupervised Similarity Measures [0.0]
本研究では,コード類似度評価のための新しいアンサンブル学習手法を提案する。
鍵となる考え方は、様々な類似度尺度の強みが互いに補完し、個々の弱点を軽減することである。
論文 参考訳(メタデータ) (2024-05-03T13:42:49Z) - Improving Deep Representation Learning via Auxiliary Learnable Target Coding [69.79343510578877]
本稿では,深層表現学習の補助的正規化として,新たな学習対象符号化を提案する。
具体的には、より差別的な表現を促進するために、マージンベースの三重項損失と、提案した目標符号上の相関整合損失を設計する。
論文 参考訳(メタデータ) (2023-05-30T01:38:54Z) - Enhancing Semantic Code Search with Multimodal Contrastive Learning and
Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。
我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-07T08:49:27Z) - Code Clone Detection based on Event Embedding and Event Dependency [7.652540019496754]
本稿では,意味的類似性に基づくコードクローン検出手法を提案する。
連続的に発生する一連の相互依存イベントとしてコードを扱うことにより、コードの意味情報をエンコードするモデル、EDAMを設計する。
実験の結果,我々のEDAMモデルは,コードクローン検出のための最先端のオープンソースモデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-11-28T15:50:15Z) - deGraphCS: Embedding Variable-based Flow Graph for Neural Code Search [15.19181807445119]
ソースコードを変数ベースのフローグラフに変換する学習可能なDeGraph for Code Search(deGraphCSと呼ばれる)を提案する。
C言語で記述された41,152のコードスニペットを含む大規模なデータセットをGitHubから収集しています。
論文 参考訳(メタデータ) (2021-03-24T06:57:44Z) - COSEA: Convolutional Code Search with Layer-wise Attention [90.35777733464354]
我々は、畳み込みニューラルネットワークを階層的注意で活用し、コード固有の構造論理をキャプチャする新しいディープラーニングアーキテクチャ、COSEAを提案する。
COSEAは、コード検索タスクの最先端メソッドよりも大幅に改善できる。
論文 参考訳(メタデータ) (2020-10-19T13:53:38Z) - Contrastive Code Representation Learning [95.86686147053958]
一般的な再構成に基づくBERTモデルは,ソースコードの編集に敏感であることを示す。
コントラコード(ContraCode)は、コード機能を学ぶのにフォームではなく、コントラスト的な事前学習タスクである。
論文 参考訳(メタデータ) (2020-07-09T17:59:06Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z) - Auto-Encoding Twin-Bottleneck Hashing [141.5378966676885]
本稿では,効率よく適応的なコード駆動グラフを提案する。
自動エンコーダのコンテキストでデコードすることで更新される。
ベンチマークデータセットの実験は、最先端のハッシュ手法よりもフレームワークの方が優れていることを明らかに示しています。
論文 参考訳(メタデータ) (2020-02-27T05:58:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。