論文の概要: CSSG: Measuring Code Similarity with Semantic Graphs
- arxiv url: http://arxiv.org/abs/2601.04085v1
- Date: Wed, 07 Jan 2026 16:54:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.691016
- Title: CSSG: Measuring Code Similarity with Semantic Graphs
- Title(参考訳): CSSG: セマンティックグラフによるコードの類似性の測定
- Authors: Jingwen Xu, Yiyang Lu, Changze Lv, Zisu Huang, Zhengkang Guo, Zhengyuan Wang, Muzhao Tian, Xuanjing Huang, Xiaoqing Zheng,
- Abstract要約: プログラム依存グラフを用いたCSSG(Code similarity using Semantic Graphs)を提案する。
CodeContests+データセットの実験によると、CSSGはモノリンガルとクロスランガルの両方の設定下で、類似の少ないコードを区別することで、既存のメトリクスを一貫して上回っている。
- 参考スコア(独自算出の注目度): 38.559434538501925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing code similarity metrics, such as BLEU, CodeBLEU, and TSED, largely rely on surface-level string overlap or abstract syntax tree structures, and often fail to capture deeper semantic relationships between programs.We propose CSSG (Code Similarity using Semantic Graphs), a novel metric that leverages program dependence graphs to explicitly model control dependencies and variable interactions, providing a semantics-aware representation of code.Experiments on the CodeContests+ dataset show that CSSG consistently outperforms existing metrics in distinguishing more similar code from less similar code under both monolingual and cross-lingual settings, demonstrating that dependency-aware graph representations offer a more effective alternative to surface-level or syntax-based similarity measures.
- Abstract(参考訳): BLEU、CodeBLEU、TSEDなどの既存のコード類似度メトリクスは、主に表面レベルの文字列の重複や抽象構文木構造に依存しており、プログラム間の深いセマンティックな関係を捉えないことが多い。我々はCSSG(Code similarity using Semantic Graphs)を提案する。これは、プログラム依存グラフを利用して、依存関係と変数の相互作用を明示的にモデル化し、コードのセマンティックスを意識した表現を提供する新しいメトリクスである。
関連論文リスト
- AlloyASG: Alloy Predicate Code Representation as a Compact Structurally Balanced Graph [0.6445605125467574]
我々はCSBASG(Compplex Structurely Balanced Abstract Semantic Graph)という新しいコード表現スキーマを導入する。
CSBASGは、ある意味的要素をグラフのノードとしてリストする複雑な重み付き有向グラフとしてコードを表す。
我々は,合金モデルに対するCSBASG表現の効率を,ASTと比較してコンパクト性の観点から評価した。
論文 参考訳(メタデータ) (2024-02-29T22:41:09Z) - mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.523172171533645]
CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-08-17T16:02:29Z) - Capturing Fine-grained Semantics in Contrastive Graph Representation
Learning [23.861016307326146]
グラフコントラスト学習(Graph contrastive learning)は、類似のインスタンスを閉じて、異種インスタンスをプッシュするコントラストタスクを定義する。
グラフコントラスト学習の既存の方法は、グラフに存在する多様な意味論の違いを無視している。
本稿では, グラフコントラスト学習法(FSGCL)を提案する。
論文 参考訳(メタデータ) (2023-04-23T14:05:05Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Integrating Language Guidance into Vision-based Deep Metric Learning [78.18860829585182]
埋め込み空間として意味的類似性を符号化した距離空間を学習することを提案する。
これらの空間は、トレーニング中に見られるもの以外のクラスに転送可能であるべきである。
これにより、学習された埋め込み空間は不完全な意味的コンテキストを符号化し、クラス間の意味的関係を誤って表現する。
論文 参考訳(メタデータ) (2022-03-16T11:06:50Z) - GN-Transformer: Fusing Sequence and Graph Representation for Improved
Code Summarization [0.0]
融合シーケンスとグラフのモダリティに基づいてエンドツーエンドの学習を行う新しい手法であるGN-Transformerを提案する。
提案手法は,2つのコード要約データセットと3つの自動コード要約メトリクスにおいて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-17T02:51:37Z) - Representing Syntax and Composition with Geometric Transformations [1.439493901412045]
単語の文脈としての構文グラフ(SyG)は分布意味モデル(DSM)に有用であることが示されている。
本稿では,GTが構文的関係をよりよく符号化し,これらの表現を構文的文脈化による句レベル構成の強化に利用できるかを検討する。
論文 参考訳(メタデータ) (2021-06-03T14:53:34Z) - Deep Graph Matching and Searching for Semantic Code Retrieval [76.51445515611469]
本稿では,グラフニューラルネットワークに基づくエンドツーエンドのディープグラフマッチングと探索モデルを提案する。
まず、自然言語クエリテキストとプログラミング言語のコードスニペットをグラフ構造化データで表現する。
特に、DGMSは、個々のクエリテキストやコードスニペットのより構造的な情報をキャプチャするだけでなく、それらの微妙な類似性も学習する。
論文 参考訳(メタデータ) (2020-10-24T14:16:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。