論文の概要: Semantic Code Graph -- an information model to facilitate software
comprehension
- arxiv url: http://arxiv.org/abs/2310.02128v2
- Date: Mon, 1 Jan 2024 16:51:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 01:34:22.377952
- Title: Semantic Code Graph -- an information model to facilitate software
comprehension
- Title(参考訳): Semantic Code Graph -- ソフトウェアの理解を促進する情報モデル
- Authors: Krzysztof Borowski, Bartosz Bali\'s, Tomasz Orzechowski
- Abstract要約: メンテナンスを容易にし、関連するコストを削減するために、コード理解プロセスを加速する必要性が高まっています。
さまざまなコード構造モデルがすでに存在していますが、ソースコードを密接に表現するモデルが驚くほど不足しています。
本稿では,コード依存関係の詳細な抽象表現を提供する情報モデルであるSemantic Code Graph (SCG)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software comprehension can be extremely time-consuming due to the
ever-growing size of codebases. Consequently, there is an increasing need to
accelerate the code comprehension process to facilitate maintenance and reduce
associated costs. A crucial aspect of this process is understanding and
preserving the high quality of the code dependency structure. While a variety
of code structure models already exist, there is a surprising lack of models
that closely represent the source code and focus on software comprehension. As
a result, there are no readily available and easy-to-use tools to assist with
dependency comprehension, refactoring, and quality monitoring of code. To
address this gap, we propose the Semantic Code Graph (SCG), an information
model that offers a detailed abstract representation of code dependencies with
a close relationship to the source code. To validate the SCG model's usefulness
in software comprehension, we compare it to nine other source code
representation models. Additionally, we select 11 well-known and widely-used
open-source projects developed in Java and Scala and perform a range of
software comprehension activities on them using three different code
representation models: the proposed SCG, the Call Graph (CG), and the Class
Collaboration Network (CCN). We then qualitatively analyze the results to
compare the performance of these models in terms of software comprehension
capabilities. These activities encompass project structure comprehension,
identifying critical project entities, interactive visualization of code
dependencies, and uncovering code similarities through software mining. Our
findings demonstrate that the SCG enhances software comprehension capabilities
compared to the prevailing CCN and CG models. We believe that the work
described is a step towards the next generation of tools that streamline code
dependency comprehension and management.
- Abstract(参考訳): コードベースが増え続けているため、ソフトウェア理解は極めて時間がかかります。
その結果、メンテナンスを容易にし、関連するコストを削減するために、コード理解プロセスを加速する必要性が高まっている。
このプロセスの重要な側面は、コード依存関係の構造の高品質を理解し保存することである。
さまざまなコード構造モデルがすでに存在しているが、ソースコードを密接に表現し、ソフトウェア理解に焦点を当てたモデルが驚くほど欠如している。
結果として、依存性の理解、リファクタリング、コードの品質監視を支援するツールが簡単には利用できない。
このギャップに対処するため,ソースコードと密接な関係を持つコード依存関係の詳細な抽象表現を提供する情報モデルであるSemantic Code Graph (SCG)を提案する。
ソフトウェア理解におけるSCGモデルの有用性を検証するため、他の9つのソースコード表現モデルと比較した。
さらに,java と scala で開発されている11の著名なオープンソースプロジェクトを選択し,提案する scg,コールグラフ (cg),クラスコラボレーションネットワーク (ccn) という3つの異なるコード表現モデルを用いて,さまざまなソフトウェア理解活動を行う。
次に、ソフトウェア理解能力の観点から結果を分析し、これらのモデルの性能を比較する。
これらのアクティビティは、プロジェクト構造理解、重要なプロジェクトエンティティの識別、コードの依存関係のインタラクティブな可視化、ソフトウェアマイニングによるコード類似性の発見を含む。
その結果, SCG は CCN や CG モデルと比較して, ソフトウェア理解能力の向上を図っている。
説明した作業は、コードの依存性の理解と管理を効率化する次世代のツールへの一歩だと思います。
関連論文リスト
- Enhancing Source Code Representations for Deep Learning with Static
Analysis [10.222207222039048]
本稿では,静的解析とバグレポートやデザインパターンなどのコンテキストを,ディープラーニングモデルのためのソースコード表現に統合する方法について検討する。
我々はASTNN(Abstract Syntax Tree-based Neural Network)法を用いて,バグレポートやデザインパターンから得られたコンテキスト情報を追加して拡張する。
提案手法はソースコードの表現と処理を改善し,タスク性能を向上させる。
論文 参考訳(メタデータ) (2024-02-14T20:17:04Z) - SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - CompCodeVet: A Compiler-guided Validation and Enhancement Approach for
Code Dataset [12.58750209611099]
数十億のパラメータを持つモデルでさえ、多段階の推論を必要とするタスクの課題に直面します。
CompCodeVetはコンパイル不能なコードからコンパイル可能なコードを生成するためのコンパイラ誘導のCoTアプローチである。
論文 参考訳(メタデータ) (2023-11-11T08:21:52Z) - When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。
具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。
コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文 参考訳(メタデータ) (2023-08-29T17:22:39Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - Leveraging Structural Properties of Source Code Graphs for Just-In-Time
Bug Prediction [6.467090475885797]
グラフは関係データを理解するのに最もよく使われる表現の1つである。
本研究では,ソースコードのリレーショナル特性をグラフ形式で活用する手法を提案する。
論文 参考訳(メタデータ) (2022-01-25T07:20:47Z) - Precise Learning of Source Code Contextual Semantics via Hierarchical
Dependence Structure and Graph Attention Networks [28.212889828892664]
階層的な依存関係を組み込んだ新しいソースコードモデルを提案する。
本稿では,基本ブロックの構文構造,すなわち対応するASTをソースコードモデルに導入し,十分な情報を提供する。
その結果,本モデルではパラメータのスケールを50%削減し,プログラム分類タスクの精度を4%向上させることができた。
論文 参考訳(メタデータ) (2021-11-20T04:03:42Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。