論文の概要: Code2Image: Intelligent Code Analysis by Computer Vision Techniques and
Application to Vulnerability Prediction
- arxiv url: http://arxiv.org/abs/2105.03131v1
- Date: Fri, 7 May 2021 09:10:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 18:16:14.157648
- Title: Code2Image: Intelligent Code Analysis by Computer Vision Techniques and
Application to Vulnerability Prediction
- Title(参考訳): コード2画像:コンピュータビジョンによるインテリジェントコード解析と脆弱性予測への応用
- Authors: Zeki Bilgin
- Abstract要約: 本稿では,意味的および構文的性質を維持しつつ,ソースコードを画像として表現する新しい手法を提案する。
この手法により,ソースコードのイメージ表現を直接入力として深層学習(DL)アルゴリズムに入力することができる。
脆弱性予測ユースケースをパブリックデータセット上で実現することで,本手法の実現可能性と有効性を示す。
- 参考スコア(独自算出の注目度): 0.6091702876917281
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Intelligent code analysis has received increasing attention in parallel with
the remarkable advances in the field of machine learning (ML) in recent years.
A major challenge in leveraging ML for this purpose is to represent source code
in a useful form that ML algorithms can accept as input. In this study, we
present a novel method to represent source code as image while preserving
semantic and syntactic properties, which paves the way for leveraging computer
vision techniques to use for code analysis. Indeed the method makes it possible
to directly enter the resulting image representation of source codes into deep
learning (DL) algorithms as input without requiring any further data
pre-processing or feature extraction step. We demonstrate feasibility and
effectiveness of our method by realizing a vulnerability prediction use case
over a public dataset containing a large number of real-world source code
samples with performance evaluation in comparison to the state-of-art
solutions. Our implementation is publicly available.
- Abstract(参考訳): 近年の機械学習(ML)分野における顕著な進歩と並行して、インテリジェントコード解析が注目されている。
この目的のためにMLを活用する上での大きな課題は、MLアルゴリズムが入力として受け入れられる有用な形式でソースコードを表現することである。
本研究では,意味的および構文的特性を維持しつつ,ソースコードを画像として表現する新しい手法を提案する。
実際、この方法では、さらなるデータ前処理や特徴抽出ステップを必要とせず、ソースコードのイメージ表現を直接ディープラーニング(DL)アルゴリズムに入力することができる。
本手法の有効性と有効性は,多数の実世界のソースコードサンプルを含む公開データセット上での脆弱性予測ユースケースを実現し,現状のソリューションと比較して性能評価を行う。
私たちの実装は公開されています。
関連論文リスト
- Source Code Vulnerability Detection: Combining Code Language Models and Code Property Graphs [5.953617559607503]
Vul-LMGNNは、事前訓練されたコード言語モデルとコードプロパティグラフを組み合わせた統一モデルである。
Vul-LMGNNは、様々なコード属性を統一的なグラフ構造に統合するコードプロパティグラフを構築する。
属性間の依存性情報を効果的に保持するために,ゲートコードグラフニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2024-04-23T03:48:18Z) - Enhancing Source Code Representations for Deep Learning with Static
Analysis [10.222207222039048]
本稿では,静的解析とバグレポートやデザインパターンなどのコンテキストを,ディープラーニングモデルのためのソースコード表現に統合する方法について検討する。
我々はASTNN(Abstract Syntax Tree-based Neural Network)法を用いて,バグレポートやデザインパターンから得られたコンテキスト情報を追加して拡張する。
提案手法はソースコードの表現と処理を改善し,タスク性能を向上させる。
論文 参考訳(メタデータ) (2024-02-14T20:17:04Z) - Benchmarking and Explaining Large Language Model-based Code Generation:
A Causality-Centric Approach [12.214585409361126]
大規模言語モデル(LLM)ベースのコード生成は複雑で強力なブラックボックスモデルである。
本稿では,プロンプトと生成されたコードの因果グラフに基づく新しい表現を提案する。
我々は,12以上の迅速な調整戦略で3つの人気のあるLCMを研究することで,我々のフレームワークが提供できる洞察について説明する。
論文 参考訳(メタデータ) (2023-10-10T14:56:26Z) - Exploring Representation-Level Augmentation for Code Search [50.94201167562845]
我々は、データ処理やトレーニングを必要としない表現レベルでデータ(コードとクエリの両方)を増強する拡張手法について検討する。
大規模公開データセット上で,最先端のコード検索モデルを用いた表現レベル向上手法を実験的に評価した。
論文 参考訳(メタデータ) (2022-10-21T22:47:37Z) - Enhancing Semantic Code Search with Multimodal Contrastive Learning and
Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。
我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-07T08:49:27Z) - Multi-View Graph Representation for Programming Language Processing: An
Investigation into Algorithm Detection [35.81014952109471]
本稿では,マルチビューグラフ(MVG)プログラム表現法を提案する。
MVGはコードのセマンティクスにより多くの注意を払っており、同時に複数のビューとしてデータフローと制御フローの両方を含んでいる。
実験では、MVGは従来の方法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-02-25T03:35:45Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z) - Improved Code Summarization via a Graph Neural Network [96.03715569092523]
一般に、ソースコード要約技術はソースコードを入力として使用し、自然言語記述を出力する。
これらの要約を生成するために、ASTのデフォルト構造によくマッチするグラフベースのニューラルアーキテクチャを使用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。