論文の概要: MISIM: A Neural Code Semantics Similarity System Using the Context-Aware
Semantics Structure
- arxiv url: http://arxiv.org/abs/2006.05265v6
- Date: Wed, 2 Jun 2021 20:34:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 03:34:10.036032
- Title: MISIM: A Neural Code Semantics Similarity System Using the Context-Aware
Semantics Structure
- Title(参考訳): MISIM:文脈認識型セマンティック構造を用いたニューラルコードセマンティックス類似システム
- Authors: Fangke Ye, Shengtian Zhou, Anand Venkat, Ryan Marcus, Nesime Tatbul,
Jesmin Jahan Tithi, Niranjan Hasabnis, Paul Petersen, Timothy Mattson, Tim
Kraska, Pradeep Dubey, Vivek Sarkar, Justin Gottschlich
- Abstract要約: コードセマンティクスの類似性は、コードレコメンデーション、自動ソフトウェア欠陥修正、クローン検出など、多くのタスクに利用できる。
本稿では、2つのコアコンポーネントからなるニューラルネットワークセマンティックス類似システムであるMachine Inferred Code similarity (MISIM)を提案する。
MISIMの精度は8.08%(MAP@R)である。
- 参考スコア(独自算出の注目度): 18.401838035174336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code semantics similarity can be used for many tasks such as code
recommendation, automated software defect correction, and clone detection. Yet,
the accuracy of such systems has not yet reached a level of general purpose
reliability. To help address this, we present Machine Inferred Code Similarity
(MISIM), a neural code semantics similarity system consisting of two core
components: (i)MISIM uses a novel context-aware semantics structure, which was
purpose-built to lift semantics from code syntax; (ii)MISIM uses an extensible
neural code similarity scoring algorithm, which can be used for various neural
network architectures with learned parameters. We compare MISIM to four
state-of-the-art systems, including two additional hand-customized models, over
328K programs consisting of over 18 million lines of code. Our experiments show
that MISIM has 8.08% better accuracy (using MAP@R) compared to the next best
performing system.
- Abstract(参考訳): コードのセマンティクスの類似性は、コードのレコメンデーション、ソフトウェア欠陥の自動修正、クローン検出など、多くのタスクで使用できる。
しかし、そのようなシステムの精度はまだ汎用的信頼性のレベルに達していない。
そこで本研究では,2つのコアコンポーネントからなるニューラルコードセマンティクス類似性システムであるmachine inferred code similarity (misim)を提案する。
i)MISIMは、コード構文からセマンティクスを引き上げるために構築された、新しいコンテキスト対応セマンティクス構造を使用する。
(ii)MISIMは、学習パラメータを持つ様々なニューラルネットワークアーキテクチャに使用できる拡張可能なニューラルネットワーク類似性スコアリングアルゴリズムを使用する。
我々はMISIMを4つの最先端システムと比較し、さらに2つの手動モデル、1800万行以上のコードからなる328Kプログラムを含む。
実験の結果、misimは(map@rを使って)次の最高のパフォーマンスシステムよりも8.08%精度が良いことがわかった。
関連論文リスト
- A test-free semantic mistakes localization framework in Neural Code Translation [32.5036379897325]
本稿では,Large Language Model(LLM)に基づく静的解析フレームワークであるEISPを紹介する。
このフレームワークはソースコードと翻訳されたコード間の意味マッピングを生成する。
EISPは、AIチェーンを通じて、各サブコードのフラグメントをきめ細かい知識ヒントで接続する。
論文 参考訳(メタデータ) (2024-10-30T08:53:33Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Feature Engineering-Based Detection of Buffer Overflow Vulnerability in
Source Code Using Neural Networks [2.9266864570485827]
ソースコードから抽出された特徴を学習するニューラルネットワークモデルに基づく脆弱性検出方法。
我々は,GloVeやfastTextといったアートワード埋め込みアルゴリズムの状態を用いて,セマンティックおよび構文情報を維持する。
従来のニューラルネットワークに関わる問題を克服できるニューラルネットワークモデルを提案してきた。
論文 参考訳(メタデータ) (2023-06-01T01:44:49Z) - Automated Vulnerability Detection in Source Code Using Quantum Natural
Language Processing [0.0]
CとC++のオープンソースコードは、関数レベルの脆弱性識別のための大規模で古典的な機械学習および量子機械学習システムを作成するために利用可能である。
我々は、深層ニューラルネットワークモデルLong Short Term Memory(LSTM)と量子機械学習モデルLong Short Term Memory(QLSTM)に基づく、効率的でスケーラブルな脆弱性検出手法を開発した。
意味的および構文的特徴を持つQLSTMは、極めて正確な脆弱性を検出し、従来のものよりも高速に実行される。
論文 参考訳(メタデータ) (2023-03-13T23:27:42Z) - Incremental Online Learning Algorithms Comparison for Gesture and Visual
Smart Sensors [68.8204255655161]
本稿では,加速度センサデータに基づくジェスチャー認識と画像分類の2つの実例として,最先端の4つのアルゴリズムを比較した。
以上の結果から,これらのシステムの信頼性と小型メモリMCUへのデプロイの可能性が確認された。
論文 参考訳(メタデータ) (2022-09-01T17:05:20Z) - LegoNN: Building Modular Encoder-Decoder Models [117.47858131603112]
最先端のエンコーダ・デコーダモデルは、原子単位として構築され、訓練されたエンドツーエンドである。
モデルのどのコンポーネントも他のコンポーネントなしでは(再)使用できないため、部品の共有は不可能です。
LegoNNは、エンコーダ-デコーダアーキテクチャを、微調整を必要とせずに、その部品を他のタスクに適用できる方法で構築する手順である。
論文 参考訳(メタデータ) (2022-06-07T14:08:07Z) - Neuro-Symbolic Artificial Intelligence (AI) for Intent based Semantic
Communication [85.06664206117088]
6Gネットワークはデータ転送のセマンティクスと有効性(エンドユーザ)を考慮する必要がある。
観測データの背後にある因果構造を学習するための柱としてNeSy AIが提案されている。
GFlowNetは、無線システムにおいて初めて活用され、データを生成する確率構造を学ぶ。
論文 参考訳(メタデータ) (2022-05-22T07:11:57Z) - A Performance-Consistent and Computation-Efficient CNN System for
High-Quality Automated Brain Tumor Segmentation [1.2183405753834562]
CNNをベースとした完全自動脳-運動-隔離システムの開発研究は急速に進展している。
実際に適用可能なシステムには、優れた処理品質と信頼性が不可欠です。
提案方式のCNNは2つの特徴を持つユニークな構造を持つ。
論文 参考訳(メタデータ) (2022-05-02T22:10:36Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - Quantization and Deployment of Deep Neural Networks on Microcontrollers [0.0]
この研究は、低消費電力32ビットマイクロコントローラへのディープニューラルネットワークの量子化と展開に焦点を当てている。
エンドツーエンドのディープニューラルネットワークトレーニング、量子化、デプロイメントのための新しいフレームワークが紹介されている。
単一精度32ビット浮動小数点と8ビットおよび16ビット整数上の固定点を用いた実行がサポートされている。
論文 参考訳(メタデータ) (2021-05-27T17:39:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。