論文の概要: Encoding Program as Image: Evaluating Visual Representation of Source
Code
- arxiv url: http://arxiv.org/abs/2111.01097v1
- Date: Mon, 1 Nov 2021 17:07:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 18:00:38.505419
- Title: Encoding Program as Image: Evaluating Visual Representation of Source
Code
- Title(参考訳): 画像としてのプログラムの符号化:ソースコードの視覚的表現の評価
- Authors: Md Rafiqul Islam Rabin, Mohammad Amin Alipour
- Abstract要約: 入力プログラムのスナップショットに基づく新しいソースコード表現であるCode2Snapshotについて検討する。
入力プログラムの構文的特徴と意味的特徴を利用した最先端表現と比較する。
- 参考スコア(独自算出の注目度): 2.1016374925364616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There are several approaches to encode source code in the input vectors of
neural models. These approaches attempt to include various syntactic and
semantic features of input programs in their encoding. In this paper, we
investigate Code2Snapshot, a novel representation of the source code that is
based on the snapshots of input programs. We evaluate several variations of
this representation and compare its performance with state-of-the-art
representations that utilize the rich syntactic and semantic features of input
programs. Our preliminary study on the utility of Code2Snapshot in the code
summarization task suggests that simple snapshots of input programs have
comparable performance to the state-of-the-art representations. Interestingly,
obscuring the input programs have insignificant impacts on the Code2Snapshot
performance, suggesting that, for some tasks, neural models may provide high
performance by relying merely on the structure of input programs.
- Abstract(参考訳): ニューラルネットワークの入力ベクトルにソースコードをエンコードするいくつかのアプローチがある。
これらのアプローチは、入力プログラムの様々な構文的特徴と意味的特徴をエンコーディングに含もうとしている。
本稿では,入力プログラムのスナップショットに基づくソースコードの新しい表現であるcode2snapshotについて検討する。
この表現のいくつかのバリエーションを評価し、その性能を入力プログラムの豊かな構文的特徴と意味的特徴を利用した最先端表現と比較する。
コード要約タスクにおけるCode2Snapshotの実用性に関する予備的な研究は、入力プログラムの単純なスナップショットが最先端表現に匹敵する性能を持つことを示唆している。
興味深いことに、入力プログラムを無視することはcode2snapshotのパフォーマンスに無意味な影響を与えるため、いくつかのタスクでは、ニューラルネットワークが入力プログラムの構造のみに依存することで高いパフォーマンスを提供する可能性がある。
関連論文リスト
- SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - Code Representation Pre-training with Complements from Program
Executions [29.148208436656216]
テストケースで明らかになったプログラムの動的情報を調べ,それを補体としてコードの特徴表現に埋め込むために,FuzzPretrainを提案する。
FuzzyPretrainは、ソースコードやASTのみをトレーニングしたコード検索に対して、6%/9%のmAP改善を実現した。
論文 参考訳(メタデータ) (2023-09-04T01:57:22Z) - Which Features are Learned by CodeBert: An Empirical Study of the
BERT-based Source Code Representation Learning [9.469346910848733]
提案手法は,ソースコードの論理を効果的に理解できないことを示す。
ソースコードの表現は、プログラマが定義した変数と関数名に大きく依存している。
論文 参考訳(メタデータ) (2023-01-20T05:39:26Z) - Generalized Decoding for Pixel, Image, and Language [197.85760901840177]
画素レベルのセグメンテーションと言語トークンをシームレスに予測できる一般化デコードモデルであるX-Decoderを提案する。
X-Decoderは、すべてのタイプのイメージセグメンテーションと様々な視覚言語(VL)タスクをサポートする統一された方法を提供する最初の作品である。
論文 参考訳(メタデータ) (2022-12-21T18:58:41Z) - Syntax-Guided Program Reduction for Understanding Neural Code
Intelligence Models [1.1924369482115011]
そこで本研究では,構文誘導型プログラム削減手法がより高速で,短縮プログラムにキートークンのセットが小さいことを示す。
また、入力プログラムの最大65%の逆例を生成するために、キートークンが使用できることを示す。
論文 参考訳(メタデータ) (2022-05-28T09:04:57Z) - Latent Execution for Neural Program Synthesis Beyond Domain-Specific
Languages [97.58968222942173]
入力出力の例からCプログラムを合成する第一歩を踏み出す。
特に,部分生成プログラムの実行を近似するために潜在表現を学習するLa Synthを提案する。
これらのプログラムのトレーニングにより,Karel と C のプログラム合成における予測性能がさらに向上することを示す。
論文 参考訳(メタデータ) (2021-06-29T02:21:32Z) - Representing Partial Programs with Blended Abstract Semantics [62.20775388513027]
プログラム合成エンジンにおける部分的なプログラム表現手法について紹介する。
モジュラーニューラルネットワークとして実装された近似実行モデルを学ぶ。
これらのハイブリッドニューロシンボリック表現は、実行誘導型シンセサイザーがより強力な言語構成を使うことができることを示す。
論文 参考訳(メタデータ) (2020-12-23T20:40:18Z) - Latent Programmer: Discrete Latent Codes for Program Synthesis [56.37993487589351]
プログラム合成や文書要約などの多くのシーケンス学習タスクにおいて、重要な問題は出力シーケンスの広い空間を探索することである。
本稿では,検索対象とする出力の表現を学習することを提案する。
本稿では,まず入力/出力サンプルから離散潜在コードを予測するプログラム合成手法であるemphLatent Programmerを紹介し,そのプログラムを対象言語で生成する。
論文 参考訳(メタデータ) (2020-12-01T10:11:35Z) - Towards Demystifying Dimensions of Source Code Embeddings [5.211235558099913]
Code2vecニューラルソースコードの埋め込み内容の理解を深めるための予備的な結果を示す。
以上の結果から,手工芸品は高次元のcode2vec 埋め込みに非常に近い性能が得られることが示唆された。
また、code2vecの埋め込みは、手作りの特徴よりも情報ゲインの少ない次元の除去に対して、より弾力性が高いことが判明した。
論文 参考訳(メタデータ) (2020-08-29T21:59:11Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。