論文の概要: xASTNN: Improved Code Representations for Industrial Practice
- arxiv url: http://arxiv.org/abs/2303.07104v2
- Date: Fri, 3 Nov 2023 11:12:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-06 18:18:45.133967
- Title: xASTNN: Improved Code Representations for Industrial Practice
- Title(参考訳): xASTNN: 産業実践のためのコード表現の改善
- Authors: Zhiwei Xu, Min Zhou, Xibin Zhao, Yang Chen, Xi Cheng, Hongyu Zhang
- Abstract要約: ソースコード表現のためのeXtreme Abstract Syntax Tree (AST)ベースのニューラルネットワークであるxASTNNを提案する。
まず、xASTNNは広く使われているASTを完全にベースとしており、複雑なデータ前処理を必要としない。
第2に、xASTNNの有効性を保証するために、3つの密接な設計が提案されている。
第3に、xASTNNの時間的複雑さを著しく低減するために、動的アルゴリズムが導入された。
- 参考スコア(独自算出の注目度): 30.45577773085939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The application of deep learning techniques in software engineering becomes
increasingly popular. One key problem is developing high-quality and
easy-to-use source code representations for code-related tasks. The research
community has acquired impressive results in recent years. However, due to the
deployment difficulties and performance bottlenecks, seldom these approaches
are applied to the industry. In this paper, we present xASTNN, an eXtreme
Abstract Syntax Tree (AST)-based Neural Network for source code representation,
aiming to push this technique to industrial practice. The proposed xASTNN has
three advantages. First, xASTNN is completely based on widely-used ASTs and
does not require complicated data pre-processing, making it applicable to
various programming languages and practical scenarios. Second, three
closely-related designs are proposed to guarantee the effectiveness of xASTNN,
including statement subtree sequence for code naturalness, gated recursive unit
for syntactical information, and gated recurrent unit for sequential
information. Third, a dynamic batching algorithm is introduced to significantly
reduce the time complexity of xASTNN. Two code comprehension downstream tasks,
code classification and code clone detection, are adopted for evaluation. The
results demonstrate that our xASTNN can improve the state-of-the-art while
being faster than the baselines.
- Abstract(参考訳): ソフトウェア工学におけるディープラーニング技術の応用がますます普及している。
問題のひとつは、コード関連タスクのための高品質で使いやすいソースコード表現を開発することだ。
近年,研究コミュニティは印象的な成果を得ている。
しかし、デプロイメントの困難とパフォーマンスのボトルネックのため、これらのアプローチが業界に適用されることはほとんどない。
本稿では,ソースコード表現のためのeXtreme Abstract Syntax Tree (AST)ベースのニューラルネットワークであるxASTNNについて述べる。
提案されているxASTNNには3つの利点がある。
まず、xASTNNは広く使われているASTを完全にベースとしており、複雑なデータ前処理を必要としないため、様々なプログラミング言語や実践シナリオに適用できる。
第2に,xastnnの有効性を保証するために,コード自然性のためのステートメントサブツリーシーケンス,構文情報のためのゲート再帰ユニット,シーケンシャル情報のためのゲート再帰ユニットという,3つの密接な関連設計が提案されている。
第3に、xASTNNの時間的複雑さを著しく低減するために動的バッチアルゴリズムを導入する。
2つのコード理解タスク、コード分類とコードクローン検出が評価に採用されている。
その結果、xASTNNはベースラインよりも高速で最先端の技術を向上できることがわかった。
関連論文リスト
- Abstract Syntax Tree for Programming Language Understanding and
Representation: How Far Are We? [23.52632194060246]
プログラミング言語の理解と表現(コード表現学習)は、ソフトウェア工学において常にホットで挑戦的なタスクである。
抽象構文木(AST)は、ソースコードの構文情報を表現し、コード表現学習で広く使われている。
コードトークンシーケンス(略してToken)ベースのコード表現とASTベースのコード表現でトレーニングされた3種類のコード関連タスクのパフォーマンスを比較した。
論文 参考訳(メタデータ) (2023-12-01T08:37:27Z) - Latent Space Representations of Neural Algorithmic Reasoners [15.920449080528536]
アルゴリズムの実行時にGNNによって誘導される潜伏空間の構造を詳細に解析する。
i) 分解能の喪失、(i) 類似した値の識別が困難、(ii) トレーニング中に観察された範囲外の値を扱うことができない、という2つの可能な障害モードを特定します。
これらの変更は、最先端のTriplet-GMPNNプロセッサを使用する場合、CLRS-30ベンチマークのアルゴリズムの大部分の改善につながることを示す。
論文 参考訳(メタデータ) (2023-07-17T22:09:12Z) - Compacting Binary Neural Networks by Sparse Kernel Selection [58.84313343190488]
本稿は,BNNにおけるバイナリカーネルの分散化がほぼ不可能であることを示すものである。
我々は、選択過程をエンドツーエンドに最適化するだけでなく、選択したコードワードの非反復的占有を維持できる置換ストレートスルー推定器(PSTE)を開発した。
実験により,提案手法はモデルサイズとビット幅の計算コストの両方を削減し,同等の予算下での最先端のBNNと比較して精度の向上を実現する。
論文 参考訳(メタデータ) (2023-03-25T13:53:02Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - Rate Coding or Direct Coding: Which One is Better for Accurate, Robust,
and Energy-efficient Spiking Neural Networks? [4.872468969809081]
スパイキングニューラルネットワーク(SNN)は画像分類タスクに重点を置いているため、画像を時間的バイナリスパイクに変換するための様々なコーディング技術が提案されている。
これらのうち、レートコーディングとダイレクトコーディングは、実用的なSNNシステムを構築するための候補として期待されている。
我々は3つの視点から2つの符号化を包括的に分析する。
論文 参考訳(メタデータ) (2022-01-31T16:18:07Z) - FATNN: Fast and Accurate Ternary Neural Networks [89.07796377047619]
Ternary Neural Networks (TNN) は、完全な精度のニューラルネットワークよりもはるかに高速で、電力効率が高いため、多くの注目を集めている。
そこで本研究では、3次内積の計算複雑性を2。
性能ギャップを軽減するために,実装に依存した3次量子化アルゴリズムを精巧に設計する。
論文 参考訳(メタデータ) (2020-08-12T04:26:18Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z) - Improved Code Summarization via a Graph Neural Network [96.03715569092523]
一般に、ソースコード要約技術はソースコードを入力として使用し、自然言語記述を出力する。
これらの要約を生成するために、ASTのデフォルト構造によくマッチするグラフベースのニューラルアーキテクチャを使用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:36:42Z) - Learning to Hash with Graph Neural Networks for Recommender Systems [103.82479899868191]
グラフ表現学習は、大規模に高品質な候補探索をサポートすることに多くの注目を集めている。
ユーザ・イテム相互作用ネットワークにおけるオブジェクトの埋め込みベクトルの学習の有効性にもかかわらず、連続的な埋め込み空間におけるユーザの好みを推測する計算コストは膨大である。
連続的かつ離散的なコードとを協調的に学習するための,単純かつ効果的な離散表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-04T06:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。