論文の概要: Mining Program Properties From Neural Networks Trained on Source Code
Embeddings
- arxiv url: http://arxiv.org/abs/2103.05442v1
- Date: Tue, 9 Mar 2021 14:25:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-08 16:00:23.370107
- Title: Mining Program Properties From Neural Networks Trained on Source Code
Embeddings
- Title(参考訳): ソースコード埋め込みに基づくニューラルネットワークからのプログラム特性のマイニング
- Authors: Martina Saletta, Claudio Ferretti
- Abstract要約: 本稿では、ソースコードに基づいて訓練されたディープニューラルネットワークの内部動作を分析して、異なるプログラム特徴をマイニングするための新しいアプローチを提案する。
プログラムの埋め込みごとにオートエンコーダを訓練し、異なるプログラム機能のための内部表現を自律的に構築する内部ニューロンの出現能力をテストする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel approach for mining different program
features by analysing the internal behaviour of a deep neural network trained
on source code. Using an unlabelled dataset of Java programs and three
different embedding strategies for the methods in the dataset, we train an
autoencoder for each program embedding and then we test the emerging ability of
the internal neurons in autonomously building internal representations for
different program features. We defined three binary classification labelling
policies inspired by real programming issues, so to test the performance of
each neuron in classifying programs accordingly to these classification rules,
showing that some neurons can actually detect different program properties. We
also analyse how the program representation chosen as input affects the
performance on the aforementioned tasks. On the other hand, we are interested
in finding the overall most informative neurons in the network regardless of a
given task. To this aim, we propose and evaluate two methods for ranking
neurons independently of any property. Finally, we discuss how these ideas can
be applied in different settings for simplifying the programmers' work, for
instance if included in environments such as software repositories or code
editors.
- Abstract(参考訳): 本稿では,ソースコード上で訓練された深層ニューラルネットワークの内部挙動を解析し,異なるプログラム特徴をマイニングするための新しい手法を提案する。
Javaプログラムの非ラベルデータセットとデータセット内のメソッドに対する3つの異なる埋め込み戦略を用いて、各プログラムの埋め込み毎にオートエンコーダをトレーニングし、異なるプログラム機能のための内部表現を自律的に構築する上で、内部ニューロンの出現する能力をテストする。
実際のプログラム問題に触発された3つのバイナリ分類ラベリングポリシーを定義し、これらの分類規則に従って各ニューロンのパフォーマンスを分類し、いくつかのニューロンが実際に異なるプログラム特性を検出できることを示す。
また、入力として選択したプログラム表現が、上記のタスクのパフォーマンスにどのように影響するかを分析する。
一方で、特定のタスクに関係なく、ネットワーク内の最も有益なニューロンを見つけることにも関心があります。
そこで本研究では,ニューロンのランク付けを行う2つの手法を提案し,評価する。
最後に,ソフトウェアリポジトリやコードエディタなどの環境に含まれる場合など,プログラマの作業を単純化するために,これらのアイデアをさまざまな設定で適用する方法について論じる。
関連論文リスト
- Conditional computation in neural networks: principles and research trends [48.14569369912931]
本稿では,ニューラルネットワークの設計にテクトコンディショナリ計算を適用するという,新たな領域の原理とアイデアを要約する。
特に、入力に条件付きで計算グラフの一部を動的に活性化または非活性化するニューラルネットワークに焦点を当てる。
論文 参考訳(メタデータ) (2024-03-12T11:56:38Z) - Redundancy and Concept Analysis for Code-trained Language Models [5.726842555987591]
コード学習言語モデルは、様々なコードインテリジェンスタスクに非常に効果的であることが証明されている。
計算ボトルネックとメモリ制約のため、多くのソフトウェアエンジニアリングアプリケーションのトレーニングとデプロイが難しい場合がある。
我々は,ソースコードモデルに対する最初のニューロンレベルの解析を行い,潜在表現内でのテクスチエントニューロンの同定を行う。
論文 参考訳(メタデータ) (2023-05-01T15:22:41Z) - Neuroevolutionary algorithms driven by neuron coverage metrics for
semi-supervised classification [60.60571130467197]
一部の機械学習アプリケーションでは、ラベル付けされていないインスタンスが豊富であるのに対して、教師付き分類のためのラベル付きインスタンスの可用性は制限されている。
本稿では、ニューラルネットワークアーキテクチャ上で計算されたニューラルネットワークカバレッジメトリクスを用いて、未ラベルのインスタンスを利用する神経進化的アプローチを提案する。
論文 参考訳(メタデータ) (2023-03-05T23:38:44Z) - Permutation Equivariant Neural Functionals [92.0667671999604]
この研究は、他のニューラルネットワークの重みや勾配を処理できるニューラルネットワークの設計を研究する。
隠れた層状ニューロンには固有の順序がないため, 深いフィードフォワードネットワークの重みに生じる置換対称性に着目する。
実験の結果, 置換同変ニューラル関数は多種多様なタスクに対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-02-27T18:52:38Z) - Learning Program Semantics with Code Representations: An Empirical Study [22.953964699210296]
プログラムセマンティクスの学習は、様々なコード知的なタスクの中核であり、基礎である。
現在の主流のコード表現テクニックを4つのカテゴリに分類する。
我々は,3つの多様で一般的なコード知能タスクにおいて,その性能を評価する。
論文 参考訳(メタデータ) (2022-03-22T14:51:44Z) - Action in Mind: A Neural Network Approach to Action Recognition and
Segmentation [0.0]
本稿では,ニューラルネットワークに基づく多層アーキテクチャの異なる実装によるヒューマンアクション認識のための新しい計算手法を提案する。
提案する行動認識アーキテクチャは,前処理層,順序ベクトル表現層,ニューラルネットワークの3層を含む複数の処理層から構成される。
開発の各段階において、システムは連続する3d体姿勢からなる入力データで訓練され、システムがこれまで経験したことのない一般的な入力データでテストされる。
論文 参考訳(メタデータ) (2021-04-30T09:53:28Z) - Training Binary Neural Networks through Learning with Noisy Supervision [76.26677550127656]
本稿では,ニューラルネットワーク上の二項化操作を学習の観点から定式化する。
ベンチマークデータセットの実験結果から,提案手法がベースラインよりも一貫した改善を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-10-10T01:59:39Z) - Neurocoder: Learning General-Purpose Computation Using Stored Neural
Programs [64.56890245622822]
ニューロコーダ(Neurocoder)は、汎用計算機の全く新しいクラスである。
共有可能なモジュール型プログラムのセットから関連するプログラムを構成することで、データ応答性のある方法で“コード”を行う。
モジュールプログラムを学習し、パターンシフトを厳しく処理し、新しいプログラムが学習されると、古いプログラムを記憶する新しい能力を示す。
論文 参考訳(メタデータ) (2020-09-24T01:39:16Z) - On the Generalizability of Neural Program Models with respect to
Semantic-Preserving Program Transformations [25.96895574298886]
意味保存変換に対するニューラルプログラムモデルの一般化性を評価する。
コードには3つの異なるサイズのJavaデータセットと3つの最先端ニューラルネットワークモデルを使用します。
本結果は,抽象構文木のみに基づくニューラルプログラムモデルよりも,プログラム内のデータおよび制御依存性に基づくニューラルプログラムモデルの方が一般化可能であることを示唆している。
論文 参考訳(メタデータ) (2020-07-31T20:39:20Z) - Non-linear Neurons with Human-like Apical Dendrite Activations [81.18416067005538]
XOR論理関数を100%精度で学習し, 標準的なニューロンに後続のアピーカルデンドライト活性化(ADA)が認められた。
コンピュータビジョン,信号処理,自然言語処理の6つのベンチマークデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-02-02T21:09:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。