論文の概要: Exploiting Method Names to Improve Code Summarization: A Deliberation
Multi-Task Learning Approach
- arxiv url: http://arxiv.org/abs/2103.11448v1
- Date: Sun, 21 Mar 2021 17:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:40:58.190588
- Title: Exploiting Method Names to Improve Code Summarization: A Deliberation
Multi-Task Learning Approach
- Title(参考訳): コード要約を改善するためのメソッド名の利用: 検討的マルチタスク学習アプローチ
- Authors: Rui Xie, Wei Ye, Jinan Sun, Shikun Zhang
- Abstract要約: コード要約のための新しいマルチタスク学習(MTL)アプローチを設計する。
まず,メソッド名の生成と情報性予測のタスクを紹介する。
新たな2パス審議機構をmtlアーキテクチャに組み込んで、より一貫性のある中間状態を生成します。
- 参考スコア(独自算出の注目度): 5.577102440028882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code summaries are brief natural language descriptions of source code pieces.
The main purpose of code summarization is to assist developers in understanding
code and to reduce documentation workload. In this paper, we design a novel
multi-task learning (MTL) approach for code summarization through mining the
relationship between method code summaries and method names. More specifically,
since a method's name can be considered as a shorter version of its code
summary, we first introduce the tasks of generation and informativeness
prediction of method names as two auxiliary training objectives for code
summarization. A novel two-pass deliberation mechanism is then incorporated
into our MTL architecture to generate more consistent intermediate states fed
into a summary decoder, especially when informative method names do not exist.
To evaluate our deliberation MTL approach, we carried out a large-scale
experiment on two existing datasets for Java and Python. The experiment results
show that our technique can be easily applied to many state-of-the-art neural
models for code summarization and improve their performance. Meanwhile, our
approach shows significant superiority when generating summaries for methods
with non-informative names.
- Abstract(参考訳): コード要約は、ソースコードの簡単な自然言語記述である。
コード要約の主な目的は、コードを理解する開発者を支援し、ドキュメントのワークロードを減らすことである。
本稿では,メソッドコード要約とメソッド名の関係をマイニングすることで,コード要約のための新しいマルチタスク学習(mtl)手法を提案する。
より具体的には、メソッド名はコード要約のより短いバージョンと見なすことができるので、まず、コード要約のための2つの補助訓練対象として、メソッド名の生成および情報性予測のタスクを紹介する。
次に,MTLアーキテクチャに新たな2パス分割機構を組み込んで,特に情報的メソッド名が存在しない場合に,要約デコーダに供給されるより一貫した中間状態を生成する。
検討のMDLアプローチを評価するため,JavaとPythonの既存の2つのデータセットに対して大規模な実験を行った。
実験の結果,本手法は多くの最先端ニューラルモデルに容易に適用でき,コード要約と性能向上が期待できることがわかった。
一方,提案手法は,非インフォーマティブな名前を持つメソッドの要約を生成する場合,大きな優位性を示す。
関連論文リスト
- ESALE: Enhancing Code-Summary Alignment Learning for Source Code Summarization [21.886950861445122]
コード要約は、与えられたコードスニペットに対して簡潔な自然言語要約を自動的に生成することを目的としている。
本稿では,要約に焦点をあてたタスクに基づいて,コード要約を改善する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-01T03:06:51Z) - SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - Understanding Code Semantics: An Evaluation of Transformer Models in
Summarization [0.0]
関数と変数名を変更することで,コード要約の有効性を評価する。
3つのプログラミング言語にまたがってデッドコードやコメントコードのような敵を導入します。
論文 参考訳(メタデータ) (2023-10-25T02:41:50Z) - Soft-Labeled Contrastive Pre-training for Function-level Code
Representation [127.71430696347174]
textbfSoft-labeled contrastive pre-training framework with two positive sample construction method。
大規模コードコーパスにおけるコード間の関連性を考慮すると、ソフトラベル付きコントラスト付き事前学習は、きめ細かいソフトラベルを得ることができる。
SCodeRは、7つのデータセットで4つのコード関連タスクに対して、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T05:17:37Z) - An Extractive-and-Abstractive Framework for Source Code Summarization [28.553366270065656]
コード要約は、自然言語の形式で与えられたコードスニペットの要約/記事を自動的に生成することを目的としている。
そこで本研究では,人文的な要約を生成できる新しい抽出・抽象的枠組みを提案する。
論文 参考訳(メタデータ) (2022-06-15T02:14:24Z) - Enhancing Semantic Code Search with Multimodal Contrastive Learning and
Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。
我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-07T08:49:27Z) - CodeRetriever: Unimodal and Bimodal Contrastive Learning [128.06072658302165]
関数レベルのコードセマンティック表現を訓練するために,一様および二様のコントラスト学習を組み合わせたCodeRetrieverモデルを提案する。
ノンモーダルなコントラスト学習のために、文書と関数名に基づいてポジティブなコードペアを構築するためのセマンティックガイド付き手法を設計する。
バイモーダルなコントラスト学習では、コードのドキュメンテーションとインラインコメントを活用して、テキストコードペアを構築します。
論文 参考訳(メタデータ) (2022-01-26T10:54:30Z) - Leveraging Unsupervised Learning to Summarize APIs Discussed in Stack
Overflow [1.8047694351309207]
本稿では,Stack Overflowで議論されているAndroid APIメソッドを要約する手法を提案する。
提案手法では,APIメソッドの名称を入力として,そのAPIメソッドに関するStack Overflowの議論に基づいて,自然言語の要約を生成する。
我々は16人のAndroid開発者が自動生成された要約の品質を評価し、それらを公式のAndroidドキュメントと比較する調査を実施した。
論文 参考訳(メタデータ) (2021-11-27T18:49:51Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z) - Leveraging Code Generation to Improve Code Retrieval and Summarization
via Dual Learning [18.354352985591305]
コード要約は、ソースコードスニペットが与えられた短い自然言語記述を生成し、コード検索は、自然言語クエリが与えられた関連するソースコードを取得する。
最近の研究は、これらの2つのタスクを組み合わせてパフォーマンスを改善している。
本稿では,新たなコード生成タスクを導入することによって,2つのタスクのエンド・ツー・エンド・モデルを提案する。
論文 参考訳(メタデータ) (2020-02-24T12:26:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。