論文の概要: TAG : Type Auxiliary Guiding for Code Comment Generation
- arxiv url: http://arxiv.org/abs/2005.02835v1
- Date: Wed, 6 May 2020 14:04:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 05:33:11.584818
- Title: TAG : Type Auxiliary Guiding for Code Comment Generation
- Title(参考訳): TAG : コードコメント生成のための型補助ガイド
- Authors: Ruichu Cai, Zhihao Liang, Boyan Xu, Zijian Li, Yuexing Hao and Yao
Chen
- Abstract要約: コードコメント生成タスクのためのType Auxiliary Guiding-Decoderフレームワークを提案する。
我々のフレームワークは、ソースコードの適応的な要約を可能にするType-associated encoderとType-restricted Decoderを備えている。
- 参考スコア(独自算出の注目度): 19.823407401313222
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing leading code comment generation approaches with the
structure-to-sequence framework ignores the type information of the
interpretation of the code, e.g., operator, string, etc. However, introducing
the type information into the existing framework is non-trivial due to the
hierarchical dependence among the type information. In order to address the
issues above, we propose a Type Auxiliary Guiding encoder-decoder framework for
the code comment generation task which considers the source code as an N-ary
tree with type information associated with each node. Specifically, our
framework is featured with a Type-associated Encoder and a Type-restricted
Decoder which enables adaptive summarization of the source code. We further
propose a hierarchical reinforcement learning method to resolve the training
difficulties of our proposed framework. Extensive evaluations demonstrate the
state-of-the-art performance of our framework with both the auto-evaluated
metrics and case studies.
- Abstract(参考訳): 既存の主要なコードコメント生成アプローチ structure-to-sequence frameworkは、例えば演算子、文字列など、コードの解釈の型情報を無視している。
しかし、既存のフレームワークに型情報を導入するのは、型情報間の階層的依存のため自明ではない。
上記の問題に対処するために、ソースコードをn-ary木として、各ノードに関連付けられた型情報を持つコードコメント生成タスク用の型補助型ガイドエンコーダ-デコーダフレームワークを提案する。
具体的には、ソースコードの適応的な要約を可能にするType-associated EncoderとType-restricted Decoderを特徴とする。
さらに,提案フレームワークの学習困難を解消するための階層的強化学習手法を提案する。
大規模評価は、自動評価指標とケーススタディの両方を用いて、我々のフレームワークの最先端性能を示す。
関連論文リスト
- EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.112790050749695]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。
EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-20T06:21:56Z) - A Novel ICD Coding Method Based on Associated and Hierarchical Code Description Distillation [6.524062529847299]
ICD符号化は、ノイズの多い医療文書入力による多ラベルテキスト分類の問題である。
近年のICD符号化の進歩により、医療用ノートやコードに付加的なデータや知識ベースを組み込むことで、性能が向上した。
コード表現学習の改善と不適切なコード代入の回避を目的とした,関連および階層型コード記述蒸留(AHDD)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T07:26:23Z) - Comments as Natural Logic Pivots: Improve Code Generation via Comment Perspective [85.48043537327258]
本稿では, MANGO (comMents As Natural loGic pivOts) を提案する。
その結果、MANGOは強いベースラインに基づいてコードパス率を大幅に改善することがわかった。
論理的なコメントの復号化戦略の堅牢性は、考えの連鎖よりも顕著に高い。
論文 参考訳(メタデータ) (2024-04-11T08:30:46Z) - Improving Code Search with Hard Negative Sampling Based on Fine-tuning [15.341959871682981]
本稿では,クエリとコードの結合を共同で符号化するコード検索のためのクロスエンコーダアーキテクチャを提案する。
また、両エンコーダとクロスエンコーダをカスケードしたRetriever-Ranker(RR)フレームワークを導入し、評価とオンラインサービスの有効性を高める。
論文 参考訳(メタデータ) (2023-05-08T07:04:28Z) - Outline, Then Details: Syntactically Guided Coarse-To-Fine Code
Generation [61.50286000143233]
ChainCoderは、Pythonコードを段階的に生成するプログラム合成言語モデルである。
自然言語記述と構文的に整合したI/Oデータサンプルを共同で符号化するために、カスタマイズされたトランスフォーマーアーキテクチャを利用する。
論文 参考訳(メタデータ) (2023-04-28T01:47:09Z) - CodeExp: Explanatory Code Document Generation [94.43677536210465]
既存のコード・トゥ・テキスト生成モデルは、コードの高レベルな要約のみを生成する。
我々は、コードのための高品質な説明記述の基準を特定するために、人間の研究を行う。
タスクのための多段階微調整戦略とベースラインモデルを提案する。
論文 参考訳(メタデータ) (2022-11-25T18:05:44Z) - UniXcoder: Unified Cross-Modal Pre-training for Code Representation [65.6846553962117]
プログラミング言語のためのクロスモーダル事前学習モデルUniXcoderを提案する。
木の構造情報を全て保持するシーケンス構造でASTを変換する1対1のマッピング手法を提案する。
我々は,UniXcoderを9つのデータセット上で5つのコード関連タスクで評価する。
論文 参考訳(メタデータ) (2022-03-08T04:48:07Z) - Learning to Generate Code Comments from Class Hierarchies [38.72453574235588]
我々は、このタスクの実行に必要な一意な文脈的および言語的推論に対応する新しい枠組みを定式化する。
提案手法は,(1)クラス階層からコンテキストを取り入れること,(2)学習された潜在表現を条件付けして,オーバーライド手法のより特殊な振る舞いを捉えたコメントを生成すること,(3)オーバーライド法に対応するコメントの不変特性に適合しない予測を抑止する自意識訓練を特徴とする。
論文 参考訳(メタデータ) (2021-03-24T18:12:52Z) - Retrieve and Refine: Exemplar-based Neural Comment Generation [27.90756259321855]
同様のコードスニペットのコメントはコメントの生成に役立ちます。
我々は、与えられたコード、AST、類似したコード、そして入力として見劣りする新しいセク2seqニューラルネットワークを設計する。
約200万のサンプルを含む大規模Javaコーパスに対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-10-09T09:33:10Z) - Knowledge-enriched, Type-constrained and Grammar-guided Question
Generation over Knowledge Bases [20.412744079015475]
知識ベース上の質問生成(KBQG)は、サブグラフに関する自然言語の質問を生成することを目的としている。
現在のエンコーダデコーダベースの手法、特に小さなサブグラフでは、大きな課題が2つ残っている。
我々は、KTGという、知識に富んだ、型に制約のある、文法に制約のあるKBQGモデルを提案する。
論文 参考訳(メタデータ) (2020-10-07T04:49:48Z) - GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。
これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。
コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文 参考訳(メタデータ) (2020-09-17T15:25:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。