論文の概要: API2Com: On the Improvement of Automatically Generated Code Comments
Using API Documentations
- arxiv url: http://arxiv.org/abs/2103.10668v1
- Date: Fri, 19 Mar 2021 07:29:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:40:27.213570
- Title: API2Com: On the Improvement of Automatically Generated Code Comments
Using API Documentations
- Title(参考訳): API2Com: APIドキュメンテーションを使ったコードコメントの自動生成の改善について
- Authors: Ramin Shahbazi, Rishab Sharma, Fatemeh H. Fard
- Abstract要約: コメント生成の知識リソースとしてAPI Docs(Application Programming Interface Documentations)を利用するモデルであるAPI2Comを提案する。
このモデルを130,000以上のメソッドからなる大規模なJavaデータセットに適用し,TransformerとRNNベースのアーキテクチャを用いて評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code comments can help in program comprehension and are considered as
important artifacts to help developers in software maintenance. However, the
comments are mostly missing or are outdated, specially in complex software
projects. As a result, several automatic comment generation models are
developed as a solution. The recent models explore the integration of external
knowledge resources such as Unified Modeling Language class diagrams to improve
the generated comments. In this paper, we propose API2Com, a model that
leverages the Application Programming Interface Documentations (API Docs) as a
knowledge resource for comment generation. The API Docs include the description
of the methods in more details and therefore, can provide better context in the
generated comments. The API Docs are used along with the code snippets and
Abstract Syntax Trees in our model. We apply the model on a large Java dataset
of over 130,000 methods and evaluate it using both Transformer and RNN-base
architectures. Interestingly, when API Docs are used, the performance increase
is negligible. We therefore run different experiments to reason about the
results. For methods that only contain one API, adding API Docs improves the
results by 4% BLEU score on average (BLEU score is an automatic evaluation
metric used in machine translation). However, as the number of APIs that are
used in a method increases, the performance of the model in generating comments
decreases due to long documentations used in the input. Our results confirm
that the API Docs can be useful in generating better comments, but, new
techniques are required to identify the most informative ones in a method
rather than using all documentations simultaneously.
- Abstract(参考訳): コードコメントはプログラム理解に役立ち、開発者のソフトウェアメンテナンスを助ける重要なアーティファクトとみなされる。
しかし、特に複雑なソフトウェアプロジェクトでは、コメントが欠落しているか、時代遅れになっている。
その結果,いくつかの自動コメント生成モデルが開発されている。
最近のモデルは、生成したコメントを改善するために、統一モデリング言語クラス図のような外部知識リソースの統合を調査します。
本稿では、コメント生成のための知識リソースとして、API Docs(Application Programming Interface Documentations)を利用するモデルであるAPI2Comを提案する。
API Docsにはメソッドの詳細な記述が含まれているので、生成されたコメントでより良いコンテキストを提供できる。
API Docsは、私たちのモデルのコードスニペットと抽象構文木と一緒に使用されます。
このモデルを130,000以上のメソッドからなる大規模なJavaデータセットに適用し,TransformerとRNNベースのアーキテクチャを用いて評価する。
興味深いことに、API Docsを使用する場合、パフォーマンスの上昇は無視できる。
そのため、異なる実験を行い、その結果を推論する。
1つのapiのみを含むメソッドでは、apiドキュメントを追加することで、平均でbleuスコアが4%向上する(bleuスコアは機械翻訳で使われる自動評価指標である)。
しかし、メソッドで使用されるAPIの数が増えるにつれて、入力で使用される長いドキュメントによって、コメント生成時のモデルの性能が低下する。
その結果、apiドキュメントはより良いコメントを生成するのに役立ちます。しかし、すべてのドキュメントを同時に使用するのではなく、メソッド内で最も有意義なコメントを識別するための新しいテクニックが必要です。
関連論文リスト
- FANTAstic SEquences and Where to Find Them: Faithful and Efficient API Call Generation through State-tracked Constrained Decoding and Reranking [57.53742155914176]
APIコール生成は、大規模言語モデルのツール使用能力の基盤となっている。
既存の教師付きおよびコンテキスト内学習アプローチは、高いトレーニングコスト、低いデータ効率、APIドキュメントとユーザの要求に反する生成APIコールに悩まされる。
本稿では,これらの制約に対処するため,FANTASEと呼ばれる出力側最適化手法を提案する。
論文 参考訳(メタデータ) (2024-07-18T23:44:02Z) - A Solution-based LLM API-using Methodology for Academic Information Seeking [49.096714812902576]
SoAyは学術情報検索のためのソリューションベースのLLM API利用方法論である。
ソリューションが事前に構築されたAPI呼び出しシーケンスである場合、推論メソッドとしてソリューションを備えたコードを使用する。
その結果、最先端のLLM APIベースのベースラインと比較して34.58-75.99%のパフォーマンス改善が見られた。
論文 参考訳(メタデータ) (2024-05-24T02:44:14Z) - Leveraging Deep Learning for Abstractive Code Summarization of
Unofficial Documentation [1.1816942730023887]
本稿では,StackOverflowで議論されているAPIの要約を生成するために,BARTアルゴリズムを用いた自動アプローチを提案する。
ROUGEとBLEUのメトリクスを用いて,人間生成サマリーのオラクルを構築し,それに対するアプローチを評価した。
その結果, ディープラーニングアルゴリズムを用いることで, 要約の質が向上し, 精度が平均で57パーセント向上することが示唆された。
論文 参考訳(メタデータ) (2023-10-23T15:10:37Z) - APICom: Automatic API Completion via Prompt Learning and Adversarial
Training-based Data Augmentation [6.029137544885093]
APIレコメンデーションは、開発者が多数の候補APIの中で必要なAPIを見つけるのを支援するプロセスである。
これまでの研究では、主にAPIレコメンデーションをレコメンデーションタスクとしてモデル化していた。
ニューラルネットワーク翻訳研究領域に動機づけられたこの問題を生成タスクとしてモデル化することができる。
提案手法は,プロンプト学習に基づく新しいアプローチAPIComを提案し,そのプロンプトに応じてクエリに関連するAPIを生成する。
論文 参考訳(メタデータ) (2023-09-13T15:31:50Z) - Private-Library-Oriented Code Generation with Large Language Models [52.73999698194344]
本稿では,大規模言語モデル(LLM)をプライベートライブラリのコード生成に活用することに焦点を当てる。
プログラマがプライベートコードを書く過程をエミュレートする新しいフレームワークを提案する。
TorchDataEval、TorchDataComplexEval、MonkeyEval、BeatNumEvalの4つのプライベートライブラリベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-07-28T07:43:13Z) - Evaluating Embedding APIs for Information Retrieval [51.24236853841468]
ドメインの一般化と多言語検索における既存のセマンティック埋め込みAPIの機能を評価する。
BM25の結果をAPIを使って再ランク付けすることは、予算に優しいアプローチであり、英語でもっとも効果的である。
非英語検索では、再ランク付けは結果を改善するが、BM25のハイブリッドモデルは高いコストで機能する。
論文 参考訳(メタデータ) (2023-05-10T16:40:52Z) - APIContext2Com: Code Comment Generation by Incorporating Pre-Defined API
Documentation [0.0]
我々は、異なる複数のエンコーダのセットを持つセック-2-seqエンコーダ-デコーダニューラルネットワークモデルを導入し、異なる入力をターゲットコメントに変換する。
ランク付け機構も開発され,非形式的なAPIを除外して,CodeSearchNetからJavaデータセットを使用してアプローチを評価することができる。
論文 参考訳(メタデータ) (2023-03-03T00:38:01Z) - Binding Language Models in Symbolic Languages [146.3027328556881]
Binderはトレーニング不要のニューラルシンボリックフレームワークで、タスク入力をプログラムにマッピングする。
解析の段階では、Codexは元のプログラミング言語では答えられないタスク入力の一部を特定することができる。
実行段階では、CodexはAPI呼び出しで適切なプロンプトを与えられた万能機能を実行することができる。
論文 参考訳(メタデータ) (2022-10-06T12:55:17Z) - DocCoder: Generating Code by Retrieving and Reading Docs [87.88474546826913]
コードマニュアルとドキュメントを明示的に活用するアプローチであるDocCoderを紹介します。
我々のアプローチは一般的に、どんなプログラミング言語にも適用でき、基礎となるニューラルモデルとは無関係です。
論文 参考訳(メタデータ) (2022-07-13T06:47:51Z) - On the Effectiveness of Pretrained Models for API Learning [8.788509467038743]
開発者は、Excelファイルのパース、行ごとのテキストファイルの読み書きなど、特定の機能を実装するためにAPIを使うことが多い。
開発者は、より高速でクリーンな方法でアプリケーションを構築するために、自然言語クエリに基づいた自動API使用シーケンス生成の恩恵を受けることができる。
既存のアプローチでは、クエリが与えられたAPIシーケンスの検索や、RNNベースのエンコーダデコーダを使用してAPIシーケンスを生成するために、情報検索モデルを使用している。
論文 参考訳(メタデータ) (2022-04-05T20:33:24Z) - Holistic Combination of Structural and Textual Code Information for
Context based API Recommendation [28.74546332681778]
APIRec-CST (API Recommendation by Combining Structure and Textual code information) と呼ばれる新しいAPIレコメンデーション手法を提案する。
APIRec-CSTは、API Graph NetworkとCode Token Networkをベースにしたソースコードのテキスト情報とAPI使用率を組み合わせたディープラーニングモデルである。
我々は,この手法が60.3%,81.5%,87.7%,69.4%の上位5,上位10の精度,MRRを達成し,既存のグラフベースの統計手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2020-10-15T04:40:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。