論文の概要: Context-Encoded Code Change Representation for Automated Commit Message
Generation
- arxiv url: http://arxiv.org/abs/2306.14418v1
- Date: Mon, 26 Jun 2023 04:48:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 18:54:26.667561
- Title: Context-Encoded Code Change Representation for Automated Commit Message
Generation
- Title(参考訳): 自動コミットメッセージ生成のための文脈符号化コード変更表現
- Authors: Thanh Trong Vu, Thanh-Dat Do, and Hieu Dinh Vo
- Abstract要約: 本稿では,変化したコードと変化しないコードを組み合わせることで,コード変更を表現する手法を提案する。
これは現在の表現の限界を克服し、最先端のコミットメッセージ生成メソッドの5/6のパフォーマンスを改善している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Changes in source code are an inevitable part of software development. They
are the results of indispensable activities such as fixing bugs or improving
functionality. Descriptions for code changes (commit messages) help people
better understand the changes. However, due to a lack of motivation and time
pressure, writing high-quality commit messages remains reluctantly considered.
Several methods have been proposed with the aim of automated commit message
generation.
However, the existing methods are still limited because they only utilise
either the changed code or the changed code combined with surrounding
statements.
This paper proposes a method to represent code changes by combining the
changed code and the unchanged code which have program dependence on the
changed code. This method overcomes the limitations of current representations
while improving the performance of 5/6 of state-of-the-art commit message
generation methods by up to 15% in METEOR, 14% in ROUGE-L, and 10% in BLEU-4.
- Abstract(参考訳): ソースコードの変更は避けられないソフトウェア開発の一部です。
それらは、バグの修正や機能の改善など、不可欠なアクティビティの結果です。
コード変更(コミットメッセージ)の説明は、変更をより理解するのに役立ちます。
しかし、モチベーションの欠如と時間的プレッシャーのため、高品質なコミットメッセージの記述はいささか検討されている。
コミットメッセージの自動生成を目的としたいくつかの手法が提案されている。
しかし、既存のメソッドは変更コードか変更コードと周囲のステートメントを組み合わせてのみ利用するため、まだ制限されている。
本稿では,変更したコードと変更したコードにプログラム依存した変更コードを組み合わせることで,コード変更を表現する手法を提案する。
この手法は,5/6の最先端コミットメッセージ生成手法の性能をMETEORで最大15%,ROUGE-Lで14%,BLEU-4で10%向上させながら,現在の表現の限界を克服する。
関連論文リスト
- Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - ChangeGuard: Validating Code Changes via Pairwise Learning-Guided Execution [16.130469984234956]
ChangeGuardは、学習誘導型実行を使用して、修正された関数の実行動作を比較するアプローチである。
提案手法は,77.1%の精度で,69.5%のリコールで意味的変化を識別する。
論文 参考訳(メタデータ) (2024-10-21T15:13:32Z) - CodeUpdateArena: Benchmarking Knowledge Editing on API Updates [77.81663273436375]
コードドメインの知識編集のためのベンチマークであるCodeUpdateArenaを提示する。
私たちのベンチマークのインスタンスは、プログラム合成例と組み合わせた合成API関数のアップデートで構成されています。
ベンチマークでは、7つのPythonパッケージから54の関数へ、さまざまなタイプの更新をカバーしています。
論文 参考訳(メタデータ) (2024-07-08T17:55:04Z) - Coeditor: Leveraging Contextual Changes for Multi-round Code Auto-editing [57.776971051512234]
本研究では,複数ラウンドのコードの自動編集設定について検討し,その内部の最近の変更に基づいて,コード領域への編集を予測することを目的とした。
我々のモデルであるCoeditorは、コード編集タスクに特化して設計された微調整言語モデルである。
単純化されたシングルラウンドのシングル編集タスクでは、Coeditor は GPT-3.5 と SOTA のオープンソースコード補完モデルを大幅に上回っている。
論文 参考訳(メタデータ) (2023-05-29T19:57:36Z) - CCRep: Learning Code Change Representations via Pre-Trained Code Model
and Query Back [8.721077261941236]
この研究は、CCRepという新しいコード変更表現学習手法を提案する。
CCRepは、さまざまな下流タスクのための機能ベクトルとして、コード変更をエンコードすることを学ぶ。
CCRepをコミットメッセージ生成、パッチの正当性評価、ジャスト・イン・タイム欠陥予測の3つのタスクに適用する。
論文 参考訳(メタデータ) (2023-02-08T07:43:55Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - Jointly Learning to Repair Code and Generate Commit Message [78.4177637346384]
バグの多いコード、固定コード、新しいタスクのコミットメッセージを含む多言語3重データセットを構築した。
カスケード方式の誤り伝搬問題に対処するため,コード修復とコミットメッセージ生成の両立が可能なジョイントモデルを提案する。
実験結果から,教師学習法とマルチタスク学習法を併用した拡張カスケードモデルにより,自動コード修復のメトリクスの最良のスコアが得られた。
論文 参考訳(メタデータ) (2021-09-25T07:08:28Z) - Unsupervised Learning of General-Purpose Embeddings for Code Changes [6.652641137999891]
事前学習中にコード変更の埋め込みを得る手法を提案する。
コードの変更とコミットメッセージ生成という、2つの異なる下流タスクでそれらを評価します。
本モデルでは,完全編集シーケンスを用いたモデルの精度を5.9ポイント向上させる。
論文 参考訳(メタデータ) (2021-06-03T19:08:53Z) - CommitBERT: Commit Message Generation Using Pre-Trained Programming
Language Model [0.38073142980733]
コミットメッセージ(Commit message)は、自然言語でソースコードの変更を要約する文書である。
我々はコミットメッセージを自動的に書き込むモデルを開発する。
コード修正とコミットメッセージからなる345Kデータセットを6つのプログラミング言語でリリースします。
論文 参考訳(メタデータ) (2021-05-29T07:48:28Z) - CoreGen: Contextualized Code Representation Learning for Commit Message
Generation [39.383390029545865]
コミットメッセージ生成(CoreGen)のためのコンテキスト適応型コード表現学習戦略を提案する。
ベンチマークデータセットの実験では、BLEU-4スコアの少なくとも28.18%の改善により、ベースラインモデルよりもモデルの有効性が向上した。
論文 参考訳(メタデータ) (2020-07-14T09:43:26Z) - Contrastive Code Representation Learning [95.86686147053958]
一般的な再構成に基づくBERTモデルは,ソースコードの編集に敏感であることを示す。
コントラコード(ContraCode)は、コード機能を学ぶのにフォームではなく、コントラスト的な事前学習タスクである。
論文 参考訳(メタデータ) (2020-07-09T17:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。