論文の概要: Brevity is the Soul of Wit: Condensing Code Changes to Improve Commit Message Generation
- arxiv url: http://arxiv.org/abs/2509.15567v1
- Date: Fri, 19 Sep 2025 04:04:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.98601
- Title: Brevity is the Soul of Wit: Condensing Code Changes to Improve Commit Message Generation
- Title(参考訳): BrevityはWitの魂 - コード変更を凝縮してコミットメッセージ生成を改善する
- Authors: Hongyu Kuang, Ning Zhang, Hui Gao, Xin Zhou, Wesley K. G. Assunção, Xiaoxing Ma, Dong Shao, Guoping Rong, He Zhang,
- Abstract要約: 生成前にコード変更を凝縮する方法を提案する。
最初に、ChangeScribeというツールの助けを借りて提案したテンプレートを使って、コードの変更をコンデンスします。
我々の手法はBLEU-Norm, METEOR, ROUGE-Lの6つのベースラインより優れている。
- 参考スコア(独自算出の注目度): 21.625755841132733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Commit messages are valuable resources for describing why code changes are committed to repositories in version control systems (e.g., Git). They effectively help developers understand code changes and better perform software maintenance tasks. Unfortunately, developers often neglect to write high-quality commit messages in practice. Therefore, a growing body of work is proposed to generate commit messages automatically. These works all demonstrated that how to organize and represent code changes is vital in generating good commit messages, including the use of fine-grained graphs or embeddings to better represent code changes. In this study, we choose an alternative way to condense code changes before generation, i.e., proposing brief yet concise text templates consisting of the following three parts: (1) summarized code changes, (2) elicited comments, and (3) emphasized code identifiers. Specifically, we first condense code changes by using our proposed templates with the help of a heuristic-based tool named ChangeScribe, and then fine-tune CodeLlama-7B on the pairs of our proposed templates and corresponding commit messages. Our proposed templates better utilize pre-trained language models, while being naturally brief and readable to complement generated commit messages for developers. Our evaluation based on a widely used dataset showed that our approach can outperform six baselines in terms of BLEU-Norm, METEOR, and ROUGE-L, with average improvements of 51.7%, 78.7%, and 62.5%, respectively. The ablation study and human evaluation also provide further insights into the effectiveness of our approach.
- Abstract(参考訳): コミットメッセージは、なぜコード変更がバージョン管理システム(Gitなど)のリポジトリにコミットされるのかを説明するための貴重なリソースである。
コードの変更を理解し、ソフトウェアメンテナンスのタスクをより良くするのに役立つ。
残念なことに、開発者は実際に高品質なコミットメッセージを書くことを無視することが多い。
そのため、コミットメッセージを自動生成する作業の増大が提案されている。
これらの作業はすべて、コード変更をよりよく表現するためにきめ細かいグラフや埋め込みなど、優れたコミットメッセージを生成する上で、コード変更の組織化と表現の方法が不可欠であることを実証しました。
本研究では,(1)要約されたコード変更,(2)引用されたコメント,(3)強調されたコード識別子の3つの部分からなる簡潔で簡潔なテキストテンプレートを提案する。
具体的には、提案したテンプレートとそれに対応するコミットメッセージのペアに、ChangeScribeというヒューリスティックなツールを使用して、コード変更を行いました。
提案するテンプレートでは,事前訓練済みの言語モデルを,開発者が生成したコミットメッセージを補完するために,自然に簡潔で読みやすいものにしています。
提案手法は, BLEU-Norm, METEOR, ROUGE-Lの6つのベースラインを上回り, 平均改善率51.7%, 78.7%, 62.5%となっている。
アブレーション研究と人的評価は、我々のアプローチの有効性に関するさらなる洞察を与えてくれる。
関連論文リスト
- Contextual Code Retrieval for Commit Message Generation: A Preliminary Study [18.46986692375691]
コミットメッセージはコミットの主要なコード変更を記述し、ソフトウェアメンテナンスにおいて重要な役割を果たす。
既存のコミットメッセージ生成アプローチでは、コード差分を入力し、短い記述文を出力として生成する、直接マッピングとしてフレーム化するのが一般的である。
原コード差分は、高品質なコミットメッセージを生成するのに必要な完全なコンテキストをキャプチャできないため、コード差分のみに依存することは不十分である、と私たちは主張する。
論文 参考訳(メタデータ) (2025-07-23T16:54:57Z) - Commit Messages in the Age of Large Language Models [0.9217021281095906]
コード変更に基づいてコミットメッセージを生成するOpenAIのChatGPTの性能を評価する。
本稿では、ChatGPTを用いて得られた結果と、コミットデータに特化して訓練された以前の自動コミットメッセージ生成手法を比較した。
論文 参考訳(メタデータ) (2024-01-31T06:47:12Z) - From Commit Message Generation to History-Aware Commit Message
Completion [49.175498083165884]
コミットメッセージ生成からコミットメッセージ補完に焦点を移すことができれば、結果のコミットメッセージの品質と個人的な性質を大幅に改善できる、と私たちは論じています。
既存のデータセットには履歴データがないため、20のプログラミング言語で107万のコミットを含むCommitChronicleと呼ばれる新しいデータセットを収集、共有しています。
以上の結果から,コミットメッセージ補完は生成よりも優れた結果を示し,一般的にはGPT-3.5-turboはより悪い性能を示すが,長大かつ詳細なメッセージの可能性を示唆している。
論文 参考訳(メタデータ) (2023-08-15T09:10:49Z) - Context-Encoded Code Change Representation for Automated Commit Message
Generation [0.0]
本稿では,変化したコードと変化しないコードを組み合わせることで,コード変更を表現する手法を提案する。
これは現在の表現の限界を克服し、最先端のコミットメッセージ生成メソッドの5/6のパフォーマンスを改善している。
論文 参考訳(メタデータ) (2023-06-26T04:48:14Z) - Coeditor: Leveraging Contextual Changes for Multi-round Code Auto-editing [57.776971051512234]
本研究では,複数ラウンドのコードの自動編集設定について検討し,その内部の最近の変更に基づいて,コード領域への編集を予測することを目的とした。
我々のモデルであるCoeditorは、コード編集タスクに特化して設計された微調整言語モデルである。
単純化されたシングルラウンドのシングル編集タスクでは、Coeditor は GPT-3.5 と SOTA のオープンソースコード補完モデルを大幅に上回っている。
論文 参考訳(メタデータ) (2023-05-29T19:57:36Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - Jointly Learning to Repair Code and Generate Commit Message [78.4177637346384]
バグの多いコード、固定コード、新しいタスクのコミットメッセージを含む多言語3重データセットを構築した。
カスケード方式の誤り伝搬問題に対処するため,コード修復とコミットメッセージ生成の両立が可能なジョイントモデルを提案する。
実験結果から,教師学習法とマルチタスク学習法を併用した拡張カスケードモデルにより,自動コード修復のメトリクスの最良のスコアが得られた。
論文 参考訳(メタデータ) (2021-09-25T07:08:28Z) - CommitBERT: Commit Message Generation Using Pre-Trained Programming
Language Model [0.38073142980733]
コミットメッセージ(Commit message)は、自然言語でソースコードの変更を要約する文書である。
我々はコミットメッセージを自動的に書き込むモデルを開発する。
コード修正とコミットメッセージからなる345Kデータセットを6つのプログラミング言語でリリースします。
論文 参考訳(メタデータ) (2021-05-29T07:48:28Z) - GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。
これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。
コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文 参考訳(メタデータ) (2020-09-17T15:25:56Z) - CoreGen: Contextualized Code Representation Learning for Commit Message
Generation [39.383390029545865]
コミットメッセージ生成(CoreGen)のためのコンテキスト適応型コード表現学習戦略を提案する。
ベンチマークデータセットの実験では、BLEU-4スコアの少なくとも28.18%の改善により、ベースラインモデルよりもモデルの有効性が向上した。
論文 参考訳(メタデータ) (2020-07-14T09:43:26Z) - Contrastive Code Representation Learning [95.86686147053958]
一般的な再構成に基づくBERTモデルは,ソースコードの編集に敏感であることを示す。
コントラコード(ContraCode)は、コード機能を学ぶのにフォームではなく、コントラスト的な事前学習タスクである。
論文 参考訳(メタデータ) (2020-07-09T17:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。