論文の概要: Rationale Dataset and Analysis for the Commit Messages of the Linux Kernel Out-of-Memory Killer
- arxiv url: http://arxiv.org/abs/2403.18832v1
- Date: Tue, 6 Feb 2024 19:25:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 02:34:48.474535
- Title: Rationale Dataset and Analysis for the Commit Messages of the Linux Kernel Out-of-Memory Killer
- Title(参考訳): Linuxカーネル・アウト・オブ・メモリ・キラーのコミットメッセージに対するRationaleデータセットと解析
- Authors: Mouna Dhaouadi, Bentley James Oakes, Michalis Famelis,
- Abstract要約: 我々はLinux Kernel Out-Of-Memory Killerコンポーネントを解析するためのラベル付きデータセットの作成について詳述する。
我々は,存在,時間的進化,構造といった合理的情報の側面を研究する。
私たちのデータセットのコミットの98.9%は、合理的な情報を持つ文を含み、経験豊富な開発者は、コミットの文の約60%に合理性を報告している。
- 参考スコア(独自算出の注目度): 1.290382979353427
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Code commit messages can contain useful information on why a developer has made a change. However, the presence and structure of rationale in real-world code commit messages is not well studied. Here, we detail the creation of a labelled dataset to analyze the code commit messages of the Linux Kernel Out-Of-Memory Killer component. We study aspects of rationale information, such as presence, temporal evolution, and structure. We find that 98.9% of commits in our dataset contain sentences with rationale information, and that experienced developers report rationale in about 60% of the sentences in their commits. We report on the challenges we faced and provide examples for our labelling.
- Abstract(参考訳): コードコミットメッセージには、開発者がなぜ変更をしたのかに関する有用な情報が含まれている。
しかし、実世界のコードコミットメッセージにおける理性の存在と構造はよく研究されていない。
ここでは、Linux Kernel Out-Of-Memory Killerコンポーネントのコードコミットメッセージを解析するためのラベル付きデータセットの作成について詳述する。
我々は,存在,時間的進化,構造といった合理的情報の側面を研究する。
私たちのデータセットのコミットの98.9%は、合理的な情報を持つ文を含み、経験豊富な開発者は、コミットの文の約60%に合理性を報告している。
直面した課題について報告し、ラベル付けの例を示す。
関連論文リスト
- Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - Contextualized Data-Wrangling Code Generation in Computational Notebooks [131.26365849822932]
我々は、マルチモーダルなコンテキスト依存を明確にしたデータラングリングコード生成例をマイニングするために、CoCoMineという自動アプローチを提案する。
コンテクスト化されたデータラングリングコード生成のための58,221のサンプルを含むデータセットであるCoCoNoteをNotebooksで構築する。
実験結果は、データラングリングコード生成にデータコンテキストを組み込むことの重要性を示す。
論文 参考訳(メタデータ) (2024-09-20T14:49:51Z) - On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [82.96523584351314]
我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。
我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文 参考訳(メタデータ) (2024-06-06T19:44:17Z) - How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。
本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。
リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - The Impact Of Bug Localization Based on Crash Report Mining: A Developers' Perspective [7.952391285456257]
事故報告をグループ化し,バグコードを見つけるためのアプローチを18ヶ月にわたって毎週実施した経験を報告する。
この調査で調査されたアプローチは、バギーファイルの大部分を正しく示唆していた。
論文 参考訳(メタデータ) (2024-03-16T01:23:01Z) - Towards Understanding and Analyzing Rationale in Commit Messages using a
Knowledge Graph Approach [1.450261153230204]
我々は現在進行中のkantara end-to-end rationale Restruction Pipelineについて紹介する。
また、LinuxカーネルのOut-of-Memoryコンポーネントの実行例用にラベル付きデータセットを作成する作業も行います。
論文 参考訳(メタデータ) (2023-09-04T13:28:18Z) - Delving into Commit-Issue Correlation to Enhance Commit Message
Generation Models [13.605167159285374]
コミットメッセージ生成は、自動化されたソフトウェアエンジニアリングにおいて難しいタスクである。
ツールとは,コミットとイシューの相関関係をモデルのトレーニングフェーズに導入する,新たなパラダイムだ。
その結果,元モデルと比較して,ツール強化モデルの性能は大幅に向上した。
論文 参考訳(メタデータ) (2023-07-31T20:35:00Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - ComSum: Commit Messages Summarization and Meaning Preservation [17.489658296438694]
テキスト要約のための700万のコミットメッセージからなるデータセットであるComSumを提示する。
サイズ、実用性、挑戦的な言語ドメインの増大とともに、このデータセットは経験的ソフトウェア工学の生きた分野の恩恵を受けている。
論文 参考訳(メタデータ) (2021-08-23T07:43:48Z) - CoreGen: Contextualized Code Representation Learning for Commit Message
Generation [39.383390029545865]
コミットメッセージ生成(CoreGen)のためのコンテキスト適応型コード表現学習戦略を提案する。
ベンチマークデータセットの実験では、BLEU-4スコアの少なくとも28.18%の改善により、ベースラインモデルよりもモデルの有効性が向上した。
論文 参考訳(メタデータ) (2020-07-14T09:43:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。