Fugu-MT 論文翻訳(概要): SmartNote: An LLM-Powered, Personalised Release Note Generator That Just Works

論文の概要: SmartNote: An LLM-Powered, Personalised Release Note Generator That Just Works

arxiv url: http://arxiv.org/abs/2505.17977v1
Date: Fri, 23 May 2025 14:45:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-26 18:08:34.165983
Title: SmartNote: An LLM-Powered, Personalised Release Note Generator That Just Works
Title（参考訳）: SmartNote: LLM搭載でパーソナライズされたノート・ジェネレータ
Authors: Farbod Daneshyan, Runzhi He, Jianyu Wu, Minghui Zhou,
Abstract要約: 多くの開発者は、ソフトウェアリリースノートを書くプロセスは退屈で恐ろしい作業だと考えています。本稿では,新鮮で広く適用可能なリリースノート生成手法であるSmartNoteを提案する。 LLM技術を用いて高品質で文脈的にパーソナライズされたリリースノートを生成する。
参考スコア（独自算出の注目度）: 5.9029064046556545
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The release note is a crucial document outlining changes in new software versions. Yet, many developers view the process of writing software release notes as a tedious and dreadful task. Consequently, numerous tools have been developed by researchers and practitioners to automate the generation of software release notes. However, these tools fail to consider project domain and target audience for personalisation, limiting their relevance and conciseness. Additionally, they suffer from limited applicability, often necessitating significant workflow adjustments and adoption efforts, hindering practical use and stressing developers. Despite recent advancements in natural language processing and the proven capabilities of large language models in various code and text-related tasks, there are no existing studies investigating the integration and utilisation of LLMs in automated release note generation. Therefore, we propose SmartNote, a novel and widely applicable release note generation approach that produces high-quality, contextually personalised release notes using LLM technology. SmartNote aggregates changes and uses an LLM to describe and summarise the changes using code, commit, and pull request details. It categorises and scores commits to generate structured and concise release notes of prioritised changes. Our human and automatic evaluations reveal that SmartNote outperforms or achieves comparable performance to DeepRelease, Conventional Changelog, and the projects'original release notes across four quality metrics: completeness, clarity, conciseness, and organisation. In both evaluations, SmartNote ranked first for completeness and organisation, while clarity ranked first in the human evaluation. A further evaluation demonstrates that SmartNote is effective in terms of context awareness and applicability.
Abstract（参考訳）: リリースノートは、新しいソフトウェアバージョンの変更の概要を示す重要なドキュメントである。しかし、多くの開発者は、ソフトウェアリリースノートを書くプロセスは退屈で恐ろしい作業だと見なしています。その結果,ソフトウェアリリースノートの生成を自動化するために,研究者や実践家によって多数のツールが開発されている。しかしながら、これらのツールはプロジェクトドメインやパーソナライズ対象のオーディエンスを考慮せず、その妥当性と簡潔さを制限します。さらに、限定的な適用性に悩まされ、しばしばワークフローの調整と採用の努力を必要とし、実践的な使用を妨げ、開発者のストレスを和らげる。近年の自然言語処理の進歩と、様々なコードやテキスト関連タスクにおける大規模言語モデルの実証された能力にもかかわらず、自動リリースノート生成におけるLLMの統合と活用についての研究は行われていない。そこで本稿では,LLM技術を用いた高品質かつコンテキストにパーソナライズされたリリースノートを生成する,新しい,広く適用可能なリリースノート生成手法であるSmartNoteを提案する。 SmartNoteは変更を集約し、コード、コミット、プルリクエストの詳細を使用して変更を記述および要約するためにLLMを使用する。優先順位付けされた変更に関する構造化され簡潔なリリースノートを生成するために、分類とスコアがコミットされる。人的および自動評価では、SmartNoteはDeepReleaseやConvental Changelogに匹敵するパフォーマンスを発揮し、プロジェクトのオリジナルリリースノートを4つの品質指標(完全性、明確性、簡潔性、組織)で公開しています。どちらの評価でも、SmartNoteは完全性と組織性で第1位、明確性は人的評価で第1位だった。さらなる評価は、SmartNoteがコンテキスト認識と適用性において有効であることを示している。

関連論文リスト

Model Editing for New Document Integration in Generative Information Retrieval [110.90609826290968]
生成検索(GR)は文書識別子(docID)の生成として情報検索(IR)タスクを再構成する既存のGRモデルは、新たに追加されたドキュメントへの一般化が不十分で、しばしば正しいドキュメントIDを生成できない。 DOMEは,GRモデルを非表示文書に効果的かつ効率的に適応する新しい手法である。
論文参考訳（メタデータ） (2026-03-03T09:13:38Z)
Consistency-Aware Editing for Entity-level Unlearning in Language Models [53.522931419965424]
本稿では,エンティティレベルのアンラーニングのための新しい一貫性対応編集(CAE)フレームワークを提案する。 CAEは、その属性、関係、および敵のパラフレーズを含む、ターゲットエンティティに関連する多様なプロンプトの集合を集約する。次に、一貫性レギュレータによってガイドされる低ランクの更新を共同で学習し、プロンプトをまたいだ編集方向を調整する。
論文参考訳（メタデータ） (2025-12-19T15:18:07Z)
ReleaseEval: A Benchmark for Evaluating Language Models in Automated Release Note Generation [20.424587551582153]
ReleaseEvalは、自動リリースノート生成のための言語モデルを評価するために設計されたベンチマークである。 6つのプログラミング言語にわたる3,369のリポジトリから94,987のリリースノートを含んでいる。自動評価と人的評価は、大きな言語モデルが従来のベースラインを一貫して上回っていることを示している。
論文参考訳（メタデータ） (2025-11-04T16:31:44Z)
Evaluating Large Language Models on Non-Code Software Engineering Tasks [4.381476817430934]
大規模言語モデル(LLM)は、コード理解と生成において顕著な能力を示している。ソフトウェア工学言語理解(SELU)と呼ばれる最初の包括的なベンチマークを提示する。 SELUは、分類、回帰、名前付きエンティティ認識(NER)とマスケッド言語モデリング(MLM)のターゲットをカバーし、さまざまなソースからデータを引き出す。
論文参考訳（メタデータ） (2025-06-12T15:52:32Z)
Codetations: Intelligent, Persistent Notes and UIs for Programs and Other Documents [0.85830154886823]
Codetationsは、開発者がリッチなノートやツールで文書をコンテキスト化するのを助けるシステムです。以前のアプローチとは異なり、Codetationsのノートはドキュメントの外に留まり、コードの乱雑さを防ぎ、ハイブリッドな編集追跡/LLMベースのメソッドを使用してドキュメント内のスパンにアタッチする。彼らのコンテンツは動的でインタラクティブで、コードの変更と同期しています。
論文参考訳（メタデータ） (2025-04-25T21:33:25Z)
Utility-Focused LLM Annotation for Retrieval and Retrieval-Augmented Generation [96.18720164390699]
本稿では,大規模言語モデル (LLM) を用いた検索・検索・拡張生成システム (RAG) の訓練における文書ユーティリティのアノテートについて検討する。以上の結果から,LLM生成アノテーションは,人間のアノテーションや下流QAメトリクスのみを訓練したモデルと比較して,ドメイン外検索性能の向上とRAG結果の改善を図っている。
論文参考訳（メタデータ） (2025-04-07T16:05:52Z)
SAGEval: The frontiers of Satisfactory Agent based NLG Evaluation for reference-free open-ended text [0.848663031844483]
本稿では,参照/グラウンドラベルが存在しない,あるいは十分に利用できない,自然言語生成のためのロバストな評価手法を開発する必要性を明らかにする。本研究では,LCM評価器のスコアを補正し,複雑なNLG評価シナリオにおいてもラベル付きデータの必要性を低減できることを示す。
論文参考訳（メタデータ） (2024-11-25T04:07:16Z)
What Did I Do Wrong? Quantifying LLMs' Sensitivity and Consistency to Prompt Engineering [8.019873464066308]
分類タスク,すなわち感度と一貫性の2つの指標を導入する。感度はプロンプトの言い換えによる予測の変化を測るその代わり、一貫性は、同じクラスの要素の言い換えで予測がどのように変化するかを測定する。
論文参考訳（メタデータ） (2024-06-18T06:59:24Z)
PPTC-R benchmark: Towards Evaluating the Robustness of Large Language Models for PowerPoint Task Completion [96.47420221442397]
文,意味,多言語レベルでユーザ命令を攻撃することにより,逆ユーザ命令を構築する。我々は、ロバストネス設定を組み込んだベンチマークを用いて、3つのクローズドソースと4つのオープンソースLCMをテストする。 GPT-4は我々のベンチマークで最も高い性能と強靭性を示す。
論文参考訳（メタデータ） (2024-03-06T15:33:32Z)
ThinkNote: Enhancing Knowledge Integration and Utilization of Large Language Models via Constructivist Cognition Modeling [55.21641515545307]
大規模言語モデル(LLM)は、幅広いNLPタスクにおいて強力なパフォーマンスを示している。それらはしばしば、不慣れな外部情報に晒されたとき、最適でない行動と矛盾を示す。本稿では,LLMの外部知識活用を促進する新しいフレームワークであるThinkNoteを提案する。
論文参考訳（メタデータ） (2024-02-21T06:04:53Z)
CLOMO: Counterfactual Logical Modification with Large Language Models [109.60793869938534]
本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。 LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文参考訳（メタデータ） (2023-11-29T08:29:54Z)
CoAnnotating: Uncertainty-Guided Work Allocation between Human and Large Language Models for Data Annotation [94.59630161324013]
本稿では,非構造化テキストの大規模共同アノテーションのための新しいパラダイムであるCoAnnotatingを提案する。我々の実証研究は、CoAnnotatingが、異なるデータセット上の結果から作業を割り当てる効果的な手段であることを示し、ランダムベースラインよりも最大21%のパフォーマンス改善を実現している。
論文参考訳（メタデータ） (2023-10-24T08:56:49Z)
Beyond the Chat: Executable and Verifiable Text-Editing with LLMs [87.84199761550634]
近年,Large Language Models (LLMs) を利用した会話インタフェースが,文書編集時にフィードバックを得る手段として人気になっている。 InkSyncは、編集中のドキュメント内で直接実行可能な編集を推奨する編集インターフェースである。
論文参考訳（メタデータ） (2023-09-27T00:56:17Z)
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models [73.86954509967416]
マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために強力なLLMに依存している。本稿では,MLLM 評価ベンチマーク MME について述べる。知覚能力と認知能力の両方を合計14のサブタスクで測定する。
論文参考訳（メタデータ） (2023-06-23T09:22:36Z)
Automated Annotation with Generative AI Requires Validation [0.0]
生成型大規模言語モデル(LLM)は、テキストアノテーションの手順を増強するための強力なツールである。 LLMのアノテーションポテンシャルを原則的かつ効率的な方法で活用するためのワークフローを概説する。テキストアノテーションのLLM性能は有望であるが,データセットとアノテーションの型の両方に高い関連性があることが判明した。
論文参考訳（メタデータ） (2023-05-31T20:50:45Z)
EditEval: An Instruction-Based Benchmark for Text Improvements [73.5918084416016]
編集機能の自動評価のためのインストラクションベース、ベンチマーク、評価スイートであるEditEvalを提示する。 InstructGPTとPEERが最良であることを示す事前学習モデルをいくつか評価するが,ほとんどのベースラインは教師付きSOTA以下である。我々の分析は、タスクの編集によく使われるメトリクスが必ずしも相関しているとは限らないことを示し、最高の性能を持つプロンプトに対する最適化は、必ずしも異なるモデルに対して強い堅牢性を持つとは限らないことを示唆している。
論文参考訳（メタデータ） (2022-09-27T12:26:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。