論文の概要: Does My README File Need To Be Updated? Exploring LLM-Based README Maintenance
- arxiv url: http://arxiv.org/abs/2603.00489v1
- Date: Sat, 28 Feb 2026 06:04:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 12:48:56.987311
- Title: Does My README File Need To Be Updated? Exploring LLM-Based README Maintenance
- Title(参考訳): 私のREADMEファイルは更新する必要があるか? LLMベースのREADMEメンテナンスを探る
- Authors: Haoyu Gao, Hong Yi Lin, Christoph Treude, Gregory Gay, Mansooreh Zahedi,
- Abstract要約: 古いドキュメントは、プロジェクトを理解する上で最も頻繁で深刻な課題の1つだと見なされている。
本稿では,ループ内ワークフロー内での正確なローカル化ファイル更新を容易にするために,軽量なLarge Language Model (LLM) によるアプローチを提案する。
- 参考スコア(独自算出の注目度): 13.873979933468268
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The README file serves as a critical source of information for gaining an overview and helping developers onboard to an Open Source Software (OSS) project. Yet, documentation issues persist; in particular, ``outdated'' documentation is perceived by developers as one of the most frequent and severe challenges with gaining project understanding. While previous studies have aimed to mitigate this problem, they typically either rely on highly-engineered solutions focused on specific code components or employ generative methods that are ineffective for incremental maintenance. In this study, we propose a lightweight Large Language Model (LLM)-driven approach to facilitate precise, localised README file updates within a human-in-the-loop workflow. Specifically, given a pull request (PR), our pipeline determines whether an update is necessary; if so, it identifies the precise locations where updates should be applied and provides a justification based on the triggering events. Our evaluation on 27,772 PRs across 714 popular repositories demonstrates high precision and utility. Furthermore, we performed a qualitative failure case analysis to provide deeper insights and directions for improvement. We also conducted a retrospective study on 20 sampled repositories, complemented by a case study with a developer of a large OSS project. These evaluations demonstrate that the tool effectively identifies overlooked PRs requiring README updates, thereby helping to mitigate the risk of outdated documentation. Finally, we provide concrete implications for practitioners and researchers, highlighting the need to further explore effective interaction patterns to incorporate documentation update tools into the OSS development workflow.
- Abstract(参考訳): READMEファイルは、概要を取得し、開発者がオープンソースソフトウェア(OSS)プロジェクトに参加するのを助けるために重要な情報ソースとして機能する。
特に 'outdated'' ドキュメントは,プロジェクトの理解を得る上で最も頻度が高く厳しい課題のひとつだ,と開発者に認識されている。
以前の研究ではこの問題を軽減することを目的としていたが、典型的には特定のコードコンポーネントに焦点を当てた高度にエンジニアリングされたソリューションに頼るか、漸進的なメンテナンスに不効率な生成的手法を採用するかのどちらかである。
本研究では,Large Language Model (LLM) をベースとした,高精度で局所化されたREADMEファイル更新を,ループ内ワークフロー内で容易に行うための軽量なLarge Language Model (LLM) 方式を提案する。
具体的には、プルリクエスト(PR)が与えられた場合、パイプラインは更新が必要なかどうかを判断します。
27,772個のPRを714個のレポジトリで評価した結果,精度と有用性が確認された。
さらに、我々は、改善のための深い洞察と方向性を提供するために、定性的な失敗事例分析を行った。
また,大規模なOSSプロジェクトの開発者とのケーススタディで補完した20個のサンプルリポジトリのふりかえり調査を行った。
これらの評価は、このツールがREADME更新を必要とする見落としているPRを効果的に識別し、古いドキュメントのリスクを軽減することを実証している。
最後に、実践者や研究者に具体的な意味を提供し、ドキュメント更新ツールをOSS開発ワークフローに組み込むための効果的なインタラクションパターンをさらに探求する必要性を強調します。
関連論文リスト
- Model Editing for New Document Integration in Generative Information Retrieval [110.90609826290968]
生成検索(GR)は文書識別子(docID)の生成として情報検索(IR)タスクを再構成する
既存のGRモデルは、新たに追加されたドキュメントへの一般化が不十分で、しばしば正しいドキュメントIDを生成できない。
DOMEは,GRモデルを非表示文書に効果的かつ効率的に適応する新しい手法である。
論文 参考訳(メタデータ) (2026-03-03T09:13:38Z) - MedDCR: Learning to Design Agentic Workflows for Medical Coding [55.51674334874892]
医療符号化は、フリーテキスト臨床ノートを標準化された診断および手続きコードに変換する。
本稿では,設計を学習問題として扱うクローズドループフレームワークであるMedDCRを提案する。
ベンチマークデータセットでは、MedDCRは最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-11-17T13:30:51Z) - Scalable and Robust LLM Unlearning by Correcting Responses with Retrieved Exclusions [49.55618517046225]
Webスケールのコーパスリスクを記憶し、センシティブな情報を暴露する言語モデル。
本稿では,新しいアンラーニングフレームワークであるCorrective Unlearning with Retrieved Exclusions (CURE)を提案する。
CUREは、リークのモデル出力を確認し、安全な応答に修正する。
論文 参考訳(メタデータ) (2025-09-30T09:07:45Z) - SoK: Potentials and Challenges of Large Language Models for Reverse Engineering [5.603029122508333]
リバースエンジニアリング(RE)はソフトウェアセキュリティの中心であり、脆弱性発見やマルウェア分析などのタスクを可能にする。
ディープラーニングの初期の進歩は、特にマルウェア検出と脆弱性分類のために、REの一部を自動化するようになった。
最近では、急速に成長する研究機関が、同様の目的にLarge Language Models (LLMs)を適用している。
論文 参考訳(メタデータ) (2025-09-26T03:26:51Z) - RelRepair: Enhancing Automated Program Repair by Retrieving Relevant Code [11.74568238259256]
RelRepairは関連するプロジェクト固有のコードを取得し、プログラムの自動修復を強化する。
広く研究されている2つのデータセット、Defects4J V1.2 と ManySStuBs4J について RelRepair の評価を行った。
論文 参考訳(メタデータ) (2025-09-20T14:07:28Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Prompting in the Wild: An Empirical Study of Prompt Evolution in Software Repositories [11.06441376653589]
本研究は,LSM統合ソフトウェア開発における迅速な進化の実証的研究である。
我々は、インシデント変更のパターンと頻度を調べるために、243のGitHubリポジトリにわたる1,262のインシデント変更を分析した。
私たちの調査によると、開発者は主に追加や修正を通じて進化し、ほとんどの変更は機能開発中に発生します。
論文 参考訳(メタデータ) (2024-12-23T05:41:01Z) - VersiCode: Towards Version-controllable Code Generation [58.82709231906735]
大規模言語モデル(LLM)は、コード生成において大きな進歩を遂げていますが、既存の研究は、ソフトウェア開発の動的な性質を説明できません。
バージョン別コード補完(VSCC)とバージョン別コードマイグレーション(VACM)の2つの新しいタスクを提案する。
VersiCodeについて広範な評価を行い、バージョン管理可能なコード生成が確かに重要な課題であることを示した。
論文 参考訳(メタデータ) (2024-06-11T16:15:06Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA)
我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。
オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z) - Adapting Installation Instructions in Rapidly Evolving Software Ecosystems [9.982895603207993]
インストール関連セクションの更新に重点を置いた1,163のコミットでGitHubリポジトリを調査した。
調査の結果,コミットの変更には,プリインストール命令,インストール後のインストレーション命令,ドキュメント提示,外部リソース管理の6つの大きなカテゴリが明らかになった。
そこで本稿では,ドキュメント更新時にドキュメンテーションメンテナが参照するインストール関連セクションをカバーするテンプレートを提案する。
論文 参考訳(メタデータ) (2023-12-06T02:54:26Z) - On building machine learning pipelines for Android malware detection: a
procedural survey of practices, challenges and opportunities [4.8460847676785175]
スマートフォン市場のリーダーとして、Androidはマルウェア攻撃の目玉ターゲットとなっている。
特に市場保有者や研究者にとって、多数のサンプルが手動によるマルウェア検出を不可能にしている。
提案されたアプローチのいくつかは高いパフォーマンスを達成するが、急速に進化するAndroidマルウェアは、時間とともにその正確性を維持することができない。
論文 参考訳(メタデータ) (2023-06-12T13:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。