論文の概要: GitHub Template Repositories: Served Domains, Maintenance, and Practitioner Guidelines
- arxiv url: http://arxiv.org/abs/2606.14616v1
- Date: Fri, 12 Jun 2026 16:41:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.992357
- Title: GitHub Template Repositories: Served Domains, Maintenance, and Practitioner Guidelines
- Title(参考訳): GitHubテンプレートリポジトリ: サーブドドメイン、メンテナンス、実践者ガイドライン
- Authors: Leuson Da Silva, Altaf Allah Abbassi, Imen Trabelsi, Paulo Borba, Foutse Khomh,
- Abstract要約: 私たちは、最もよく使われている5つのプログラミング言語のGitHubテンプレートリポジトリについて、大規模な実証的研究を行いました。
リポジトリの特徴とアクティビティ,および品質関連問題との関連性について分析する。
この結果から,Web開発がエコシステムをまたいだ主流のドメインであること,メンテナンスや品質の問題がプログラム言語によって異なることが示唆された。
- 参考スコア(独自算出の注目度): 6.336805888164513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over time, GitHub has introduced different strategies for sharing reusable code artifacts. In addition to fork-based reuse, template repositories provide a distinct feature for generating new projects from scaffolding. Although this feature has been available since 2019, little is known about the domains it supports, its maintenance characteristics, or the practices that guide practitioners for effective template design. To address this gap, we conduct a large-scale empirical study of GitHub template repositories across the five most used programming languages. First, we mine and categorize templates to analyze the domains they serve, exploring the LLM-as-a-judge strategy. Next, we explore the reliability of templates by evaluating the associations between repository characteristics and activity, and quality-related issues (e.g., code smells, vulnerabilities, and security hotspots) through statistical analysis. Finally, we qualitatively analyze a representative subset of templates to derive practical guidelines and recurring pitfalls for template design and management. Our results show that Web Development is the predominant domain across ecosystems, while maintenance and quality issues vary by programming language. We further find that high-quality templates tend to adopt established software engineering practices, while providing comprehensive documentation and clear guidance for use. Overall, our findings offer empirical insights and actionable guidance to support practitioners in designing and adopting high-quality template repositories.
- Abstract(参考訳): GitHubは、再利用可能なコードアーティファクトを共有するためのさまざまな戦略を導入した。
フォークベースの再利用に加えて、テンプレートリポジトリは、足場から新しいプロジェクトを生成するための特徴を提供する。
この機能は2019年から利用可能になっているが、サポート対象のドメイン、メンテナンス特性、実践者が効果的なテンプレート設計をガイドするプラクティスについてはほとんど知られていない。
このギャップに対処するため、最もよく使われている5つのプログラミング言語にわたるGitHubテンプレートリポジトリの大規模な実証的研究を行った。
まず、LLM-as-a-judge戦略を探求し、それらが提供するドメインを分析するためにテンプレートをマイニングし分類する。
次に、統計分析により、リポジトリの特徴とアクティビティと品質関連の問題(コードの臭い、脆弱性、セキュリティホットスポットなど)との関連性を評価することにより、テンプレートの信頼性について検討する。
最後に、テンプレートの代表的なサブセットを質的に分析し、実用的なガイドラインを導き、テンプレートの設計と管理の落とし穴を繰り返す。
この結果から,Web開発がエコシステムをまたいだ主流のドメインであること,メンテナンスや品質の問題がプログラム言語によって異なることが示唆された。
さらに私たちは、高品質のテンプレートが確立したソフトウェアエンジニアリングプラクティスを採用する傾向にあり、包括的なドキュメントと使用のための明確なガイダンスを提供しています。
全体として、私たちの発見は、高品質なテンプレートリポジトリを設計および採用する実践者を支援するための実証的な洞察と行動可能なガイダンスを提供する。
関連論文リスト
- RepoReviewer: A Local-First Multi-Agent Architecture for Repository-Level Code Review [3.272585676511349]
RepoReviewerは、GitHubリポジトリの自動レビューのためのローカルファーストのマルチエージェントシステムである。
我々は、Python CLI、FastAPI API、LangGraphオーケストレーション層、Next.jsユーザインターフェースを備えたRepoReviewerを提示する。
論文 参考訳(メタデータ) (2026-03-17T04:17:51Z) - An Empirical Study of Policy-as-Code Adoption in Open-Source Software Projects [6.110108715076152]
ポリシー・アズ・コード(PaC)は、ガバナンス、コンプライアンス、セキュリティ要件を直接ソフトウェアシステムに組み込むための基本的なアプローチとなっている。
組織がPaCツールをますます採用する一方で、ソフトウェアエンジニアリングコミュニティには、これらのツールが実際の開発プラクティスでどのように使用されているか、実証的な理解が欠けている。
本稿では,オープンソースソフトウェアにおけるPaC利用に関する大規模な研究を初めて実施することを目的とする。
論文 参考訳(メタデータ) (2026-01-09T06:12:40Z) - When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs [64.27273946787344]
最近のLong-Context Language Modelsは、1つのプロンプトで数十万のトークンを処理することができる。
我々は、従来の問題解決トレースから導かれた再利用可能な思考キャッシュとして、推論をリキャストする。
本稿では,自然言語フィードバックによって学習データから得られるテンプレートを反復的に洗練する更新戦略を提案する。
論文 参考訳(メタデータ) (2025-10-08T19:52:35Z) - Organize the Web: Constructing Domains Enhances Pre-Training Data Curation [129.27104172458363]
トピックとフォーマットの両面からWebページを整理するフレームワークを開発する。
我々は,大規模な言語モデルからアノテーションを抽出して,事前学習データを自動的にアノテートし,効率的なキュレーションを行う。
我々の研究は、ドメインの構築と混合が、品質ベースのデータキュレーション手法の貴重な補完となることを実証している。
論文 参考訳(メタデータ) (2025-02-14T18:02:37Z) - Top General Performance = Top Domain Performance? DomainCodeBench: A Multi-domain Code Generation Benchmark [38.14474956762422]
DomainCodeBenchは、12のソフトウェアアプリケーションドメインと15のプログラミング言語にわたる大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
トップ・ジェネラル・ドメイン・モデルは特定のアプリケーション・ドメインで一貫して排他的でないことが分かりました。
ドメイン固有の知識による拡張プロンプトは、パフォーマンスを約38.17%向上させる。
論文 参考訳(メタデータ) (2024-12-24T17:56:08Z) - Supporting Software Maintenance with Dynamically Generated Document Hierarchies [41.407915858583344]
HGENは、ソースコードを6つのステージで変換し、構造化された文書の階層構造に変換する、完全に自動化されたパイプラインである。
我々はHGENを定量的にも質的にも評価した。
その結果,HGENは手作業で構築したドキュメントに類似したアーティファクト階層を生成し,コアコンセプトをベースラインアプローチよりもはるかに高いカバレッジで実現していることがわかった。
論文 参考訳(メタデータ) (2024-08-11T17:11:14Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Reusable Templates and Guides For Documenting Datasets and Models for
Natural Language Processing and Generation: A Case Study of the HuggingFace
and GEM Data and Model Cards [11.251235763359862]
再利用可能なドキュメンテーションテンプレートの開発を目的とした取り組みについて,2つのケーススタディを提示する。
本稿では,これらのテンプレートの開発プロセスについて述べる。
論文 参考訳(メタデータ) (2021-08-16T23:15:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。