論文の概要: GitFarm: Git as a Service for Large-Scale Monorepos
- arxiv url: http://arxiv.org/abs/2604.11977v1
- Date: Mon, 13 Apr 2026 19:09:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.079691
- Title: GitFarm: Git as a Service for Large-Scale Monorepos
- Title(参考訳): GitFarm: 大規模なモノレポのためのサービスとしてのGit
- Authors: Preetam Dwivedi, Akshay Hacholli, Adam Bettigole,
- Abstract要約: gRPC APIを通じて、Gitをステートフル、アイデンティティスコープ、リポジトリ中心の実行サービスとして提供するプラットフォームであるGitFarmを紹介します。
GitFarmは、事前警告されたリポジトリによってバックアップされた、セキュアで一時的なサンドボックス内でGit操作をリモートで実行することで、クライアントからリポジトリ管理を分離する。
結果として、サービスとしてのGitは、ネイティブなGitセマンティクスの柔軟性を維持しながら、大幅なパフォーマンスとコスト面でのメリットを提供することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: At the scale of Uber's monorepos, traditional Git workflows become a fundamental bottleneck. Cloning multi-gigabyte repositories, maintaining local checkouts, periodically syncing from upstream, and executing repetitive fetch or push operations consume substantial compute and I/O across hundreds of automation systems. Although CI (Continuous Integration) systems such as Jenkins and Buildkite provide caching mechanisms to reduce clone times, in practice, these approaches incur significant infrastructure overhead, manual maintenance, inconsistent cache hit rates, and cold start latencies of several minutes for large monorepos. Moreover, thousands of independent clone and fetch operations add heavy load on upstream Git servers, making them slow and difficult to scale. To address these limitations, we present GitFarm, a platform that provides Git as a stateful, identity-scoped, repository-centric execution service through a gRPC API. GitFarm decouples repository management from clients by executing Git operations remotely within secure, ephemeral sandboxes backed by pre-warmed repositories. The system enforces identity-scoped authorization, supports multi-command workflows, and leverages specialized backend clusters for workload isolation. For clients, this design eliminates local clones, provides a ready-to-use checkout in less than a second, and significantly lowers client-side compute and I/O overhead by offloading operations to GitFarm. Also, client services no longer experience cold starts (up to 15 minutes) due to initial clones of the monorepos on each host. The results demonstrate that Git as a service provides substantial performance and cost benefits, while preserving the flexibility of native Git semantics.
- Abstract(参考訳): Uberのモノレポの規模では、従来のGitワークフローが根本的なボトルネックになっている。
マルチギガバイトのリポジトリのクローン、ローカルチェックアウトの維持、上流からの定期的な同期、繰り返しフェッチやプッシュ操作の実行は、数百の自動化システムで相当量の計算とI/Oを消費する。
JenkinsやBuildkiteのようなCI(Continuous Integration)システムは、クローン時間を削減するためのキャッシュメカニズムを提供するが、実際には、これらのアプローチは、大規模なモノレポに対して、重大なインフラストラクチャオーバーヘッド、手動のメンテナンス、一貫性のないキャッシュヒットレート、コールドスタートレイテンシを発生させる。
さらに、何千もの独立したクローンとフェッチ操作が上流のGitサーバに重い負荷を与えているため、スケールが遅く、難しくなっている。
これらの制限に対処するため、gRPC APIを通じてGitをステートフル、アイデンティティスコープ、リポジトリ中心の実行サービスとして提供するプラットフォームであるGitFarmを紹介します。
GitFarmは、事前警告されたリポジトリによってバックアップされた、セキュアで一時的なサンドボックス内でGit操作をリモートで実行することで、クライアントからリポジトリ管理を分離する。
このシステムは、IDスコープによる認証を施行し、マルチコマンドワークフローをサポートし、ワークロード分離のために特別なバックエンドクラスタを活用する。
クライアントにとって、この設計はローカルクローンを排除し、1秒未満で使えるチェックアウトを提供し、GitFarmに操作をオフロードすることでクライアントサイドの計算とI/Oオーバーヘッドを大幅に削減する。
また、クライアントサービスは各ホストのモノレポの初期クローンのため、コールドスタート(最大15分)をもはや経験しない。
その結果、Git as a Serviceは、ネイティブなGitセマンティクスの柔軟性を維持しながら、大幅なパフォーマンスとコスト面でのメリットを提供することが示された。
関連論文リスト
- Effective Strategies for Asynchronous Software Engineering Agents [52.76455094324273]
本稿では,集中型タスクデリゲート,非同期実行,独立したワークスペースという,3つのSWEプリミティブに根ざした構造化マルチエージェント協調パラダイムを導入する。
CAIDは,紙再生タスク(PaperBench)では26.7%,Pythonライブラリ開発タスクでは14.3%,単一エージェントベースラインでは26.7%の精度向上を実現している。
論文 参考訳(メタデータ) (2026-03-23T02:26:35Z) - Git Takes Two: Split-View Awareness for Collaborative Learning of Distributed Workflows in Git [8.050201886404293]
GitAcademyはブラウザベースの学習プラットフォームで、完全なGit環境をスプリットビューのコラボレーティブモードで埋め込んでいます。
学習者は、共有リモートに接続された独自のローカルリポジトリで作業すると同時に、パートナーのアクションをリアルタイムでミラーリングする。
13組の学習者を対象にした内的調査では、スプリットビューインタフェースは社会的プレゼンスを高め、ピア・ラーニングをサポートし、一視点ベースラインよりも一貫して好まれていた。
論文 参考訳(メタデータ) (2026-02-23T11:05:56Z) - Pull Requests as a Training Signal for Repo-Level Code Editing [49.82435173554125]
Clean Pull Request(Clean-PR)は、現実のGitHubプルリクエストをリポジトリレベルの編集のトレーニングシグナルとして活用する、トレーニング中のパラダイムである。
ノイズの多いプルリクエストの差分を,再構築と検証を通じて検索/リプレース編集ブロックに変換する,スケーラブルなパイプラインを導入する。
SWE-benchでは,SWE-bench Liteが13.6%,SWE-bench Verifiedが12.3%,命令調整ベースラインが大幅に向上した。
論文 参考訳(メタデータ) (2026-02-07T09:22:25Z) - Controller-Light CI/CD with Jenkins: Remote Container Builds and Automated Artifact Delivery [0.0]
本稿では、Jenkinsが永続ボリュームを持つコンテナ化されたコントローラとして動作するコントローラライトCI/CDフレームワークを提案する。
Jenkinsは永続的なボリュームを持つコンテナ化されたコントローラとして動作し、重いビルドとパッケージング操作をリモートDockerホストに委譲する。
論文 参考訳(メタデータ) (2025-11-07T21:27:47Z) - Gistify! Codebase-Level Understanding via Runtime Execution [97.63528391679807]
Gistifyは、コーディング LLM が特定の機能を再現できる単一で最小限の自己完結型ファイルを作成する必要があるタスクである。
現在の最先端モデルは、Gistifyタスク、特に長時間実行のあるタスクを確実に解くのに苦労している。
論文 参考訳(メタデータ) (2025-10-30T17:58:26Z) - Git Context Controller: Manage the Context of LLM-based Agents like Git [6.521644491529639]
大きな言語モデル(LLM)ベースのエージェントは、内部推論と外部ツールの使用をインターリーブすることによって、印象的な機能を示している。
ソフトウェアバージョン管理システムにインスパイアされた構造化コンテキスト管理フレームワークであるGit-Context-Controller(GCC)を紹介した。
自己複製のケーススタディでは、GCCを増強したエージェントが新しいCLIエージェントをスクラッチから作り、40.7タスクの解決を実現した。
論文 参考訳(メタデータ) (2025-07-30T08:01:45Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - Enhancing Open-Domain Task-Solving Capability of LLMs via Autonomous Tool Integration from GitHub [79.31134731122462]
オープンドメインのタスク解決能力を評価するためにOpenActベンチマークを導入します。
我々は,オープンドメインの進化するクエリに,GitHubから専門ツールを自律的に統合することで対処できる,新しいLLMベースのエージェントシステムであるOpenAgentを紹介する。
論文 参考訳(メタデータ) (2023-12-28T15:47:30Z) - Git-Theta: A Git Extension for Collaborative Development of Machine
Learning Models [26.107117592578632]
本稿では,機械学習モデルのバージョン管理システムGit-Thetaを紹介する。
Git-Thetaは、最も広く使われているバージョン管理ソフトウェアであるGitの拡張である。
論文 参考訳(メタデータ) (2023-06-07T15:37:50Z) - Testing GitHub projects on custom resources using unprivileged
Kubernetes runners [1.137903861863692]
GitHubはソフトウェアプロジェクトをホスティングするための人気のあるリポジトリだ。
ネイティブなGitHub Actionsにより、ソフトウェア開発者が新しいコミットを検証するのが容易になり、新しいコードが大きなバグを導入しないという自信を持つことができる。
無償で利用可能なテスト環境は、いくつかの一般的な設定に限られるが、カスタムのAction Runnerで拡張できる。
論文 参考訳(メタデータ) (2023-05-17T16:31:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。