論文の概要: Customizing an LLM for Enterprise Software Engineering
- arxiv url: http://arxiv.org/abs/2605.16517v2
- Date: Tue, 19 May 2026 21:11:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.205635
- Title: Customizing an LLM for Enterprise Software Engineering
- Title(参考訳): エンタープライズソフトウェアエンジニアリングのためのLLMのカスタマイズ
- Authors: Aditya Kini, Satish Chandra, Milad Hashemi, Saksham Thakur, Aditya Pandey, Vincent Nguyen, Marc Brockschmidt, Franjo Ivančić, Danny Tarlow, Parthasarathy Ranganathan, Petros Maniatis, Ahmed Omran, Zaheer Abbas, Anita Gergely, Martin Sevenich, Gufeng Zhang, Amy Hua, Alexander Frömmgen,
- Abstract要約: Gemini for Google (GfG)は、Googleの内部ソフトウェアエンジニアリングエコシステムに特化したGeminiの適応である。
29,000人の開発者を対象にした大規模な盲目A/B調査では、GoogleのGeminiがベースラインを大幅に上回った。
この方法論は、他の組織が社内エンジニアリングデータの潜在能力を最大限に活用するための、レプリケートなパスを提供する、と私たちは信じています。
- 参考スコア(独自算出の注目度): 35.9413356526649
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enterprise software development is a continuous evolutionary process, characterized by incremental additions, architectural revisions, production deployments and rigorous maintenance. These activities generate valuable data that modern LLMs could be finetuned on, to unlock additional tool possibilities for enterprise software engineering. While frontier LLMs are already very capable, this form of customization offers a compelling path for enterprise-specific optimization. We introduce Gemini for Google (GfG)}, an adaptation of Gemini specialized for Google's internal software engineering ecosystem. This paper details the model's end-to-end development, from curating a trillion-token proprietary dataset to implementing a mid-training strategy that mitigates catastrophic forgetting. In a large-scale blind A/B study across 29,000 developers, Gemini for Google significantly outperformed baselines: reducing the mean number of iterations per turn by 23\%, and increasing code survival rates by about 17%. Beyond metrics, we provide a comprehensive blueprint for enterprise model adaptation, covering: (1)The extraction of high-value signals from software engineering data, (2)Data preparation strategies, (3)Full-stack model tuning (continued pre-training and post-training), and (4)The deployment of downstream applications. We believe this methodology offers a replicable path for other organizations to unlock the full potential of their internal engineering data.
- Abstract(参考訳): エンタープライズソフトウェア開発は継続的進化のプロセスであり、漸進的な追加、アーキテクチャ修正、製品展開、厳格なメンテナンスが特徴である。
これらのアクティビティは、エンタープライズソフトウェアエンジニアリングのための追加ツールの可能性を解き放つために、現代のLLMを微調整できる貴重なデータを生成します。
フロンティアのLLMは、すでに非常に有能ですが、このようなカスタマイズは、企業固有の最適化のための魅力的なパスを提供します。
Googleの内部ソフトウェアエンジニアリングエコシステムに特化したGeminiの適応であるGemini for Google(GfG)}を紹介します。
本稿では、数兆のプロプライエタリデータセットのキュレーションから、破滅的な忘れを緩和する中級トレーニング戦略の実装に至るまで、モデルのエンドツーエンド開発について詳述する。
29,000人の開発者を対象とした大規模な盲目A/B調査では、GoogleのGeminiがベースラインを大幅に上回った。
1)ソフトウェアエンジニアリングデータからの高価値信号の抽出,(2)データ準備戦略,(3)フルスタックモデルチューニング(事前トレーニングと後トレーニングの継続),(4)ダウンストリームアプリケーションのデプロイ。
この方法論は、他の組織が社内エンジニアリングデータの潜在能力を最大限に活用するための、レプリケートなパスを提供する、と私たちは考えています。
関連論文リスト
- IQuest-Coder-V1 Technical Report [56.045533451719905]
IQuest-Coder-V1 シリーズ-(7B/14B/40B/40B-Loop) は、新しいコード大言語モデル(LLM)のファミリーである。
IQuest-Coder-V1は、コードインテリジェンスの重要な次元にわたる競合モデルの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-17T16:15:31Z) - SWE-AGI: Benchmarking Specification-Driven Software Construction with MoonBit in the Era of Autonomous Agents [21.8776989802963]
SWE-AGIはMoonBitで書かれたソフトウェアシステムのエンドツーエンド、仕様駆動の構築を評価するためのオープンソースのベンチマークである。
それぞれのタスクには1000~10,000行のコアロジックを実装する必要がある。
論文 参考訳(メタデータ) (2026-02-10T06:31:47Z) - Towards Reliable ML Feature Engineering via Planning in Constrained-Topology of LLM Agents [1.991571265620589]
コード生成モデルの最近の進歩は、機能エンジニアリングを自動化する前例のない機会を解き放ちました。
現実のMLチームにおける彼らの採用は、依然として重要な課題に制約されている。
我々はこれらの課題に,プランナーによる制約付きトポロジーマルチエージェントフレームワークで対処する。
論文 参考訳(メタデータ) (2026-01-15T19:33:42Z) - InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling [71.37579508777843]
大規模言語モデル(LLM)は、複雑な推論機能を実現することによって、人工知能に革命をもたらした。
このギャップに対処するため、1000以上のドメイン分散タスク環境からなるオープンソースのフレームワークであるInternBootcampを紹介します。
論文 参考訳(メタデータ) (2025-08-12T05:00:00Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - LLM-Generated Microservice Implementations from RESTful API Definitions [3.740584607001637]
本稿では,Large Language Models (LLMs) を用いて,APIファーストのソフトウェア開発を自動化するシステムを提案する。
システムはOpenAPI仕様を生成し、そこからサーバコードを生成し、実行ログとエラーメッセージを分析するフィードバックループを通じてコードを精査する。
このシステムは、ソフトウェア開発サイクルをスピードアップする上で、ソフトウェア開発者、アーキテクト、組織に利益をもたらす可能性がある。
論文 参考訳(メタデータ) (2025-02-13T20:50:33Z) - Embedded Software Development with Digital Twins: Specific Requirements
for Small and Medium-Sized Enterprises [55.57032418885258]
デジタル双生児は、コスト効率の良いソフトウェア開発とメンテナンス戦略の可能性を秘めている。
私たちは中小企業に現在の開発プロセスについてインタビューした。
最初の結果は、リアルタイムの要求が、これまでは、Software-in-the-Loop開発アプローチを妨げていることを示している。
論文 参考訳(メタデータ) (2023-09-17T08:56:36Z) - MLOps: A Step Forward to Enterprise Machine Learning [0.0]
この研究は、MLOps、そのメリット、困難、進化、および重要な基盤技術に関する詳細なレビューを提示する。
MLOpsワークフローは、モデルとデータ探索とデプロイメントの両方に必要なさまざまなツールとともに、詳細に説明されている。
この記事では、さまざまな成熟度の高い自動パイプラインを使用して、MLプロジェクトのエンドツーエンド生産にも光を当てます。
論文 参考訳(メタデータ) (2023-05-27T20:44:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。