論文の概要: The Time is Here for Just-in-Time Systems: Challenges and Opportunities
- arxiv url: http://arxiv.org/abs/2605.24096v1
- Date: Fri, 22 May 2026 18:03:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.626624
- Title: The Time is Here for Just-in-Time Systems: Challenges and Opportunities
- Title(参考訳): ジャスト・イン・タイムシステム:課題と機会
- Authors: Shu Liu, Alexander Krentsel, Shubham Agarwal, Mert Cemri, Ziming Mao, Soujanya Ponnapalli, Alexandros G. Dimakis, Sylvia Ratnasamy, Matei Zaharia, Aditya Parameswaran, Ion Stoica,
- Abstract要約: キーバリューストアのようなコアシステムは、これまで何年もかけて構築されてきました。
LLMベースのコーディングエージェントは、これまでとは違ったアプローチで、ジャスト・イン・タイム・システム(Just-in-Time Systems)を実現している、と私たちは主張する。
本稿では,JITシステム合成パイプラインであるJitskitについて述べる。
- 参考スコア(独自算出の注目度): 102.80383421480155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Core systems like key-value stores have historically taken years to build, and are designed to be general so as to amortize cost across deployments, paying a significant performance cost. We argue that LLM-based coding agents now make a different approach tractable: Just-in-Time Systems, in which the entire system is synthesized from scratch, specialized to the environment, workload, and required system properties. We present a JIT system synthesis pipeline, Jitskit, and explore its effectiveness in synthesizing key-value stores from spec cards that span different YCSB workloads, deployment constraints (e.g., compute resources), and system properties (e.g., consistency and durability). Jitskit iteratively refines a system implementation to match the specification against an evolving evaluation test suite. The resulting synthesized systems are performant, beating comparable state-of-the-art systems on 18 of 18 specs tried, by up to 4.6x over the best off-the-shelf baseline on the most favorable spec. Naively running Claude Code either reward-hacks or underperforms Jitskit by up to 5.4x. We discuss the challenges we overcame in building Jitskit and our key takeaways.
- Abstract(参考訳): キーバリューストアのようなコアシステムは、これまで何年にもわたって構築されてきました。
ジャスト・イン・タイム・システム(Just-in-Time Systems)は、システム全体をスクラッチから合成し、環境、ワークロード、必要なシステム特性に特化します。
我々はJITシステム合成パイプラインであるJitskitを提案し、様々なYCSBワークロード、デプロイメント制約(例えば、計算リソース)、システム特性(例えば、一貫性と耐久性)にまたがるスペックカードからキーバリューストアを合成する効果について検討する。
Jitskitは、進化する評価テストスイートと仕様を一致させるために、システム実装を反復的に洗練します。
合成されたシステムは性能が高く、18の仕様のうち18の仕様で同等の最先端のシステムを上回り、最も好まれる仕様で最高のオフ・ザ・シェルフベースラインを4.6倍まで上回った。
ネイティブにクロードコードを実行するか、Jitskitを最大5.4倍の性能以下にする。
私たちがJitskitを構築する上で克服した課題と、重要な教訓について論じます。
関連論文リスト
- Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems [100.24694338574402]
本稿では,インダクティブ・デダクティブ・シンセシス(IDS)について述べる。
IDSは約6.8時間で7/7を達成し、1仕様あたり106ドル、専門家の努力の約200倍、SOTAエージェントの約17%を達成している。
IDSはパフォーマンスフィードバックを同じループに組み込んでおり、検証されたシステムよりも最大3倍高速な実装を実現している。
論文 参考訳(メタデータ) (2026-05-22T00:05:36Z) - VibeServe: Can AI Agents Build Bespoke LLM Serving Systems? [7.395579663607589]
本稿では,LLMサービススタック全体をエンドツーエンドに生成する最初のエージェントループであるVibeServeを提案する。
既存のスタックが高度に最適化された標準的なデプロイメント設定では、VibeServeはvLLMと競合し続けている。
非標準的なシナリオでは、VibeServeはジェネリックシステムが見逃す機会を利用して既存のシステムより優れている。
論文 参考訳(メタデータ) (2026-05-07T11:54:53Z) - CocoaBench: Evaluating Unified Digital Agents in the Wild [98.84044600506597]
ココアベンチ(CocoaBench)は、人間によって設計された長距離タスクから構築された統合デジタルエージェントのベンチマークである。
また、モデルバックボーン間の比較を制御できる軽量な共有足場であるCocoaAgentについても紹介する。
論文 参考訳(メタデータ) (2026-04-13T09:00:10Z) - MASEval: Extending Multi-Agent Evaluation from Models to Systems [77.09381093359598]
MASEvalはフレームワークに依存しないライブラリで、システム全体を分析の単位として扱う。
研究者はエージェントシステムのすべてのコンポーネントを探索し、原則化されたシステム設計のための新たな道を開くことができる。
論文 参考訳(メタデータ) (2026-03-09T18:46:17Z) - SysMoBench: Evaluating AI on Formally Modeling Complex Real-World Systems [12.181911851729614]
我々は、AIが大規模で複雑なシステムを正式にモデル化する能力を評価するベンチマークであるSysMoBenchを紹介する。
私たちは、今日の重要なコンピューティングインフラストラクチャのキーストーンである、並列および分散システムに重点を置いています。
論文 参考訳(メタデータ) (2025-09-27T05:24:54Z) - DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis [52.636738269442766]
本稿では,生のベンチマークと総合的自動評価フレームワークであるDeepScholar-benchを紹介する。
DeepScholar-benchは、最近の高品質なArXiv論文からクエリを抽出し、真の研究合成タスクにフォーカスしている。
また,LOTUS APIを用いて効率的に実装した参照パイプラインであるDeepScholar-baseを開発した。
論文 参考訳(メタデータ) (2025-08-27T16:36:34Z) - tieval: An Evaluation Framework for Temporal Information Extraction
Systems [2.3035364984111495]
過去20年間、時間的情報抽出は大きな関心を集めてきた。
大量のコーパスにアクセスすることは、TIEシステムのベンチマークに関して難しい。
tievalはPythonライブラリで、異なるコーパスをインポートするための簡潔なインターフェースを提供し、システム評価を容易にする。
論文 参考訳(メタデータ) (2023-01-11T18:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。