論文の概要: Cascaded Code Editing: Large-Small Model Collaboration for Effective and Efficient Code Editing
- arxiv url: http://arxiv.org/abs/2604.19201v1
- Date: Tue, 21 Apr 2026 08:08:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.679031
- Title: Cascaded Code Editing: Large-Small Model Collaboration for Effective and Efficient Code Editing
- Title(参考訳): Cascaded Code Editing: 効率的かつ効率的なコード編集のための大規模モデルコラボレーション
- Authors: Chaozheng Wang, Zezhou Yang, Shuzheng Gao, Cuiyun Gao, Zongjie Li, Yichen Li, Ting Peng, Hailiang Huang, Yuetang Deng, Michael R. Lyu,
- Abstract要約: 我々は、コード編集を2段階のカスケード、textbfedit スケッチ生成と textbfedit スケッチアプリケーションに分解することを提案する。
このカスケード設計は、出力の大部分がより小さく、より効率的なモデルによって処理されるため、大きなモデルによって生成されるトークンの数を減らす。
このアプローチの有効性は、長いコンテキストシナリオやファイル間の依存関係を扱う際の、現在の小さなモデルの限られた機能によって制限されている。
- 参考スコア(独自算出の注目度): 40.309873338087975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code editing constitutes a fundamental practice in software development, wherein developers modify existing codebases according to natural language requirements. Accurate code editing necessitates a comprehensive understanding of both the existing codebase and the modification requirements. Although large language models (LLMs) have demonstrated promising performance in code editing tasks, they suffer from substantial inefficiency by generating entire modified files that largely consist of unchanged code. While smaller models could potentially address this inefficiency, they typically lack the capacity to effectively comprehend long code contexts required for accurate editing. To ensure both effectiveness and efficiency, we propose to decompose code editing into a two-stage cascade: \textbf{edit sketch generation}, wherein a large model first produces concise sketches representing the requisite modifications (the more challenging phase), and \textbf{edit sketch application}, wherein a smaller model integrates these sketches into the original code to produce the final output edited code (the simpler phase). This cascaded design reduces the number of tokens generated by the large model, as the majority of the output is handled by the smaller, more efficient model, thereby enhancing overall efficiency. However, the effectiveness of this approach is constrained by current small models' limited capabilities in handling long-context scenarios and cross-file dependencies, which are essential for accurate sketch application in real-world codebases. To address these limitations and enhance smaller models' sketch application capabilities, ...
- Abstract(参考訳): コード編集はソフトウェア開発の基本的なプラクティスであり、開発者は自然言語の要求に応じて既存のコードベースを変更する。
正確なコード編集は、既存のコードベースと修正要件の両方を包括的に理解する必要がある。
大規模な言語モデル(LLM)は、コード編集タスクにおいて有望な性能を示したが、ほとんど変化のないコードからなる修正ファイルを生成することで、かなりの非効率さに悩まされている。
より小さなモデルは、この非効率性に対処する可能性があるが、通常は正確な編集に必要な長いコードコンテキストを効果的に理解する能力が欠けている。
そこでは、まず、必要な修正(より困難なフェーズ)を表す簡潔なスケッチを大モデルで生成し、次に、より小さなモデルでこれらのスケッチを元のコードに統合し、最終的な出力されたコード(より単純なフェーズ)を生成する。
このケースドデザインは、出力の大部分がより小さくより効率的なモデルによって処理されるため、大きなモデルによって生成されるトークンの数を削減し、全体的な効率を向上する。
しかし、このアプローチの有効性は、現実のコードベースでの正確なスケッチアプリケーションに不可欠な、長いコンテキストシナリオとファイル間の依存関係を扱う、現在の小さなモデルの限られた機能によって制限されている。
これらの制限に対処し、より小さなモデルのスケッチアプリケーション機能を強化するために、...
関連論文リスト
- EfficientEdit: Accelerating Code Editing via Edit-Oriented Speculative Decoding [12.558682788313371]
大規模言語モデル(LLM)は、コード編集において顕著な能力を示し、ソフトウェア開発の生産性を大幅に向上させた。
提案するEfficientEditは,投機的復号化に基づく2つのキー機構により,LLMベースのコード編集効率を向上させる手法である。
実験の結果、EfficientEditは10.38$times$と13.09$times$speedupを標準の自己回帰デコードと比較して達成できることがわかった。
論文 参考訳(メタデータ) (2025-06-03T12:01:20Z) - Robust Learning of Diverse Code Edits [10.565439872488328]
ソフトウェアエンジニアリングのアクティビティは、しばしば既存のコードへの編集を伴います。
コード言語モデル(LM)には、さまざまなタイプのコード編集要求を処理する能力がない。
本稿では,新しい合成データ生成パイプラインと適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-05T16:39:04Z) - Speculative Decoding with Big Little Decoder [108.95187338417541]
Big Little Decoder (BiLD) は、幅広いテキスト生成アプリケーションの推論効率と遅延を改善するフレームワークである。
NVIDIA T4 GPUでは、当社のフレームワークは最大2.12倍の高速化を実現し、生成品質の最小化を実現している。
私たちのフレームワークは完全にプラグアンドプレイで、トレーニングプロセスやモデルアーキテクチャの変更なしに適用できます。
論文 参考訳(メタデータ) (2023-02-15T18:55:29Z) - CoditT5: Pretraining for Source Code and Natural Language Editing [34.77621217370665]
CoditT5は、大量のソースコードと自然言語コメントで事前訓練された、ソフトウェア関連の編集タスクのための大規模な言語モデルである。
コメント更新、バグ修正、自動コードレビューなど、さまざまなダウンストリーム編集タスクを微調整します。
論文 参考訳(メタデータ) (2022-08-10T16:59:40Z) - Memory-Based Model Editing at Scale [102.28475739907498]
既存のモデルエディタは、編集対象のスコープを正確にモデル化するのに苦労する。
SERAC(Retrieval-Augmented Counterfactal Model)を用いた半パラメトリック編集を提案する。
SERACは、編集を明示的なメモリに格納し、必要に応じてベースモデルの予測を変更できるように、それらを推論することを学ぶ。
論文 参考訳(メタデータ) (2022-06-13T23:40:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。