Fugu-MT 論文翻訳(概要): Let the Code LLM Edit Itself When You Edit the Code

論文の概要: Let the Code LLM Edit Itself When You Edit the Code

arxiv url: http://arxiv.org/abs/2407.03157v1
Date: Wed, 3 Jul 2024 14:34:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-04 13:56:35.277869
Title: Let the Code LLM Edit Itself When You Edit the Code
Title（参考訳）: コードを編集するとき、LLMが自分で編集する
Authors: Zhenyu He, Jun Zhang, Shengjie Luo, Jingjing Xu, Zhi Zhang, Di He,
Abstract要約: underlinetextbfPositional textbfIntegrity textbfEncoding (PIE) PIEは、標準的な完全再計算手法に比べて計算オーバーヘッドを85%以上削減する。その結果、PIEは計算オーバーヘッドを標準の完全再計算手法に比べて85%以上削減することを示した。
参考スコア（独自算出の注目度）: 50.46536185784169
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this work, we investigate a typical scenario in code generation where a developer edits existing code in real time and requests a code assistant, e.g., a large language model, to re-predict the next token or next line on the fly. Naively, the LLM needs to re-encode the entire KV cache to provide an accurate prediction. However, this process is computationally expensive, especially when the sequence length is long. Simply encoding the edited subsequence and integrating it to the original KV cache meets the temporal confusion problem, leading to significantly worse performance. We address this efficiency and accuracy trade-off by introducing \underline{\textbf{Positional \textbf{I}ntegrity \textbf{E}ncoding} (PIE). Building upon the rotary positional encoding, PIE first removes the rotary matrices in the Key cache that introduce temporal confusion and then reapplies the correct rotary matrices. This process ensures that positional relationships between tokens are correct and requires only a single round of matrix multiplication. We validate the effectiveness of PIE through extensive experiments on the RepoBench-C-8k dataset, utilizing DeepSeek-Coder models with 1.3B, 6.7B, and 33B parameters. Our evaluation includes three real-world coding tasks: code insertion, code deletion, and multi-place code editing. Results demonstrate that PIE reduces computational overhead by over 85% compared to the standard full recomputation approach across all model sizes and tasks while well approximating the model performance.
Abstract（参考訳）: 本研究では、開発者が既存のコードをリアルタイムで編集し、コードアシスタント(例えば、大きな言語モデル)に次のトークンや次の行をオンザフライで予測するように要求するコード生成の典型的なシナリオについて検討する。一般的に、LLMは正確な予測を提供するために、KVキャッシュ全体を再エンコードする必要がある。しかし、このプロセスは特にシーケンス長が長い場合、計算コストがかかる。編集されたサブシーケンスを単純にエンコードして元のKVキャッシュに統合するだけで、時間的混乱の問題が解決し、パフォーマンスが大幅に悪化する。本稿では、この効率性と精度のトレードオフを、PIE(Shaunderline{\textbf{Positional \textbf{I}ntegrity \textbf{E}ncoding})を導入することによって解決する。回転位置符号化に基づいて、PIEはまず、時間的混乱をもたらすキーキャッシュ内の回転行列を除去し、次に正しい回転行列を再適用する。このプロセスはトークン間の位置関係が正しいことを保証し、1ラウンドの行列乗法しか必要としない。我々は,RepoBench-C-8kデータセットの広範な実験を通じて,1.3B,6.7B,33BパラメータのDeepSeek-Coderモデルを用いてPIEの有効性を検証する。私たちの評価には、コード挿入、コード削除、複数箇所のコード編集という3つの実世界のコーディングタスクが含まれています。その結果、PIEは、モデル性能をよく評価しながら、すべてのモデルサイズとタスクにわたる標準的な完全再計算手法と比較して、計算オーバーヘッドを85%以上削減することを示した。

関連論文リスト

Tokenized Bandit for LLM Decoding and Alignment [32.22367277030496]
トークン化線形バンドイット(TLB)とマルチアームバンドイット(TMAB)を導入する。 TLB と TMAB でそれぞれ $tildeO(LsqrtT)$ と $tildeO(LsqrtT2/3)$ のアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-06-08T20:32:08Z)
Rectified Sparse Attention [61.7702154360081]
効率的なロングシーケンス生成は、大規模言語モデルにとって重要な課題である。本稿では,ブロックスパースアテンションと周期的な密度補正を組み合わせた簡易かつ効果的な方法であるRectified Sparse Attention (ReSA)を提案する。数学推論、言語モデリング、検索タスクにわたる実験は、ReSAがほぼ無作為な生成品質を達成することを示す。
論文参考訳（メタデータ） (2025-06-04T16:01:48Z)
AdaDecode: Accelerating LLM Decoding with Adaptive Layer Parallelism [17.858104076062897]
大規模言語モデル (LLM) は、長いコンテンツ生成にますます使われている。補助モデルや元のモデルパラメータの変更を必要とせずにデコーディングを高速化するAdaDecodeを提案する。 AdaDecodeは最大1.73倍のスピードアップで優れた復号処理を実現している。
論文参考訳（メタデータ） (2025-06-04T08:32:30Z)
Accelerating Diffusion LLMs via Adaptive Parallel Decoding [50.9948753314669]
並列にサンプリングされたトークンの数を動的に調整する新しい手法であるアダプティブ並列復号法(APD)を導入する。 APDは、ダウンストリームベンチマークで最小限の品質劣化を伴って、非常に高いスループットを提供する。
論文参考訳（メタデータ） (2025-05-31T06:10:10Z)
FIRP: Faster LLM inference via future intermediate representation prediction [54.897493351694195]
FIRPはデコードステップ毎に1つではなく複数のトークンを生成する。いくつかのモデルとデータセットで1.9x-3xのスピードアップ比を示す広範な実験を行った。
論文参考訳（メタデータ） (2024-10-27T15:53:49Z)
CodeCipher: Learning to Obfuscate Source Code Against LLMs [5.872773591957006]
我々は,LLMからの応答を保存しながら,コードからプライバシを乱す新しい方法であるCodeCipherを提案する。 CodeCipher は LLM の埋め込み行列を変換し、各行が元の行列内の別の単語に対応するようにし、難読化ソースコードのためのトークンとトークンの混同マッピングを生成する。その結果,LLMの性能を保ちながらソースコードのプライバシを混乱させることに成功した。
論文参考訳（メタデータ） (2024-10-08T08:28:54Z)
Turning Trash into Treasure: Accelerating Inference of Large Language Models with Token Recycling [53.58854856174773]
投機的復号化(英: Speculative decoding)は、推測と検証のパラダイムを通じて推論を加速するアプローチである。トケンリサイクルは、候補トークンを隣接行列に格納し、幅優先探索アルゴリズムを用いる。既存の列車不要の手法を30%上回り、訓練方法さえ25%上回っている。
論文参考訳（メタデータ） (2024-08-16T12:20:56Z)
Fast Chain-of-Thought: A Glance of Future from Parallel Decoding Leads to Answers Faster [61.83949316226113]
FastCoTは並列デコーディングに基づくモデルに依存しないフレームワークである。我々は、FastCoTが通常のアプローチと比較して、無視できる性能低下だけで、推論時間を20%近く削減できることを示します。
論文参考訳（メタデータ） (2023-11-14T15:56:18Z)
Regress Before Construct: Regress Autoencoder for Point Cloud Self-supervised Learning [18.10704604275133]
Masked Autoencoders (MAE) は、2Dおよび3Dコンピュータビジョンのための自己教師型学習において有望な性能を示した。我々は、ポイントクラウド自己教師型学習のための回帰オートエンコーダの新しいスキーム、Point Regress AutoEncoder (Point-RAE)を提案する。本手法は, 各種下流タスクの事前学習において効率よく, 一般化可能である。
論文参考訳（メタデータ） (2023-09-25T17:23:33Z)
Accelerating Transformer Inference for Translation via Parallel Decoding [2.89306442817912]
自動回帰復号化は機械翻訳(MT)における変圧器の効率を制限する並列デコーディングアルゴリズムを3つ提示し、異なる言語やモデルでテストする。
論文参考訳（メタデータ） (2023-05-17T17:57:34Z)
CLAWSAT: Towards Both Robust and Accurate Code Models [74.57590254102311]
比較学習(CL)と逆学習を統合して、コードモデルの堅牢性と精度を協調的に最適化する。私たちの知る限りでは、これはコードモデルにおける(マルチビュー)コードの難読化の堅牢性と正確性について調査し、活用する最初の体系的な研究です。
論文参考訳（メタデータ） (2022-11-21T18:32:50Z)
Pruning Neural Belief Propagation Decoders [77.237958592189]
本稿では,機械学習を用いたBPデコードに対して,過剰完全パリティチェック行列を調整する手法を提案する。我々は,デコーダの複雑さを低減しつつ,0.27dB,1.5dBのML性能を実現する。
論文参考訳（メタデータ） (2020-01-21T12:05:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。