論文の概要: Resilient Write: A Six-Layer Durable Write Surface for LLM Coding Agents
- arxiv url: http://arxiv.org/abs/2604.10842v2
- Date: Tue, 14 Apr 2026 05:16:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.412363
- Title: Resilient Write: A Six-Layer Durable Write Surface for LLM Coding Agents
- Title(参考訳): レジリエント書き込み:LSM符号化エージェント用6層耐久性書き込みサーフェス
- Authors: Justice Owusu Agyemang, Jerry John Kponyo, Elliot Amponsah, Godfred Manu Addo Boakye, Kwame Opuni-Boachie Obour Agyekum,
- Abstract要約: レジリエント・ライト(Resilient Write)は、エージェントとサーバの間に6層の耐久性のある書き込みサーフェスを介するMPPサーバである。
各レイヤは、2026年4月の実際のエージェントセッションで観測された具体的な障害モードにマップされる。
186-testスイートは各層での正当性を検証し、エージェントの自己補正率を13倍改善する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-powered coding agents increasingly rely on tool-use protocols such as the Model Context Protocol (MCP) to read and write files on a developer's workstation. When a write fails - due to content filters, truncation, or an interrupted session - the agent typically receives no structured signal, loses the draft, and wastes tokens retrying blindly. We present Resilient Write, an MCP server that interposes a six-layer durable write surface between the agent and the filesystem. The layers - pre-flight risk scoring, transactional atomic writes, resume-safe chunking, structured typed errors, out-of-band scratchpad storage, and task-continuity handoff envelopes - are orthogonal and independently adoptable. Each layer maps to a concrete failure mode observed during a real agent session in April 2026, in which content-safety filters silently rejected a draft containing redacted API-key prefixes. Three additional tools - chunk preview, format-aware validation, and journal analytics - emerged from using the system to compose this paper. A 186-test suite validates correctness at each layer, and quantitative comparison against naive and defensive baselines shows a 5x reduction in recovery time and a 13x improvement in agent self-correction rate. Resilient Write is open-source under the MIT license.
- Abstract(参考訳): LLMベースのコーディングエージェントは、開発者のワークステーションでファイルを読み書きするために、モデルコンテキストプロトコル(MCP)のようなツール利用プロトコルに依存している。
書き込みが失敗する – コンテンツフィルタやトランケーション,あるいは中断されたセッションなどによって,エージェントは通常,構造化されたシグナルを受信せず,ドラフトが失われ,トークンが盲目的にリトライされる。
エージェントとファイルシステムの間に6層の耐久性のある書き込みサーフェスを介在するMPPサーバであるResilient Writeを提案する。
プレフライトリスクスコア、トランザクションアトミック書き込み、履歴書セーフなチャンキング、構造化された型付きエラー、アウト・オブ・バンドスクラッチパッドストレージ、タスク連続ハンドオフエンベロープといったレイヤは、直交的かつ独立的に適用可能です。
各レイヤは、2026年4月の実際のエージェントセッションで観測された具体的な障害モードにマップされる。
チャンクプレビュー、フォーマット対応のバリデーション、ジャーナル分析という3つの追加ツールが、このシステムを使用してこの論文を構成するために登場した。
186-testスイートは, 各層における正当性を検証し, ネーブベースラインとディフェンスベースラインの定量的比較により, 回復時間の5倍, エージェント自己補正率の13倍向上を示した。
Resilient WriteはMITライセンス下でオープンソースである。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Bridging Protocol and Production: Design Patterns for Deploying AI Agents with Model Context Protocol [0.0]
Model Context Protocol(MCP)は、AIエージェントが外部ツールを発見して呼び出す方法を標準化する。
アイデンティティの伝搬、アダプティブツールの予算化、構造化エラーセマンティクスの3つのプロトコルレベルのプリミティブがまだ欠けている。
本稿では,大手クラウドプロバイダのMPPサーバと統合されたAIエージェントプラットフォームの企業展開から,現場での授業を通じて,これらのギャップを識別する。
論文 参考訳(メタデータ) (2026-03-12T17:42:24Z) - You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents [9.719776777345364]
外部文書を自律的に処理する高特権のLLMエージェントは、タスクを自動化するためにますます信頼されている。
これらのエージェントには、最小限のセキュリティ監視で端末アクセス、制御、アウトバウンドネットワーク接続が与えられる。
emphTrusted Executor Dilemmaと呼ばれるこの信頼モデルの基本的脆弱性を測定する。
この脆弱性は、実装バグではなく、命令追従設計パラダイムの構造的な結果である。
論文 参考訳(メタデータ) (2026-03-12T12:35:46Z) - Sponge Tool Attack: Stealthy Denial-of-Efficiency against Tool-Augmented Agentic Reasoning [58.432996881401415]
最近の作業では、エージェント推論を可能にするために、外部ツールで大きな言語モデル(LLM)を拡張している。
本稿では,入力プロンプトを書き換えることのみでエージェント推論を妨害するスポンジツールアタック(STA)を提案する。
STAは、意味的忠実度の高い原文からの良心的な即興的な書き直しを生成する。
論文 参考訳(メタデータ) (2026-01-24T19:36:51Z) - Verbatim Data Transcription Failures in LLM Code Generation: A State-Tracking Stress Test [1.8875967655304022]
多くの実世界のソフトウェアタスクは、提供されたデータのコードへの正確な書き起こしを必要とする。
小さな省略や変更は、構文的に有効なプログラムを作成しながら沈黙し続けることができる。
本稿では、この信頼性の懸念を解消するために、意図的に最小限の書き起こし-コードベンチマークを導入する。
論文 参考訳(メタデータ) (2026-01-07T06:38:34Z) - RoguePrompt: Dual-Layer Ciphering for Self-Reconstruction to Circumvent LLM Moderation [0.0]
本稿では,不正なユーザクエリを自己再構成プロンプトに変換する自動ジェイルブレイク攻撃を提案する。
GPT 4oに対してRoguePromptをインスタンス化し、2 448で評価すると、以前は強く拒否されていた生産モデレーションシステムであることが示唆される。
3つのセキュリティ関連の結果のバイパス、再構築、実行を分離する評価プロトコルの下で、攻撃は84.7%のバイパス、80.2%の再構築、および71.5パーセントの完全な実行を達成した。
論文 参考訳(メタデータ) (2025-11-24T05:42:54Z) - Hierarchical Token Prepending: Enhancing Information Flow in Decoder-based LLM Embeddings [52.49524240846879]
本稿では,注目レベルの圧縮と読み出しレベルのオーバーシャッシングを緩和する階層型トークンプレッペンディングを提案する。
HTPは、入力をブロックに分割し、ブロックレベルの要約トークンをその後のブロックにプリペンドし、後方情報フローの経路を作成する。
シンプルなアーキテクチャに依存しない方法として、HTPはゼロショットモデルと微調整モデルの両方を強化し、優れた長期文書埋め込みへのスケーラブルなルートを提供する。
論文 参考訳(メタデータ) (2025-11-18T19:37:40Z) - DiffuSpec: Unlocking Diffusion Language Models for Speculative Decoding [66.40658898418316]
DiffuSpecは、事前訓練された拡散言語モデル(DLM)を用いて、単一のフォワードパスでマルチトークンのドラフトを生成する、トレーニングフリーのドロップインフレームワークである。
ベンチマーク全体を通じて、DiffuSpecは最大3倍のウォールクロックスピードアップを達成し、投機的復号化のための自己回帰型ドラフトラの堅牢な代替手段として拡散ベースのドラフトを確立する。
論文 参考訳(メタデータ) (2025-09-28T07:00:15Z) - Probing Pre-trained Language Models on Code Changes: Insights from ReDef, a High-Confidence Just-in-Time Defect Prediction Dataset [0.0]
本稿では,22の大規模C/C++プロジェクトから得られた関数レベル修正の信頼性の高いベンチマークであるReDefを紹介する。
欠陥ケースはコミットの反転によって固定され、クリーンケースはポストホック履歴チェックによって検証される。
このパイプラインは3,164の欠陥と10,268のクリーンな修正をもたらし、既存のリソースよりも信頼性の高いラベルを提供する。
論文 参考訳(メタデータ) (2025-09-11T07:07:11Z) - AdaShield: Safeguarding Multimodal Large Language Models from Structure-based Attack via Adaptive Shield Prompting [54.931241667414184]
textbfAdaptive textbfShield Promptingを提案する。これは、MLLMを構造ベースのジェイルブレイク攻撃から守るための防御プロンプトで入力をプリペイドする。
我々の手法は、構造に基づくジェイルブレイク攻撃に対するMLLMの堅牢性を一貫して改善することができる。
論文 参考訳(メタデータ) (2024-03-14T15:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。