論文の概要: Repairing Regex Vulnerabilities via Localization-Guided Instructions
- arxiv url: http://arxiv.org/abs/2510.09037v1
- Date: Fri, 10 Oct 2025 06:15:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.204437
- Title: Repairing Regex Vulnerabilities via Localization-Guided Instructions
- Title(参考訳): 局所誘導型インストラクションによる回帰脆弱性の修復
- Authors: Sicheol Sung, Joonghyuk Hahn, Yo-Sub Han,
- Abstract要約: 正規表現(regexes)は、正規表現拒否(ReDoS)にシステムを公開する
しかし、現在のアプローチはトレードオフによって妨げられている。
信頼性を保ちながら一般化を活用するために設計されたハイブリッド・フレームワーク、ローカライズド・リフレクション(LRR)を導入する。
- 参考スコア(独自算出の注目度): 6.033257307910245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Regular expressions (regexes) are foundational to modern computing for critical tasks like input validation and data parsing, yet their ubiquity exposes systems to regular expression denial of service (ReDoS), a vulnerability requiring automated repair methods. Current approaches, however, are hampered by a trade-off. Symbolic, rule-based system are precise but fails to repair unseen or complex vulnerability patterns. Conversely, large language models (LLMs) possess the necessary generalizability but are unreliable for tasks demanding strict syntactic and semantic correctness. We resolve this impasse by introducing a hybrid framework, localized regex repair (LRR), designed to harness LLM generalization while enforcing reliability. Our core insight is to decouple problem identification from the repair process. First, a deterministic, symbolic module localizes the precise vulnerable subpattern, creating a constrained and tractable problem space. Then, the LLM invoked to generate a semantically equivalent fix for this isolated segment. This combined architecture successfully resolves complex repair cases intractable for rule-based repair while avoiding the semantic errors of LLM-only approaches. Our work provides a validated methodology for solving such problems in automated repair, improving the repair rate by 15.4%p over the state-of-the-art. Our code is available at https://github.com/cdltlehf/LRR.
- Abstract(参考訳): 正規表現(regexes)は、入力バリデーションやデータ解析といった重要なタスクに対して、現代コンピューティングの基盤となっているが、その汎用性は、自動修復方法を必要とする脆弱性である正規表現拒否サービス(ReDoS)にシステムを公開している。
しかし、現在のアプローチはトレードオフによって妨げられている。
シンボリックなルールベースのシステムは正確だが、目に見えない、あるいは複雑な脆弱性パターンの修復に失敗する。
逆に、大きな言語モデル(LLM)は、必要な一般化性を持っているが、厳密な構文的および意味的正当性を必要とするタスクには信頼できない。
信頼性を保ちながらLLMの一般化を活用するために設計されたハイブリッドフレームワークであるローカライズされたRegex repair (LRR)を導入することで、この問題を解決する。
私たちの中核となる洞察は、修復プロセスから問題の特定を分離することです。
まず、決定論的で象徴的なモジュールは、厳密な脆弱なサブパターンをローカライズし、制約付きかつトラクタブルな問題空間を作成する。
その後、LLMは、この分離セグメントに対して意味論的に等価な修正を生成するために呼び出された。
この組み合わせアーキテクチャは、LLMのみのアプローチのセマンティックエラーを避けながら、ルールベースの修復に難渋する複雑な修復ケースをうまく解決する。
本研究は, 自動修理において, このような問題を解決するための検証手法を提供し, 最先端技術に対する修復率を15.4%向上させる。
私たちのコードはhttps://github.com/cdltlehf/LRRで公開されています。
関連論文リスト
- Semantics-Aligned, Curriculum-Driven, and Reasoning-Enhanced Vulnerability Repair Framework [15.17681731375364]
SeCuRepairは、セマンティクスに準拠し、カリキュラム駆動で、脆弱性修復のための推論強化フレームワークである。
コアとなるSeCuRepairは、理由と脆弱性の修正方法をモデルに明記する必要がある、合理的に編集されたパラダイムを採用している。
SeCuRepairはまた、従来の教師付き微調整を超えて、セマンティックス対応の強化学習を採用している。
論文 参考訳(メタデータ) (2025-10-01T15:09:27Z) - Scalable and Robust LLM Unlearning by Correcting Responses with Retrieved Exclusions [49.55618517046225]
Webスケールのコーパスリスクを記憶し、センシティブな情報を暴露する言語モデル。
本稿では,新しいアンラーニングフレームワークであるCorrective Unlearning with Retrieved Exclusions (CURE)を提案する。
CUREは、リークのモデル出力を確認し、安全な応答に修正する。
論文 参考訳(メタデータ) (2025-09-30T09:07:45Z) - CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward [50.97588334916863]
評価と結果報酬のための正確で堅牢な軽量検証モデルであるCompassVerifierを開発した。
数学、知識、多種多様な推論タスクにまたがる多分野の能力を示し、様々な答えの型を処理する能力を示す。
我々は,複数のデータソースから収集したモデル出力からなるVerifierBenchベンチマークを導入し,メタエラーパターンを手動で解析してCompassVerifierを強化する。
論文 参考訳(メタデータ) (2025-08-05T17:55:24Z) - Repairing vulnerabilities without invisible hands. A differentiated replication study on LLMs [5.10123605644148]
自動脆弱性修復(AVR: Automated Vulnerability repair)は、プログラム修復の急激な分岐である。
近年の研究では、大きな言語モデル(LLM)が従来の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2025-07-28T16:39:16Z) - Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [79.74676890436174]
本稿では,障害の局所化と修復のためのオラクルとして形式仕様を用いたDafny用のAPRツールを提案する。
プログラム内の各ステートメントの状態を決定するために、Hoareロジックの使用を含む一連のステップを通じて、障害をローカライズします。
また, GPT-4o miniが74.18%と高い修理成功率を示した。
論文 参考訳(メタデータ) (2025-07-04T15:36:12Z) - Tracing Errors, Constructing Fixes: Repository-Level Memory Error Repair via Typestate-Guided Context Retrieval [9.737526306478598]
本稿では,LLM(Large Language Models)を利用したメモリエラーの自動修復手法であるLTFixを紹介する。
提案手法では,有限型オートマトンを用いてエラー伝達経路とコンテキストトレースの追跡を誘導し,空間的(記憶状態)と時間的(実行履歴)の両方のエラー挙動をキャプチャする。
論文 参考訳(メタデータ) (2025-06-23T08:30:00Z) - SemAgent: A Semantics Aware Program Repair Agent [14.80363334219173]
SemAgentは、イシュー、コード、実行セマンティクスを利用して完全なパッチを生成する、新しいワークフローベースのプロシージャである。
我々は、(a)実行セマンティクスを活用して関連するコンテキストを検索し、(b)一般化された抽象化を通して問題セマンティクスを理解し、(c)この抽象化のコンテキスト内でコードセマンティクスを分離する、という新しいパイプラインを通してこれを実現する。
提案手法は,SWEBench-Liteベンチマークで44.66%の解率を達成し,ワークフローベースのアプローチを全て上回り,ベースラインと比較して7.66%の絶対的な改善を実現している。
論文 参考訳(メタデータ) (2025-06-19T23:27:58Z) - Repairs in a Block World: A New Benchmark for Handling User Corrections with Multi-Modal Language Models [48.42142115255159]
命令追従操作タスクにおけるマルチモーダルなTPRシーケンスのデータセットであるBlockWorld-Repairsをリリースする。
現状のビジョンと言語モデル(VLM)を複数の設定で評価し,TPRの処理能力と正確な応答性に着目した。
以上の結果から,これらのモデルはまだマルチモーダル・コラボレーティブ・セッティングにデプロイする準備が整っていないことが示唆された。
論文 参考訳(メタデータ) (2024-09-21T21:06:25Z) - NAVRepair: Node-type Aware C/C++ Code Vulnerability Repair [14.152755184229374]
NAVRepairは、ASTから抽出されたノードタイプ情報とエラータイプを組み合わせた、新しいフレームワークである。
既存のLLMベースのC/C++脆弱性修復法と比較して26%高い精度を実現している。
論文 参考訳(メタデータ) (2024-05-08T11:58:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。