Fugu-MT 論文翻訳(概要): An LLM Agent for Functional Bug Detection in Network Protocols

論文の概要: An LLM Agent for Functional Bug Detection in Network Protocols

arxiv url: http://arxiv.org/abs/2506.00714v1
Date: Sat, 31 May 2025 21:13:19 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-04 21:47:33.50149
Title: An LLM Agent for Functional Bug Detection in Network Protocols
Title（参考訳）: ネットワークプロトコルにおける機能バグ検出のためのLLMエージェント
Authors: Mingwei Zheng, Chengpeng Wang, Xuwei Liu, Jinyao Guo, Shiwei Feng, Xiangyu Zhang,
Abstract要約: RFCScanは、大きな言語モデル(LLM)を利用して機能的なバグを検出する自律エージェントである。ヒトの監査手順にインスパイアされたRFCScanは、インデクシングエージェントと検出エージェントの2つの重要なコンポーネントから構成される。 RFCScanは、81.9%の精度で47の機能的バグを特定し、そのうち20のバグが開発者によって確認または修正されている。
参考スコア（独自算出の注目度）: 7.803606403370593
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Functional correctness is critical for ensuring the reliability and security of network protocol implementations. Functional bugs, instances where implementations diverge from behaviors specified in RFC documents, can lead to severe consequences, including faulty routing, authentication bypasses, and service disruptions. Detecting these bugs requires deep semantic analysis across specification documents and source code, a task beyond the capabilities of traditional static analysis tools. This paper introduces RFCScan, an autonomous agent that leverages large language models (LLMs) to detect functional bugs by checking conformance between network protocol implementations and their RFC specifications. Inspired by the human auditing procedure, RFCScan comprises two key components: an indexing agent and a detection agent. The former hierarchically summarizes protocol code semantics, generating semantic indexes that enable the detection agent to narrow down the scanning scope. The latter employs demand-driven retrieval to iteratively collect additional relevant data structures and functions, eventually identifying potential inconsistencies with the RFC specifications effectively. We evaluate RFCScan across six real-world network protocol implementations. RFCScan identifies 47 functional bugs with 81.9% precision, of which 20 bugs have been confirmed or fixed by developers.
Abstract（参考訳）: 機能的正確性は、ネットワークプロトコル実装の信頼性とセキュリティを保証するために重要である。 RFC文書で指定された動作から実装が分岐する機能的バグは、障害ルーティング、認証バイパス、サービス中断などの重大な結果をもたらす可能性がある。これらのバグを検出するには、従来の静的解析ツールの能力を超えた、仕様文書とソースコード間の深いセマンティック分析が必要である。本稿では,大規模言語モデル(LLM)を利用して,ネットワークプロトコルの実装とRFC仕様の適合性をチェックすることで,機能的バグを検出する自律エージェントRFCScanを紹介する。ヒトの監査手順にインスパイアされたRFCScanは、インデクシングエージェントと検出エージェントの2つの重要なコンポーネントから構成される。前者はプロトコルコードセマンティクスを階層的に要約し、検出エージェントがスキャン範囲を絞り込むことを可能にするセマンティクスインデックスを生成する。後者は、要求駆動の検索を使用して、追加の関連するデータ構造と関数を反復的に収集し、最終的にRFC仕様との潜在的な矛盾を効果的に識別する。 RFCScanを6つの実世界のネットワークプロトコル実装で評価する。 RFCScanは、81.9%の精度で47の機能的バグを特定し、そのうち20のバグが開発者によって確認または修正されている。

関連論文リスト

RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文参考訳（メタデータ） (2026-01-30T08:29:01Z)
Agent Identity URI Scheme: Topology-Independent Naming and Capability-Based Discovery for Multi-Agent Systems [0.0]
マルチエージェントシステムは基本的なアーキテクチャ上の欠陥に直面している。我々は、トポロジから3つのコンポーネントを通してアイデンティティを分離する Agent:// scheme を提案する。組織権限を確立する信頼根、階層的な能力パス、ソート可能なユニークな識別子は安定した参照を提供する。
論文参考訳（メタデータ） (2026-01-21T01:09:22Z)
The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。 Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文参考訳（メタデータ） (2026-01-19T11:45:39Z)
Uncovering Gaps Between RFC Updates and TCP/IP Implementations: LLM-Facilitated Differential Checks on Intermediate Representations [21.889716987837428]
プロトコルスタックコードの実装とRFC標準の間にはしばしば矛盾があります。この矛盾はプロトコル機能の違いを引き起こすだけでなく、深刻なセキュリティ上の脆弱性を引き起こす可能性がある。大規模言語モデルの台頭により、RFC文書からプロトコル仕様を抽出する方法が研究され始めている。
論文参考訳（メタデータ） (2025-10-28T13:19:46Z)
Trace: Securing Smart Contract Repository Against Access Control Vulnerability [58.02691083789239]
GitHubはソースコード、ドキュメント、設定ファイルを含む多数のスマートコントラクトリポジトリをホストしている。サードパーティの開発者は、カスタム開発中にこれらのリポジトリからコードを参照、再利用、フォークすることが多い。スマートコントラクトの脆弱性を検出する既存のツールは、複雑なリポジトリを扱う能力に制限されている。
論文参考訳（メタデータ） (2025-10-22T05:18:28Z)
VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文参考訳（メタデータ） (2025-09-15T02:25:38Z)
Decompiling Smart Contracts with a Large Language Model [51.49197239479266]
Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文参考訳（メタデータ） (2025-06-24T13:42:59Z)
CANTXSec: A Deterministic Intrusion Detection and Prevention System for CAN Bus Monitoring ECU Activations [53.036288487863786]
物理ECUアクティベーションに基づく最初の決定論的侵入検知・防止システムであるCANTXSecを提案する。 CANバスの古典的な攻撃を検知・防止し、文献では調査されていない高度な攻撃を検知する。物理テストベッド上での解法の有効性を実証し,攻撃の両クラスにおいて100%検出精度を達成し,100%のFIAを防止した。
論文参考訳（メタデータ） (2025-05-14T13:37:07Z)
Validating Network Protocol Parsers with Traceable RFC Document Interpretation [11.081773172066766]
オラクルとトレーサビリティの問題は、プロトコルの実装がいつバグがあると考えられるかを決定する。この研究はどちらも考慮し、大規模言語モデル(LLM)の最近の進歩を利用した効果的なソリューションを提供する。我々は、C、Python、Goで書かれた9つのネットワークプロトコルとその実装を使用して、我々のアプローチを広く評価してきた。
論文参考訳（メタデータ） (2025-04-25T03:39:19Z)
Large Language Models for Validating Network Protocol Parsers [8.007994733372675]
プロトコル標準は一般的に自然言語で書かれるが、実装はソースコードで書かれている。大規模言語モデル(LLM)に基づくフレームワークであるPARVALを提案する。プロトコル標準とそれらの実装の両方を、フォーマット仕様と呼ばれる統一された中間表現に変換する。実装とRFC標準の矛盾をうまく識別し、偽陽性率は5.6%と低い。
論文参考訳（メタデータ） (2025-04-18T07:09:56Z)
Benchmarking LLMs and LLM-based Agents in Practical Vulnerability Detection for Code Repositories [8.583591493627276]
JitVulは、各関数をその脆弱性導入とコミットの修正にリンクする脆弱性検出ベンチマークである。思考・行動・観察と相互言語的文脈を活用するReAct Agentsは,良性のあるコードと区別する上で,LLMよりも優れた性能を示すことを示す。
論文参考訳（メタデータ） (2025-03-05T15:22:24Z)
AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL [46.65963514391019]
AutoRestTestは、Semantic Property Dependency Graph(SPDG)とMARL(Multi-Agent Reinforcement Learning)と大規模言語モデル(LLM)を統合して、効果的なREST APIテストを可能にする新しいツールである。
論文参考訳（メタデータ） (2025-01-15T05:54:33Z)
CryptoFormalEval: Integrating LLMs and Formal Verification for Automated Cryptographic Protocol Vulnerability Detection [41.94295877935867]
我々は,新たな暗号プロトコルの脆弱性を自律的に識別する大規模言語モデルの能力を評価するためのベンチマークを導入する。私たちは、新しい、欠陥のある通信プロトコルのデータセットを作成し、AIエージェントが発見した脆弱性を自動的に検証する方法を設計しました。
論文参考訳（メタデータ） (2024-11-20T14:16:55Z)
Interaction-Aware Vulnerability Detection in Smart Contract Bytecodes [7.5121791984664625]
スマートコントラクトの脆弱性を検出するために,セマンティックコンテキストと関数インターフェースを統合したフレームワークであるCOBRAを提案する。署名データベースに存在しない関数シグネチャを推測するために,SRIFを提案する。 SRIFは関数シグネチャ推論において94.76%のF1スコアを達成可能であることを示す。 ABIがなければ、推論関数機能はエンコーダを埋め、システムは89.46%のリコール率を達成する。
論文参考訳（メタデータ） (2024-10-28T03:55:09Z)
Interactive Tools Substantially Assist LM Agents in Finding Security Vulnerabilities [46.34031902647788]
本稿では,CTF(Capture The Flag)課題を自律的に解決するLMエージェントであるEnIGMAを紹介する。セキュリティ脆弱性を発見して悪用するエージェントの能力を改善するために、新しいツールとインターフェースを導入します。 390 CTF課題に関する実証分析により,これらの新しいツールとインターフェースがエージェントの性能を大幅に向上することが示された。
論文参考訳（メタデータ） (2024-09-24T15:06:01Z)
Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。 KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。 RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文参考訳（メタデータ） (2024-09-09T13:56:22Z)
DT-SIM: Property-Based Testing for MPC Security [2.0308771704846245]
プロパティベースのテストはセキュアプロトコルのセキュリティバグの検出に有効である。セキュアマルチパーティ計算(MPC)を特に対象とする。 MPCプロトコルのビットレベル実装において,様々な欠陥を検出するテストを作成する。
論文参考訳（メタデータ） (2024-03-08T02:02:24Z)
Exploring Sequence Feature Alignment for Domain Adaptive Detection Transformers [141.70707071815653]
本稿では,検出変圧器の適応に特化して設計された新しいシーケンス特徴アライメント(SFA)法を提案する。 SFAはドメインクエリベースの機能アライメント(DQFA)モジュールとトークンワイド機能アライメント(TDA)モジュールで構成される。 3つの挑戦的なベンチマーク実験により、SFAは最先端のドメイン適応オブジェクト検出方法より優れていることが示された。
論文参考訳（メタデータ） (2021-07-27T07:17:12Z)
Enabling certification of verification-agnostic networks via memory-efficient semidefinite programming [97.40955121478716]
本稿では,ネットワークアクティベーションの総数にのみ線形なメモリを必要とする一階二重SDPアルゴリズムを提案する。 L-inf の精度は 1% から 88% ,6% から 40% に改善した。また,変分オートエンコーダの復号器に対する2次安定性仕様の厳密な検証を行った。
論文参考訳（メタデータ） (2020-10-22T12:32:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。