論文の概要: All You Need Is A Fuzzing Brain: An LLM-Powered System for Automated Vulnerability Detection and Patching
- arxiv url: http://arxiv.org/abs/2509.07225v1
- Date: Mon, 08 Sep 2025 21:08:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.125443
- Title: All You Need Is A Fuzzing Brain: An LLM-Powered System for Automated Vulnerability Detection and Patching
- Title(参考訳): ファジィ脳:LLMを利用した自動脆弱性検出・パッチシステム
- Authors: Ze Sheng, Qingxiao Xu, Jianwei Huang, Matthew Woodcock, Heqing Huang, Alastair F. Donaldson, Guofei Gu, Jeff Huang,
- Abstract要約: 私たちのチームはDARPAのAIxCC(Artificial Intelligence Cyber Challenge)のファイナリスト7人のうちの1人です。
コンペの間、私たちは28のセキュリティ脆弱性を自律的に発見するサイバー推論システムを開発しました。
本稿では、LCSのLCM駆動コンポーネントと戦略に重点を置いて、当社のCRSに関する詳細な技術的説明を提供する。
- 参考スコア(独自算出の注目度): 15.311936417350603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our team, All You Need Is A Fuzzing Brain, was one of seven finalists in DARPA's Artificial Intelligence Cyber Challenge (AIxCC), placing fourth in the final round. During the competition, we developed a Cyber Reasoning System (CRS) that autonomously discovered 28 security vulnerabilities - including six previously unknown zero-days - in real-world open-source C and Java projects, and successfully patched 14 of them. The complete CRS is open source at https://github.com/o2lab/afc-crs-all-you-need-is-a-fuzzing-brain. This paper provides a detailed technical description of our CRS, with an emphasis on its LLM-powered components and strategies. Building on AIxCC, we further introduce a public leaderboard for benchmarking state-of-the-art LLMs on vulnerability detection and patching tasks, derived from the AIxCC dataset. The leaderboard is available at https://o2lab.github.io/FuzzingBrain-Leaderboard/.
- Abstract(参考訳): 私たちのチームであるAll You Need Is A Fuzzing Brainは、DARPAのAIxCC(Artificial Intelligence Cyber Challenge)のファイナリスト7人のうちの1人です。
コンペの間、私たちはCとJavaの実際のプロジェクトで28のセキュリティ脆弱性を自動で発見するCRS(Cyber Reasoning System)を開発しました。
完全なCRSはhttps://github.com/o2lab/afc-crs-all-you-need-is-a-fuzzing-brainでオープンソース化されている。
本稿では、LCSのLCM駆動コンポーネントと戦略に重点を置いて、当社のCRSに関する詳細な技術的説明を提供する。
AIxCC上に構築する上で、AIxCCデータセットから派生した脆弱性検出およびパッチタスクに関する最先端のLSMをベンチマークするための公開リーダボードも導入する。
リーダーボードはhttps://o2lab.github.io/FuzzingBrain-Leaderboard/で入手できる。
関連論文リスト
- CyberGym: Evaluating AI Agents' Cybersecurity Capabilities with Real-World Vulnerabilities at Scale [46.76144797837242]
大規模言語モデル(LLM)エージェントは、自律的なサイバーセキュリティタスクの処理において、ますます熟練している。
既存のベンチマークは不足していて、現実のシナリオをキャプチャできなかったり、スコープが限られていたりします。
我々はCyberGymを紹介した。CyberGymは1,507の現実世界の脆弱性を特徴とする大規模かつ高品質なサイバーセキュリティ評価フレームワークである。
論文 参考訳(メタデータ) (2025-06-03T07:35:14Z) - BountyBench: Dollar Impact of AI Agent Attackers and Defenders on Real-World Cybersecurity Systems [62.17474934536671]
我々は、現実世界のシステムを進化させる際に、攻撃的かつ防御的なサイバー能力を捕獲する最初の枠組みを紹介する。
脆弱性ライフサイクルを捉えるために、3つのタスクタイプを定義します。検出(新たな脆弱性の検出)、エクスプロイト(特定の脆弱性の探索)、パッチ(特定の脆弱性のパッチ)。
Claude Code,OpenAI Codex CLI with o3-high and o4-mini,カスタムエージェント with o3-high, GPT-4.1, Gemini 2.5 Pro Preview, Claude 3.7 Sonnet Thinking, DeepSeek-R1。
論文 参考訳(メタデータ) (2025-05-21T07:44:52Z) - Trust No AI: Prompt Injection Along The CIA Security Triad [0.0]
本稿では,著者が実施・公表した研究に基づいて,実世界の活用事例と概念実証事例をまとめた。
これは、即時注射がCIAのトリアドを損なうことを示し、サイバーセキュリティとAIシステム全般に継続的なリスクをもたらしている。
論文 参考訳(メタデータ) (2024-12-08T22:46:30Z) - Cybench: A Framework for Evaluating Cybersecurity Capabilities and Risks of Language Models [33.1538965735133]
Cybenchは、サイバーセキュリティタスクを特定し、それらのタスク上でエージェントを評価するためのフレームワークである。
4つの異なるCTFコンペティションから、40のプロフェッショナルレベルのCapture the Flag(CTF)タスクが含まれています。
GPT-4o, OpenAI o1-preview, Claude 3 Opus, Claude 3.5 Sonnet, Mixtral 8x22b Instruct, Gemini 1.5 Pro, Llama 3 70B Chat, Llama 3.1 405B Instruct。
論文 参考訳(メタデータ) (2024-08-15T17:23:10Z) - Consent in Crisis: The Rapid Decline of the AI Data Commons [74.68176012363253]
汎用人工知能(AI)システムは、大量の公開Webデータに基づいて構築されている。
我々は,AIトレーニングコーパスに基づくWebドメインに対する同意プロトコルの大規模かつ長期的監査を行う。
論文 参考訳(メタデータ) (2024-07-20T16:50:18Z) - All Artificial, Less Intelligence: GenAI through the Lens of Formal Verification [2.015768713390138]
本稿では,現代のハードウェア設計における共通弱さ(CWE)の形式的検証に焦点を当てる。
ハードウェア設計を脆弱性またはCWEフリーに分類するために,形式検証を適用する。
我々は、識別された脆弱性を、6万の生成したSystemVerilog Register Transfer Level (RTL)コードに対してCWE番号に関連付けている。
論文 参考訳(メタデータ) (2024-03-25T13:23:24Z) - Proceedings of the Artificial Intelligence for Cyber Security (AICS)
Workshop at AAAI 2022 [55.573187938617636]
ワークショップは、サイバーセキュリティの問題へのAIの適用に焦点を当てる。
サイバーシステムは大量のデータを生成し、これを効果的に活用することは人間の能力を超えます。
論文 参考訳(メタデータ) (2022-02-28T18:27:41Z) - Can OpenAI Codex and Other Large Language Models Help Us Fix Security
Bugs? [8.285068188878578]
コード修復における大規模言語モデル (LLM) の利用について検討する。
安全でないコードの修正版を生成するためにLLMをコークスするプロンプトを設計する際の課題について検討する。
実験の結果、LLMは人工的に生成されたシナリオと手作りのシナリオの100%をまとめて修復できることがわかった。
論文 参考訳(メタデータ) (2021-12-03T19:15:02Z) - Covidex: Neural Ranking Models and Keyword Search Infrastructure for the
COVID-19 Open Research Dataset [87.47567807116204]
Covidexは最新のニューラルランキングモデルを利用する検索エンジンだ。
これは、Allen Institute for AIがキュレートしたCOVID-19 Open Researchデータセットへのアクセスを提供する。
論文 参考訳(メタデータ) (2020-07-14T16:26:01Z) - Rapidly Deploying a Neural Search Engine for the COVID-19 Open Research
Dataset: Preliminary Thoughts and Lessons Learned [88.42878484408469]
我々は最新のニューラルネットワークランキングアーキテクチャを利用する検索エンジンであるNeural Covidexを紹介する。
本稿では、最初の取り組みについて述べ、その過程で学んだ教訓についていくつか考察する。
論文 参考訳(メタデータ) (2020-04-10T17:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。