論文の概要: Adaptive and AI-Augmented Security Testing: A Systematic Survey of Program Analysis, Feedback-Driven Testing, and Hybrid Learning-Based Approaches
- arxiv url: http://arxiv.org/abs/2604.27000v1
- Date: Wed, 29 Apr 2026 03:32:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.710268
- Title: Adaptive and AI-Augmented Security Testing: A Systematic Survey of Program Analysis, Feedback-Driven Testing, and Hybrid Learning-Based Approaches
- Title(参考訳): Adaptive and AI-Augmented Security Testing: プログラム分析、フィードバック駆動テスト、ハイブリッド学習に基づくアプローチの体系的調査
- Authors: Michael Wienczkowski,
- Abstract要約: 本稿では,5つの領域にわたる適応型およびAI強化型セキュリティテスト研究を体系的に調査する。
我々は、4つの主要なデータベースを体系的に検索し、22,088の生記録を作成した55のピアレビュー研究を分析した。
5つのオープンな研究課題を特定し、セマンティックなフィードバック駆動の多言語セキュリティテストフレームワークのための統一的なアジェンダを概説することで、私たちは結論付けました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern software systems are increasingly developed within rapid continuous integration and deployment (CI/CD) pipelines, where ensuring security prior to release presents significant technical and organizational challenges. Traditional static and dynamic analysis tools provide valuable structural and behavioral insights, yet they often operate in non-adaptive workflows and produce large volumes of warnings requiring manual triage. Feedback-driven fuzzing and search-based testing approaches have demonstrated the power of iterative input refinement guided by execution signals, while large language models (LLMs) have shown promise in automated test generation but frequently lack semantic grounding in program structure. This paper presents a systematic survey of adaptive and AI-augmented security testing research across five domains: (1) structural program analysis for vulnerability detection, (2) DevSecOps and continuous security testing, (3) feedback-driven fuzzing and search-based testing, (4) LLM-based automated test generation, and (5) emerging hybrid systems integrating program analysis with adaptive learning. We analyze fifty-five peer-reviewed studies drawn from a systematic search of four major databases yielding 22,088 raw records. Our analysis reveals a persistent disconnect between structural program representations (ASTs, CFGs, and CPGs) and adaptive testing mechanisms. We characterize this as structural-adaptive fragmentation: a systematic separation that neither paradigm individually addresses. No existing system incorporates human triage signals as feedback for refining structural models. We conclude by identifying five open research challenges and outlining a unified agenda for semantically grounded, feedback-driven, polyglot security testing frameworks.
- Abstract(参考訳): 現代のソフトウェアシステムは、迅速な継続的インテグレーションとデプロイメント(CI/CD)パイプライン内で開発が進んでいる。
従来の静的および動的解析ツールは、貴重な構造的および行動的な洞察を提供するが、しばしば非適応的なワークフローで動作し、手動のトリアージを必要とする大量の警告を生成する。
フィードバック駆動ファジリングとサーチベーステストアプローチは、実行信号によって誘導される反復的な入力洗練の力を示す一方、大規模言語モデル(LLM)は自動テスト生成において有望であるが、プログラム構造に意味的基盤が欠如していることがしばしば示されている。
本稿では,(1)脆弱性検出のための構造的プログラム解析,(2)DevSecOpsと継続的セキュリティテスト,(3)フィードバック駆動型ファジリングと検索ベーステスト,(4)LLMに基づく自動テスト生成,(5)適応学習とプログラム解析を統合するハイブリッドシステム,の5分野にわたる適応型およびAIによるセキュリティテスト研究の体系的調査について述べる。
我々は、4つの主要なデータベースを体系的に検索し、22,088の生記録を作成した55のピアレビュー研究を分析した。
解析の結果,構造的プログラム表現(AST,CFG,CPG)と適応テスト機構の持続的切断が明らかとなった。
我々はこれを構造的適応的断片化(Structure-Adaptive fragmentation)として特徴づける。
既存のシステムは、人間のトリアージ信号を構造モデルの修正のためのフィードバックとして組み込んでいない。
5つのオープンな研究課題を特定し、セマンティックなフィードバック駆動の多言語セキュリティテストフレームワークのための統一的なアジェンダを概説することで、私たちは結論付けました。
関連論文リスト
- AI Observability for Large Language Model Systems: A Multi-Layer Analysis of Monitoring Approaches from Confidence Calibration to Infrastructure Tracing [0.0]
本稿では,近年の5つの研究成果を構造化し,AI観測可能性の新たな展望を総合的に定義する。
我々はこれらの貢献を5階層の可観測性分類に分類し、それらの重要な知見を統一された比較に合成し、未適応のままである4つの重要なギャップを同定する。
論文 参考訳(メタデータ) (2026-04-28T22:27:54Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - An Investigation on How AI-Generated Responses Affect SoftwareEngineering Surveys [3.183470571353323]
本研究では,大規模言語モデル (LLM) がソフトウェア工学のサーベイでいかに誤用されているかを考察する。
我々は2025年にProlificプラットフォームを通じて行われた2回の調査からのデータを分析した。
ソフトウェア工学のサーベイにおいて、データの真正性は新たな妥当性の次元として認識される。
論文 参考訳(メタデータ) (2025-12-19T11:17:05Z) - Large Language Models for Unit Test Generation: Achievements, Challenges, and the Road Ahead [15.43943391801509]
単体テストは、ソフトウェアの検証には不可欠だが、面倒なテクニックである。
大規模言語モデル(LLM)は、コードセマンティクスとプログラミングパターンに関するデータ駆動の知識を活用することで、この制限に対処する。
このフレームワークは、コアジェネレーティブ戦略と一連の拡張テクニックに関する文献を分析します。
論文 参考訳(メタデータ) (2025-11-26T13:30:11Z) - AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - Deep Learning Aided Software Vulnerability Detection: A Survey [3.4396557936415686]
ソフトウェア脆弱性の広範囲性は、サイバー攻撃の急増の要因として浮上している。
ディープラーニング(DL)メソッドは,コードの複雑なパターンを自動的に学習し,識別する上で優れています。
この調査は、2017年から2024年の間に、ハイインパクトな雑誌やカンファレンスから34の関連研究を分析した。
論文 参考訳(メタデータ) (2025-03-06T01:35:16Z) - Requirements-Driven Automated Software Testing: A Systematic Review [12.953746641112518]
この体系的な文献は、要求入力フォーマット、変換技術、生成されたテストアーティファクト、評価方法、一般的な制限の現状を批判的に検証する。
本研究は,機能要件,モデルベース仕様,自然言語フォーマットの優位性に注目した。
テストケース、構造化されたテキスト形式、要求カバレッジは一般的だが、完全な自動化は依然として稀である。
論文 参考訳(メタデータ) (2025-02-25T23:13:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。