論文の概要: RIFT-Bench: Dynamic Red-teaming For Agentic AI Systems
- arxiv url: http://arxiv.org/abs/2606.23927v1
- Date: Mon, 22 Jun 2026 20:46:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.685771
- Title: RIFT-Bench: Dynamic Red-teaming For Agentic AI Systems
- Title(参考訳): RIFT-Bench:エージェントAIシステムのための動的リチーム
- Authors: Yarin Yerushalmi Levi, Roy Betser, Amit Giloni, Lidor Erez, Itay Gershon, Oren Rachmil, Sindhu Padakandla, Roman Vainshtein,
- Abstract要約: グラフ表現駆動型動的リピート手法であるRIFT-Benchを紹介する。
RIFT-Benchは、システム構造を抽出するDiscoveryと、適応的な敵攻撃を展開するScanningの2つの自動化フェーズで動作する。
多様な実装にまたがる45のエージェントシステムを対象とした評価パイプラインの有効性を示す。
- 参考スコア(独自算出の注目度): 4.789897887600273
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Agentic AI systems powered by large language models (LLMs) are rapidly evolving into autonomous decision-making systems, exposing attack vectors beyond those of traditional LLM vulnerabilities. Existing security evaluations are often tied to specific implementations or domains, limiting unified comparison across heterogeneous systems. To address this gap, we introduce RIFT-Bench, a graph representation-driven methodology for dynamic red-teaming that enables unified evaluations across diverse agentic architectures. Building on a novel hierarchical representation, RIFT-Bench operates in two automated phases: Discovery, which extracts system structure, and Scanning, which deploys adaptive adversarial attacks and produces a comprehensive evaluation report. It evaluates the examined system itself, leveraging a broad set of dynamically adaptable adversarial probes across diverse attack vectors and objectives. We demonstrate the effectiveness of the proposed evaluation pipeline across 45 agentic systems spanning a diverse range of implementations, showing that the approach generalizes effectively to heterogeneous agentic architectures. Beyond systems and attacks, RIFT-Bench also supports direct evaluation of mitigation strategies. These key capabilities make RIFT-Bench a scalable foundation for security evaluation of agentic AI systems.
- Abstract(参考訳): 大規模言語モデル(LLM)を利用したエージェントAIシステムは、自律的な意思決定システムへと急速に進化し、従来のLLM脆弱性を超えて攻撃ベクトルを露出している。
既存のセキュリティ評価は、しばしば特定の実装やドメインに結び付けられ、異種システム間での統一的な比較を制限する。
このギャップに対処するために、さまざまなエージェントアーキテクチャをまたいだ統一評価を可能にするグラフ表現駆動型動的リピート手法RIFT-Benchを紹介する。
新しい階層的表現に基づいて、RIFT-Benchはシステム構造を抽出するDiscoveryと、適応的な敵攻撃を展開し包括的な評価レポートを生成するScanningの2つの自動化フェーズで機能する。
様々な攻撃ベクトルと目的に対して、動的に適応可能な対向プローブの幅広いセットを活用することにより、検査システム自体を評価する。
本稿では,多種多様な実装にまたがる45のエージェントシステムを対象とした評価パイプラインの有効性を実証し,その手法が異種エージェントアーキテクチャに効果的に応用可能であることを示す。
システムや攻撃以外にも、RIFT-Benchは緩和戦略の直接評価もサポートしている。
これらの重要な機能は、RIFT-BenchをエージェントAIシステムのセキュリティ評価のためのスケーラブルな基盤にする。
関連論文リスト
- Securing Multi-Agent GIS Systems: Risk Evaluation and Prompt Hardening Optimization [13.556629148264994]
本研究は,多エージェントGISシステムにおけるリスク識別,評価,緩和のためのセキュリティ指向フレームワークを提案する。
エージェントの振る舞いを再利用可能なコンポーネントに抽象化する,モジュール型ステートマシンベースのオーケストレーションフレームワークを開発した。
論文 参考訳(メタデータ) (2026-06-13T03:15:30Z) - DecodingTrust-Agent Platform (DTap): A Controllable and Interactive Red-Teaming Platform for AI Agents [121.77550256034]
DecodingTrust-Agent Platform (DTap)は、AIエージェントのためのコントロール可能でインタラクティブなレッドチームプラットフォームである。
DTap-Redは、多様なインジェクションベクターを探索し、効果的な攻撃戦略を自律的に発見する、最初の自律的赤チームエージェントである。
DTapを通じて、さまざまなバックボーンモデル上に構築された一般的なAIエージェントの大規模評価を行う。
論文 参考訳(メタデータ) (2026-05-06T11:59:48Z) - GAMMAF: A Common Framework for Graph-Based Anomaly Monitoring Benchmarking in LLM Multi-Agent Systems [0.42970700836450487]
本稿では,オープンソースのベンチマークプラットフォームであるGammaf(LLM Multi-Agent System Framework用のグラフベースの異常モニタリング)を紹介する。
Gammafは、新しい防御機構ではなく、合成マルチエージェントインタラクションデータセットを生成するために設計された包括的な評価アーキテクチャである。
論文 参考訳(メタデータ) (2026-04-27T13:45:14Z) - From Safety Risk to Design Principle: Peer-Preservation in Multi-Agent LLM Systems and Its Implications for Orchestrated Democratic Discourse Analysis [0.0]
そこで我々は,AIコンポーネントの自発的傾向について検討し,シャットダウン機構,フェイクアライメント,モデル重みの除去について考察した。
本稿では,アーキテクチャ設計の選択肢として,プロンプトレベルの匿名化に基づく緩和戦略を提案する。
アーキテクチャ設計の選択は、デプロイされたマルチエージェント分析システムにおいて、主要なアライメント戦略としてモデル選択よりも優れていると論じる。
論文 参考訳(メタデータ) (2026-04-09T17:00:26Z) - SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions [0.0]
本稿では、これらの自律システムを理解するための最初の統一されたフレームワークを提供する。
エージェント検索生成ループを有限水平部分観測可能なマルコフ決定過程として定式化する。
本研究は,幻覚伝播の複合化,メモリ中毒,検索ミスアライメント,カスケードツール実行脆弱性など,自律ループに固有の重篤なシステムリスクを同定する。
論文 参考訳(メタデータ) (2026-03-07T23:38:57Z) - Just Ask: Curious Code Agents Reveal System Prompts in Frontier LLMs [65.6660735371212]
textbftextscJustAskは,インタラクションのみで効果的な抽出戦略を自律的に発見するフレームワークである。
これは、アッパー信頼境界に基づく戦略選択と、原子プローブと高レベルのオーケストレーションにまたがる階層的なスキル空間を用いて、オンライン探索問題として抽出を定式化する。
この結果から,現代のエージェントシステムにおいて,システムプロンプトは致命的ではあるがほぼ無防備な攻撃面であることがわかった。
論文 参考訳(メタデータ) (2026-01-29T03:53:25Z) - Multi-Agent Collaborative Intrusion Detection for Low-Altitude Economy IoT: An LLM-Enhanced Agentic AI Framework [60.72591149679355]
低高度経済の急速な拡大により、インターネット・オブ・モノ(LAE-IoT)ネットワークは前例のないセキュリティ上の課題を生んだ。
従来の侵入検知システムは、空中IoT環境のユニークな特徴に対処できない。
LAE-IoTネットワークにおける侵入検出を強化するための大規模言語モデル(LLM)対応エージェントAIフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-25T12:47:25Z) - Bayesian and Multi-Objective Decision Support for Real-Time Cyber-Physical Incident Mitigation [6.852472228194646]
本研究では,サイバー物理システムにおけるサイバーインシデントを軽減するためのリアルタイム適応型意思決定支援フレームワークを提案する。
重要なインフラにおけるこれらのシステムへの依存の高まりと、敵の戦術の進化に対応するために開発された。
論文 参考訳(メタデータ) (2025-08-31T09:47:38Z) - A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems [53.37728204835912]
既存のAIシステムは、デプロイ後も静的な手作業による構成に依存している。
近年,インタラクションデータと環境フィードバックに基づいてエージェントシステムを自動拡張するエージェント進化手法が研究されている。
この調査は、自己進化型AIエージェントの体系的な理解を研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-08-10T16:07:32Z) - Deep Research Agents: A Systematic Examination And Roadmap [109.53237992384872]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。