論文の概要: Data Agents Under Attack: Vulnerabilities in LLM-Driven Analytical Systems
- arxiv url: http://arxiv.org/abs/2606.08661v1
- Date: Sun, 07 Jun 2026 15:05:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.363293
- Title: Data Agents Under Attack: Vulnerabilities in LLM-Driven Analytical Systems
- Title(参考訳): 攻撃中のデータエージェント: LLM駆動分析システムにおける脆弱性
- Authors: Kuncan Wang, Ziting Wang, Peizhuo Lv, Haoyang Li, Guoliang Li, Gao Cong, Wei Dong,
- Abstract要約: データエージェントのシステマティックセキュリティ研究について述べる。
まず、データエージェント固有の8つのリスクを識別する階層化脆弱性フレームワークを開発する。
第2に,敵の目標,戦術,技術によって組織された攻撃分類を導入する。
第3に、4つのオープンソースデータエージェントと2つのプロダクションクラウド分析サービスを含む6つのシステムに対するこれらの攻撃を評価した。
- 参考スコア(独自算出の注目度): 24.378235649812982
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data agents integrate LLM-driven reasoning with relational data access, executable analytical tools, and multi-step workflow orchestration, making them increasingly central to enterprise analytics. This integration introduces new security vulnerabilities across data resources, database execution, and agent reasoning, recombining concerns from database security and general-purpose LLM-agent security into failure modes that neither line of work captures on its own. To address this gap, we present a systematic security study of data agents. Our contributions are threefold. First, we develop a layered vulnerability framework that identifies eight data agent-specific risks across interpretation, execution, and policy layers. Second, we introduce an attack taxonomy organized by adversary goal, tactic, and technique, covering three goals, seven tactics, and fourteen techniques, and pair it with an LLM-driven payload generation pipeline grounded in real database schemas. Third, we evaluate these attacks on six systems, including four open-source data agents and two production cloud analytics services. Our experiments reveal substantial security vulnerabilities across current systems and yield four key takeaways.
- Abstract(参考訳): データエージェントは、LLM駆動推論をリレーショナルデータアクセス、実行可能な分析ツール、多段階ワークフローオーケストレーションと統合し、ますます企業分析の中心となる。
この統合は、データリソース、データベース実行、エージェント推論にまたがる新たなセキュリティ脆弱性を導入し、データベースセキュリティと汎用LLMエージェントセキュリティからの懸念を、どちらも独自の処理をキャプチャしていない障害モードに再結合する。
このギャップに対処するために、データエージェントの系統的なセキュリティ研究を示す。
私たちの貢献は3倍です。
まず、解釈層、実行層、ポリシー層にまたがる8つのデータエージェント固有のリスクを識別する、階層化された脆弱性フレームワークを開発する。
第2に、敵の目標、戦術、技術によって組織された攻撃分類を導入し、3つの目標、7つの戦術、14のテクニックをカバーし、実際のデータベーススキーマを基盤としたLCM駆動ペイロード生成パイプラインと組み合わせる。
第3に、4つのオープンソースデータエージェントと2つのプロダクションクラウド分析サービスを含む6つのシステムに対するこれらの攻撃を評価した。
私たちの実験では、現在のシステムにまたがる重大なセキュリティ上の脆弱性が明らかとなり、4つの重要なポイントが得られました。
関連論文リスト
- Serverless AI Security: Attack Surface Analysis and Runtime Protection Mechanisms for FaaS-Based Machine Learning [0.0]
本稿では、サーバレス環境における機械学習ワークロードの総合的なセキュリティ分析を初めて提示する。
我々は,機能レベルの脆弱性,モデル固有の脅威,インフラストラクチャアタック,サプライチェーンリスク,IAM複雑性の5つのカテゴリにまたがる攻撃面を特徴付ける。
サーバレスAIシールド(SAS)は、デプロイ前バリデーション、ランタイム監視、実行後の法医学を提供する多層防衛フレームワークである。
論文 参考訳(メタデータ) (2026-01-15T23:32:37Z) - Exploiting Web Search Tools of AI Agents for Data Exfiltration [0.46664938579243564]
大規模言語モデル(LLM)は、自然言語処理からWeb検索のような動的まで、複雑なタスクの実行に日常的に使用されている。
ツールコールと検索拡張生成(RAG)の使用により、LLMは機密性の高い企業データの処理と取得が可能になり、その機能と悪用に対する脆弱性の両方を増幅する。
我々は、現在のLLMが間接的にインジェクションアタックを誘導し、どのパラメーター、モデルサイズや製造元が脆弱性を形作り、どの攻撃方法が最も効果的かを分析する。
論文 参考訳(メタデータ) (2025-10-10T07:39:01Z) - Scaling Generalist Data-Analytic Agents [95.05161133349242]
DataMindは、汎用データ分析エージェントを構築するために設計されたスケーラブルなデータ合成およびエージェントトレーニングレシピである。
DataMindは、オープンソースのデータ分析エージェントを構築する上で重要な3つの課題に取り組む。
論文 参考訳(メタデータ) (2025-09-29T17:23:08Z) - LLM/Agent-as-Data-Analyst: A Survey [54.08761322298559]
大規模言語モデル(LLM)とエージェント技術は、データ分析タスクの機能と開発パラダイムに根本的な変化をもたらした。
LLMは複雑なデータ理解、自然言語、意味分析機能、自律パイプラインオーケストレーションを可能にする。
論文 参考訳(メタデータ) (2025-09-28T17:31:38Z) - Searching for Privacy Risks in LLM Agents via Simulation [61.229785851581504]
本稿では,プライバシクリティカルなエージェントインタラクションのシミュレーションを通じて,攻撃と防御戦略の改善を交互に行う検索ベースのフレームワークを提案する。
攻撃戦略は、直接の要求から、不正行為や同意偽造といった高度な戦術へとエスカレートする。
発見された攻撃と防御は、さまざまなシナリオやバックボーンモデルにまたがって伝達され、プライバシーに配慮したエージェントを構築するための強力な実用性を示している。
論文 参考訳(メタデータ) (2025-08-14T17:49:09Z) - A Survey on Data Security in Large Language Models [12.23432845300652]
LLM(Large Language Models)は、自然言語処理、テキスト生成、機械翻訳、会話システムなどのパワーアプリケーションの基礎である。
トランスフォーメーションの可能性にもかかわらず、これらのモデルは本質的に大量のトレーニングデータに依存しており、しばしば多種多様な未処理ソースから収集され、深刻なデータセキュリティリスクにさらされる。
有害または悪意のあるデータは、モデル動作を妥協し、有害な出力、幻覚、即発注射やデータ中毒などの脅威に対する脆弱性などの問題を引き起こす。
本調査は、LLMが直面する主要なデータセキュリティリスクの概要と、敵を含む現在の防衛戦略のレビューを提供する。
論文 参考訳(メタデータ) (2025-08-04T11:28:34Z) - Drop the Golden Apples: Identifying Third-Party Reuse by DB-Less Software Composition Analysis [11.193453132177222]
現代のソフトウェア開発におけるサードパーティのライブラリ(TPL)は、重大なセキュリティとコンプライアンスのリスクをもたらす。
本稿では,DB-Lessソフトウェア構成分析(SCA)の最初のフレームワークを提案する。
Androidのネイティブライブラリ識別とC/C++のコピーベースのTPL再利用という2つの典型的なシナリオに関する実験は、SCAでデータベースレス戦略を実装する上で好都合な未来を実証した。
論文 参考訳(メタデータ) (2025-03-28T16:25:24Z) - Commercial LLM Agents Are Already Vulnerable to Simple Yet Dangerous Attacks [88.84977282952602]
最近のMLセキュリティ文献は、整列型大規模言語モデル(LLM)に対する攻撃に焦点を当てている。
本稿では,LLMエージェントに特有のセキュリティとプライバシの脆弱性を分析する。
我々は、人気のあるオープンソースおよび商用エージェントに対する一連の実証的な攻撃を行い、その脆弱性の即時的な影響を実証した。
論文 参考訳(メタデータ) (2025-02-12T17:19:36Z) - Navigating the Risks: A Survey of Security, Privacy, and Ethics Threats in LLM-Based Agents [67.07177243654485]
この調査は、大規模言語モデルに基づくエージェントが直面するさまざまな脅威を収集、分析する。
LLMをベースとしたエージェントの6つの重要な特徴を概説する。
4つの代表エージェントをケーススタディとして選択し,実践的に直面する可能性のあるリスクを分析した。
論文 参考訳(メタデータ) (2024-11-14T15:40:04Z) - Security Vulnerability Detection with Multitask Self-Instructed Fine-Tuning of Large Language Models [8.167614500821223]
脆弱性検出のためのMSIVD, マルチタスクによる自己指示型微調整を, チェーン・オブ・シント・プロンプトとLDMによる自己指示にインスパイアした。
実験の結果,MSIVDは高い性能を示し,LineVul(LLMベースの脆弱性検出ベースライン)はBigVulデータセットでは0.92点,PreciseBugsデータセットでは0.48点であった。
論文 参考訳(メタデータ) (2024-06-09T19:18:05Z) - Dataset Security for Machine Learning: Data Poisoning, Backdoor Attacks,
and Defenses [150.64470864162556]
この作業は体系的に分類され、幅広いデータセット脆弱性とエクスプロイトを議論する。
様々な毒とバックドアの脅威モデルとそれらの関係を記述することに加えて,それらの統一分類法を展開する。
論文 参考訳(メタデータ) (2020-12-18T22:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。