論文の概要: Deep-Research Agents Can Be Poisoned via User-Generated Content
- arxiv url: http://arxiv.org/abs/2605.24245v1
- Date: Fri, 22 May 2026 21:46:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.772453
- Title: Deep-Research Agents Can Be Poisoned via User-Generated Content
- Title(参考訳): ディープリサーチエージェントはユーザー生成コンテンツを通じて課金される
- Authors: Tingwei Zhang, Harold Triedman, Vitaly Shmatikov,
- Abstract要約: ディープリサーチエージェントは、単一の研究セッション中に多くの関連するクエリを発行する。
多くの一般的な検索トピックにおいて、RedditやWikipediaのようなプラットフォームから、同じユーザ生成コンテンツ(UGC)ページを何度も取得していることを示す。
この重なり合いは集中攻撃面を生成する。
我々はこの攻撃を3つの代表的なディープリサーチシステムに対して評価する。
- 参考スコア(独自算出の注目度): 8.098290223993954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep-research agents, i.e., systems that rely on multi-agent pipelines to iteratively retrieve, synthesize, and cite Web content in order to produce structured reports, are rapidly replacing traditional search for both routine and complex information needs. These agents issue many related queries during a single research session. We show that for many common search topics, they repeatedly retrieve the same user-generated content (UGC) pages from platforms such as Reddit and Wikipedia. Next, we argue that this retrieval overlap creates a concentrated attack surface: an adversary who appends a short, crafted text to a single, frequently retrieved UGC page can cause the agent to cite attacker-chosen content and promote attacker-chosen entities across many related queries. We evaluate this attack on three representative deep-research systems (STORM, Co-STORM, and OmniThink) across multiple query clusters. We also study defenses at different stages of the pipeline, including source-level filtering and output-based detection. Our findings highlight a fundamental vulnerability in how deep-research agents retrieve and integrate web content.
- Abstract(参考訳): ディープリサーチエージェント(Deep-Research agent)、すなわち、構造化されたレポートを生成するためにWebコンテンツを反復的に検索、合成、引用するマルチエージェントパイプラインに依存するシステムは、日常的な情報と複雑な情報の両方を必要とする従来の検索を急速に置き換えている。
これらのエージェントは、単一の研究セッション中に多くの関連するクエリを発行する。
多くの一般的な検索トピックにおいて、RedditやWikipediaのようなプラットフォームから同じユーザ生成コンテンツ(UGC)ページを何度も検索する。
次に、この検索オーバーラップが集中攻撃面を生成することを論じる: 短い工芸テキストを1つのUGCページに挿入する敵は、エージェントに攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的・攻撃的
複数のクエリクラスタにわたる3つの代表的なディープリサーチシステム(STORM、Co-STORM、OmniThink)に対する攻撃を評価した。
また、ソースレベルのフィルタリングや出力ベースの検出など、パイプラインのさまざまな段階での防御についても検討する。
我々の研究は、ディープリサーチエージェントがウェブコンテンツを検索し、統合する方法の根本的な脆弱性を浮き彫りにした。
関連論文リスト
- Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics [9.25340189071758]
iAgentBenchは,クロスソース・センスメイキングのための動的ODQAベンチマークである。
iAgentBenchは、現実世界の注目信号からシードトピックを抽出し、共通のユーザ意図パターンを使用して、ユーザライクな質問を構築する。
各インスタンスには、トレース可能なエビデンスと、汚染チェックをサポートする監査可能な中間アーティファクトが付属している。
論文 参考訳(メタデータ) (2026-03-04T22:40:08Z) - Revisiting Text Ranking in Deep Research [24.324221566628125]
Black-box Web Search APIは、検索コンポーネントの体系的な分析を妨げる。
我々は、深い研究環境において、IRテキストランキング手法における重要な発見とベストプラクティスの選択を再現する。
論文 参考訳(メタデータ) (2026-02-25T00:18:07Z) - Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs [7.3517692707289415]
本稿では2つの特殊モデルからなるエージェントシステムであるFathom-DeepResearchを紹介する。
ひとつは、ライブWeb検索とターゲットWebページクエリによるエビデンスベースの調査に最適化された、DeepSearchモデルであるFathom-Search-4Bである。
2つ目は、Qwen3-4Bから訓練されたFathom-Synthesizer-4Bである。
論文 参考訳(メタデータ) (2025-09-28T22:58:11Z) - WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.58638285105971]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。
人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。
私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文 参考訳(メタデータ) (2025-09-16T17:57:21Z) - Benchmarking Deep Search over Heterogeneous Enterprise Data [73.55304268238474]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。
RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。
製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文 参考訳(メタデータ) (2025-06-29T08:34:59Z) - From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.65646344634524]
推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。
静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。
我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文 参考訳(メタデータ) (2025-06-23T17:27:19Z) - GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search [5.195873909474138]
埋め込みベースのテキスト検索x2013$retrieval from corporax2013$は、ディープラーニングを実現する強力なメソッドステートとして登場した。
しかし、埋め込みベースの検索は、悪意のあるコンテンツを宣伝する検索エンジンの敵に受け入れられる可能性がある。
論文 参考訳(メタデータ) (2024-12-30T13:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。