論文の概要: Led to Mislead: Adversarial Content Injection for Attacks on Neural Ranking Models
- arxiv url: http://arxiv.org/abs/2605.01591v1
- Date: Sat, 02 May 2026 19:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.843148
- Title: Led to Mislead: Adversarial Content Injection for Attacks on Neural Ranking Models
- Title(参考訳): Led to Mislead: ニューラルネットワークのランク付けモデルによる攻撃に対する敵対的コンテンツインジェクション
- Authors: Amin Bigdeli, Amir Khosrojerdi, Radin Hamidi Rad, Morteza Zihayat, Charles L. A. Clarke, Ebrahim Bagheri,
- Abstract要約: CRAFTは、大規模言語モデル(LLM)を利用したブラックボックスランク攻撃の監視フレームワークである。
セマンティックな忠実さを維持しながら高い昇進率とランクアップを達成することで、最先端のベースラインを上回ります。
この研究は、ランク操作における生成AIのリスクを強調し、より堅牢な検索システムを開発するための基盤を提供する。
- 参考スコア(独自算出の注目度): 17.398369313076053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural Ranking Models (NRMs) are central to modern information retrieval but remain highly vulnerable to adversarial manipulation. Existing attacks often rely on heuristics or surrogate models, limiting effectiveness and transferability. We propose CRAFT, a supervised framework for black-box adversarial rank attacks powered by large language models (LLMs). CRAFT operates in three stages: adversarial dataset generation via retrieval-augmented generation and self-refinement, supervised fine-tuning on curated adversarial examples, and preference-guided optimization to align generations with rank-promotion objectives. Extensive experiments on the MS MARCO passage dataset, TREC Deep Learning 2019, and TREC Deep Learning 2020 benchmarks show that CRAFT significantly outperforms state-of-the-art baselines, achieving higher promotion rates and rank boosts while preserving fluency and semantic fidelity. Moreover, CRAFT transfers effectively across diverse ranking architectures, including cross-encoder, embedding-based, and LLM-based rankers, underscoring vulnerabilities in real-world retrieval systems. This work provides a principled framework for studying adversarial threats in NRMs, underscores the risks of generative AI in rank manipulation, and provides a foundation for developing more robust retrieval systems. To support reproducibility, we publicly release our source code, trained models, and prompt templates.
- Abstract(参考訳): ニューラルランク付けモデル(NRM)は、現代の情報検索の中心であるが、敵の操作に対して非常に脆弱である。
既存の攻撃は、しばしばヒューリスティックやサロゲートモデルに依存し、有効性と転送可能性を制限する。
CRAFTは,大規模言語モデル(LLM)を利用したブラックボックス逆行攻撃のための教師付きフレームワークである。
CRAFTは、検索強化された生成と自己精製による敵対的データセット生成、キュレートされた敵の例に基づく微調整の監督、ランク・プロモーションの目的と世代を整合させる優先誘導最適化の3段階で動作する。
MS MARCOパスデータセット、TREC Deep Learning 2019、TREC Deep Learning 2020ベンチマークの大規模な実験は、CRAFTが最先端のベースラインを著しく上回り、高い昇進率とランクアップを達成すると同時に、流感とセマンティックフィデリティを保っていることを示している。
さらに、CRAFTは、クロスエンコーダ、埋め込みベース、LLMベースのローダを含む多様なランキングアーキテクチャを効果的に移行し、現実世界の検索システムにおける脆弱性を裏付ける。
この研究は、NRMにおける敵の脅威を研究するための原則化されたフレームワークを提供し、ランク操作における生成AIのリスクを浮き彫りにし、より堅牢な検索システムを開発するための基盤を提供する。
再現性をサポートするため、ソースコード、トレーニング済みモデル、プロンプトテンプレートを公開しています。
関連論文リスト
- Weak-Driven Learning: How Weak Agents make Strong Agents Stronger [46.50703640719333]
WMSS(Weak Agents Can Make Strong Agents Stronger)は、弱いチェックポイントを利用して継続的な最適化を導くポストトレーニングのパラダイムである。
数学的推論とコード生成データセットの実験は、我々のアプローチで訓練されたエージェントが効果的なパフォーマンス向上を達成することを示す。
論文 参考訳(メタデータ) (2026-02-09T02:50:40Z) - RAGRank: Using PageRank to Counter Poisoning in CTI LLM Pipelines [0.9144793163215507]
Retrieval-Augmented Generation (RAG) は、サイバー脅威情報システムにおけるLLM(Large Language Model)の使用を運用するための主要なアーキテクチャパターンとして登場した。
コーパスにソース信頼性アルゴリズムを適用することにより,現代のRAG防御の堅牢性を向上できることを示す。
論文 参考訳(メタデータ) (2025-10-23T17:43:00Z) - Automatic Speech Recognition in the Modern Era: Architectures, Training, and Evaluation [0.0]
音声認識は、ディープラーニングの進歩によって、過去10年間に大きく変化してきた。
この調査は、従来のハイブリッドシステムから、現在支配的なエンドツーエンドのニューラルアーキテクチャへの進化をグラフ化して、ASRの現代を包括的に概観する。
論文 参考訳(メタデータ) (2025-10-11T05:38:45Z) - Graph Representation-based Model Poisoning on Federated Large Language Models [3.5233863453805143]
フェデレートされた大規模言語モデル(FedLLMs)は、データのプライバシを保持しながら、無線ネットワーク内で強力な生成機能を実現する。
本稿では,FedLLMのモデル中毒技術と既存の防御機構の最近の進歩について概説する。
さらに、グラフ表現に基づくモデル中毒(GRMP)は、良質なクライアント勾配間の高次相関を利用して、悪意ある更新を正当なものと区別できないものにする新興攻撃パラダイムである。
論文 参考訳(メタデータ) (2025-07-02T13:20:52Z) - Adversarial Training for Defense Against Label Poisoning Attacks [53.893792844055106]
ラベル中毒攻撃は機械学習モデルに重大なリスクをもたらす。
本稿では,これらの脅威に対処するために,サポートベクトルマシン(SVM)に基づく新たな対角的防御戦略を提案する。
提案手法は, 様々なモデルアーキテクチャに対応し, カーネルSVMを用いた予測勾配降下アルゴリズムを用いて, 対向学習を行う。
論文 参考訳(メタデータ) (2025-02-24T13:03:19Z) - Transferable Adversarial Attacks on SAM and Its Downstream Models [87.23908485521439]
本稿では,セグメント・アプライス・モデル(SAM)から微調整した様々な下流モデルに対する敵攻撃の可能性について検討する。
未知のデータセットを微調整したモデルに対する敵攻撃の有効性を高めるために,ユニバーサルメタ初期化(UMI)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-26T15:04:04Z) - Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients [20.941908494137806]
本稿では,データ駆動型数式発見の堅牢性と解釈可能性を高めるために,新しい記号回帰手法を提案する。
我々の研究は、データ固有の式生成器の学習に焦点を当てた、一般的なDSRフレームワークと一致しています。
論文 参考訳(メタデータ) (2024-06-10T19:29:10Z) - RigorLLM: Resilient Guardrails for Large Language Models against Undesired Content [62.685566387625975]
現在の緩和戦略は効果はあるものの、敵の攻撃下では弾力性がない。
本稿では,大規模言語モデルのための弾力性ガードレール(RigorLLM)について紹介する。
論文 参考訳(メタデータ) (2024-03-19T07:25:02Z) - Black-box Adversarial Attacks against Dense Retrieval Models: A
Multi-view Contrastive Learning Method [115.29382166356478]
本稿では,敵探索攻撃(AREA)タスクを紹介する。
DRモデルは、DRモデルによって取得された候補文書の初期セットの外側にあるターゲット文書を取得するように、DRモデルを騙すことを目的としている。
NRM攻撃で報告された有望な結果は、DRモデルに一般化されない。
マルチビュー表現空間における対照的な学習問題として,DRモデルに対する攻撃を形式化する。
論文 参考訳(メタデータ) (2023-08-19T00:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。