論文の概要: When Efficiency Backfires: Cascading LLMs Trigger Cascade Failure under Adversarial Attack
- arxiv url: http://arxiv.org/abs/2605.17288v1
- Date: Sun, 17 May 2026 06:59:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.832033
- Title: When Efficiency Backfires: Cascading LLMs Trigger Cascade Failure under Adversarial Attack
- Title(参考訳): LLMのカスケード・トリガー・カスケードは敵の攻撃で失敗する
- Authors: Zehan Sun, Dingfan Chen, Songze Li,
- Abstract要約: 大規模言語モデル (LLM) のカスケードシステムは、クエリを軽量モデルで処理することで効率と性能のバランスをとるように設計されている。
しかし、カスケード設計では、拡張された攻撃面を通じて新たな脆弱性が導入されている。
本研究は,LSMカスケード系が標的対向操作に感受性があることを実証する最初の研究である。
- 参考スコア(独自算出の注目度): 22.372592967659244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Model (LLM) cascade systems are designed to balance efficiency and performance by processing queries with lightweight models while selectively escalating complex cases to more powerful ones. Such systems seek to reduces computational cost and latency while maintaining task performance, making it an appealing choice for large-scale deployment. However, the cascade design introduces new vulnerabilities through an expanded attack surface: the inclusion of lightweight front-end models and internal decision mechanisms introduces new weaknesses. In this work, we present the first study demonstrating that LLM cascade systems are susceptible to targeted adversarial manipulation, which disrupts both performance objectives and the intended cost advantages of the cascade design. We propose a novel attack framework that employs constrained sequential collaborative optimization of adversarial suffix under cascade dependencies, enabling simultaneous exploitation of lightweight models and decision mechanisms. This framework adapts to adversaries with varying capabilities, inducing controllable degradation in both cost-efficiency and accuracy. Unlike prior attacks targeting standalone models, our approach strategically leverages the cascade structure to achieve significantly stronger impact. Extensive experiments across diverse datasets and representative LLM cascade systems validate the practicality and severity of this attack. Our findings highlight the urgent need to rigorously scrutinize the security of LLM cascade systems and call for broader attention to the systemic risks inherent in such designs.
- Abstract(参考訳): 大きな言語モデル(LLM)カスケードシステムは、複雑なケースをより強力なケースに選択的にエスカレートしながら、軽量モデルでクエリを処理することで効率と性能のバランスをとるように設計されている。
このようなシステムは、タスク性能を維持しながら、計算コストとレイテンシを低減し、大規模デプロイメントにとって魅力的な選択である。
しかし、カスケード設計では攻撃面の拡張によって新たな脆弱性が導入され、軽量なフロントエンドモデルと内部決定機構が組み込まれ、新たな弱点がもたらされる。
本研究は,LLMカスケードシステムにおいて,性能目標とカスケード設計のコスト面の利点を損なうような,対向的操作を対象とするシステムの影響を受けやすいことを示す最初の研究である。
本稿では,カスケード依存下での逆接接尾辞の逐次的協調最適化を利用して,軽量モデルと意思決定機構の同時利用を可能にする新しい攻撃フレームワークを提案する。
このフレームワークは様々な能力を持つ敵に適応し、コスト効率と精度の両方で制御可能な劣化を引き起こす。
スタンドアローンモデルをターゲットにした以前の攻撃とは異なり、我々のアプローチはカスケード構造を戦略的に活用し、より強力な影響をもたらす。
多様なデータセットと代表的なLCMカスケードシステムにわたる大規模な実験により、この攻撃の実用性と深刻さが検証された。
本研究は,LLMカスケードシステムのセキュリティを徹底的に精査し,そのような設計に内在するシステム的リスクに対して,より広範な注意を喚起する緊急の必要性を浮き彫りにするものである。
関連論文リスト
- AHD Agent: Agentic Reinforcement Learning for Automatic Heuristic Design [5.7547035595428255]
AHD(Automatic Design)は、NP-hard最適化問題を解決するための有望なパラダイムとして登場した。
既存のAHDフレームワークは通常、固定されたコンテキスト内で大きな言語モデル(LLM)を受動的ジェネレータとして扱う。
本稿では,新たなツール統合多ターンフレームワークであるAHD Agentを提案する。
論文 参考訳(メタデータ) (2026-05-09T07:36:45Z) - When Safe Models Merge into Danger: Exploiting Latent Vulnerabilities in LLM Fusion [15.004295056225002]
モデルマージは、追加の訓練コストなしで複数の微調整 LLM の特殊能力を組み合わせるための強力な技術として登場した。
私たちはTrojanMergeというフレームワークを紹介します。これは、潜伏する悪意のあるコンポーネントをソースモデルに埋め込むフレームワークで、個別に良性のままですが、マージ時にひどいミスアライメントモデルを生成します。
論文 参考訳(メタデータ) (2026-04-01T08:32:46Z) - ResMAS: Resilience Optimization in LLM-based Multi-agent Systems [37.355345383912756]
大規模言語モデルに基づくマルチエージェントシステム(LLMベースMAS)
LLMベースのMASは一般的に異なるデバイスや環境に分散しており、エージェント障害などの摂動に弱い。
摂動下でのMASのレジリエンスについて検討し、通信トポロジと迅速な設計の両方がシステムのレジリエンスに大きく影響していることを見出した。
論文 参考訳(メタデータ) (2026-01-08T08:03:37Z) - Exploiting Edge Features for Transferable Adversarial Attacks in Distributed Machine Learning [54.26807397329468]
この研究は、分散ディープラーニングシステムにおいて、これまで見過ごされていた脆弱性を探究する。
中間的特徴をインターセプトする敵は、依然として深刻な脅威となる可能性がある。
本稿では,分散環境に特化して設計されたエクスプロイト戦略を提案する。
論文 参考訳(メタデータ) (2025-07-09T20:09:00Z) - Model Hemorrhage and the Robustness Limits of Large Language Models [119.46442117681147]
大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。
この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文 参考訳(メタデータ) (2025-03-31T10:16:03Z) - MMAD-Purify: A Precision-Optimized Framework for Efficient and Scalable Multi-Modal Attacks [21.227398434694724]
我々は,攻撃フレームワークの有効性を高めるために,精度最適化ノイズ予測器を組み込んだ革新的なフレームワークを導入する。
当社のフレームワークは,マルチモーダル攻撃に対する最先端のソリューションを提供し,レイテンシの低減を実現している。
本研究の枠組みは, 浄化防御に対する優れた伝達性と堅牢性を実現することを実証する。
論文 参考訳(メタデータ) (2024-10-17T23:52:39Z) - Expressive and Generalizable Low-rank Adaptation for Large Models via Slow Cascaded Learning [55.5715496559514]
LoRA Slow Cascade Learning (LoRASC)は、LoRAの表現性と一般化能力を高めるために設計された革新的な技術である。
提案手法は,混合低ランク適応を可能にするカスケード学習戦略により表現性を増強し,複雑なパターンをキャプチャするモデルの能力を高める。
論文 参考訳(メタデータ) (2024-07-01T17:28:59Z) - RigorLLM: Resilient Guardrails for Large Language Models against Undesired Content [62.685566387625975]
現在の緩和戦略は効果はあるものの、敵の攻撃下では弾力性がない。
本稿では,大規模言語モデルのための弾力性ガードレール(RigorLLM)について紹介する。
論文 参考訳(メタデータ) (2024-03-19T07:25:02Z) - Embodied Laser Attack:Leveraging Scene Priors to Achieve Agent-based Robust Non-contact Attacks [13.726534285661717]
本稿では,非接触レーザー攻撃を動的に調整する新しい枠組みであるEmbodied Laser Attack (ELA)を紹介する。
認識モジュールのために,ERAは交通シーンの本質的な事前知識に基づいて,局所的な視点変換ネットワークを革新的に開発してきた。
決定と制御モジュールのために、ERAは時間を要するアルゴリズムを採用する代わりに、データ駆動の強化学習で攻撃エージェントを訓練する。
論文 参考訳(メタデータ) (2023-12-15T06:16:17Z) - Covert Model Poisoning Against Federated Learning: Algorithm Design and
Optimization [76.51980153902774]
フェデレーテッド・ラーニング(FL)はパラメータ伝達中にFLモデルに対する外部攻撃に対して脆弱である。
本稿では,最先端の防御アグリゲーション機構に対処する有効なMPアルゴリズムを提案する。
実験の結果,提案したCMPアルゴリズムは,既存の攻撃機構よりも効果的で,かなり優れていることが示された。
論文 参考訳(メタデータ) (2021-01-28T03:28:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。