論文の概要: Route to Rome Attack: Directing LLM Routers to Expensive Models via Adversarial Suffix Optimization
- arxiv url: http://arxiv.org/abs/2604.15022v1
- Date: Thu, 16 Apr 2026 13:51:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.928461
- Title: Route to Rome Attack: Directing LLM Routers to Expensive Models via Adversarial Suffix Optimization
- Title(参考訳): ローマへのルート:逆接接尾辞最適化によるLLMルータの余剰モデルへの誘導
- Authors: Haochun Tang, Yuliang Yan, Jiahua Lu, Huaxiao Liu, Enyan Dai,
- Abstract要約: 既存のルーティング攻撃は、ホワイトボックスアクセスまたはプロンプトに依存するため、現実のブラックボックスシナリオでは効果がない。
逆接接尾辞最適化による高価なモデルにブラックボックスLLMルータを誤誘導することを目的としたR$2$Aを提案する。
複数のオープンソースおよび商用ルーティングシステムの実験により、R$2$Aは、異なる分散のクエリにおける高価なモデルへのルーティング率を大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 10.831044672402177
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cost-aware routing dynamically dispatches user queries to models of varying capability to balance performance and inference cost. However, the routing strategy introduces a new security concern that adversaries may manipulate the router to consistently select expensive high-capability models. Existing routing attacks depend on either white-box access or heuristic prompts, rendering them ineffective in real-world black-box scenarios. In this work, we propose R$^2$A, which aims to mislead black-box LLM routers to expensive models via adversarial suffix optimization. Specifically, R$^2$A deploys a hybrid ensemble surrogate router to mimic the black-box router. A suffix optimization algorithm is further adapted for the ensemble-based surrogate. Extensive experiments on multiple open-source and commercial routing systems demonstrate that {R$^2$A} significantly increases the routing rate to expensive models on queries of different distributions. Code and examples: https://github.com/thcxiker/R2A-Attack.
- Abstract(参考訳): コスト対応ルーティングは、パフォーマンスと推論コストのバランスをとるために、さまざまな機能を持つモデルにユーザクエリを動的にディスパッチする。
しかし、ルーティング戦略では、敵が常に高価な高機能モデルを選択するためにルータを操作できるという新たなセキュリティ上の懸念がもたらされる。
既存のルーティング攻撃は、ホワイトボックスアクセスまたはヒューリスティックプロンプトに依存するため、現実のブラックボックスシナリオでは効果がない。
本研究では,ブラックボックス型LCMルータを逆接接尾辞最適化により高価なモデルに誤誘導することを目的としたR$^2$Aを提案する。
具体的には、R$^2$Aはブラックボックスルータを模倣するハイブリッドアンサンブルサロゲートルータをデプロイする。
さらに、アンサンブルに基づくサロゲートにサフィックス最適化アルゴリズムを適用する。
複数のオープンソースおよび商用ルーティングシステムに対する大規模な実験により、{R$^2$A} は、異なる分散のクエリにおける高価なモデルに対するルーティング率を大幅に向上することを示した。
コードと例:https://github.com/thcxiker/R2A-Attack.com
関連論文リスト
- Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - When Routing Collapses: On the Degenerate Convergence of LLM Routers [46.01380774114097]
ユーザのコスト予算が増加するにつれて、ルータは体系的に最も有能で最も高価なモデルにデフォルトとなる。
モデルランキングを直接学習する決定対応ルータであるEquiを提案する。
RouterBenchでは、最強の先行ルータと比較して、GPT-4レベルのパフォーマンスでコストを約17%削減する。
論文 参考訳(メタデータ) (2026-02-03T12:51:55Z) - R2-Router: A New Paradigm for LLM Routing with Reasoning [58.929817721828194]
R2-は既存のルータに比べて4~5倍のコストで最先端性能を実現する。
ルータはリアクティブセレクタから故意の推論器へと進化する。
論文 参考訳(メタデータ) (2026-02-02T21:23:51Z) - xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.63494870852894]
我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文 参考訳(メタデータ) (2025-10-09T16:52:01Z) - Cost-Aware Contrastive Routing for LLMs [57.30288453580456]
我々は、プロンプトとモデルの両方を共有埋め込み空間にマッピングする軽量フレームワークであるコストスペクトルコントラストルーティング(CSCR)を紹介します。
CSCRはベースラインを一貫して上回り、精度とコストのトレードオフを最大25%改善した。
論文 参考訳(メタデータ) (2025-08-17T20:16:44Z) - Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning [27.70756702796812]
マルチLLMルーティングとアグリゲーションを逐次決定プロセスとして定式化する強化学習フレームワークである textbf Generalization-R1 を提案する。
学習を容易にするために,形式報酬と最終結果報酬と,性能とコストのバランスを最適化するための新たなコスト報酬からなる軽量なルールベース報酬を用いる。
論文 参考訳(メタデータ) (2025-06-10T17:56:45Z) - OmniRouter: Budget and Performance Controllable Multi-LLM Routing [31.60019342381251]
大規模言語モデル(LLM)は優れた性能を提供するが、かなりの計算資源を必要とし、比較的低効率で運用する。
マルチLLMサービスのための制御可能なルーティングフレームワークであるOmniを紹介する。
実験の結果、Omniは応答精度を最大6.30%改善し、同時に計算コストを少なくとも10.15%削減した。
論文 参考訳(メタデータ) (2025-02-27T22:35:31Z) - MasRouter: Learning to Route LLMs for Multi-Agent Systems [14.029698552632107]
LLM(Large Language Models)をベースとしたマルチエージェントシステムは,LLM機能の境界を推し進めることが実証されている。
現在のルーティング手法は、クエリ毎にLLM選択をカスタマイズすることで、単一エージェントシナリオのオーバーヘッドを効果的に削減する。
まず、MASのすべてのコンポーネントを統一的なルーティングフレームワークに統合するマルチエージェントルーティングシステム(MASR)の問題を紹介する。
Mas is a high-perform, achieve a $1.8%sim8.2%$ improve over the state-of-the-art method on MBPP; 2) Economical, reduce overhead to up 52.07%$ than S.
論文 参考訳(メタデータ) (2025-02-16T14:00:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。