論文の概要: SecureRouter: Encrypted Routing for Efficient Secure Inference
- arxiv url: http://arxiv.org/abs/2604.15499v1
- Date: Thu, 16 Apr 2026 20:18:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.641885
- Title: SecureRouter: Encrypted Routing for Efficient Secure Inference
- Title(参考訳): SecureRouter: 効率的なセキュア推論のための暗号化ルーティング
- Authors: Yukuan Zhang, Mengxin Zheng, Qian Lou,
- Abstract要約: 本稿では、エンドツーエンドの暗号化ルーティングおよび推論フレームワークであるSecure Inferenceを紹介する。
Secureは遅延を1.95倍に減らし、精度の低下を無視できる。
- 参考スコア(独自算出の注目度): 18.40709699874288
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cryptographically secure neural network inference typically relies on secure computing techniques such as Secure Multi-Party Computation (MPC), enabling cloud servers to process client inputs without decrypting them. Although prior privacy-preserving inference systems co-design network optimizations with MPC, they remain slow and costly, limiting real-world deployment. A major bottleneck is their use of a single, fixed transformer model for all encrypted inputs, ignoring that different inputs require different model sizes to balance efficiency and accuracy. We present SecureRouter, an end-to-end encrypted routing and inference framework that accelerates secure transformer inference through input-adaptive model selection under encryption. SecureRouter establishes a unified encrypted pipeline that integrates a secure router with an MPC-optimized model pool, enabling coordinated routing, inference, and protocol execution while preserving full data and model confidentiality. The framework includes training-phase and inference-phase components: an MPC-cost-aware secure router that predicts per-model utility and cost from encrypted features, and an MPC-optimized model pool whose architectures and quantization schemes are co-trained to minimize MPC communication and computation overhead. Compared to prior work, SecureRouter achieves a latency reduction by 1.95x with negligible accuracy loss, offering a practical path toward scalable and efficient secure AI inference. Our open-source implementation is available at: https://github.com/UCF-ML-Research/SecureRouter
- Abstract(参考訳): 暗号化的にセキュアなニューラルネットワーク推論は一般的に、セキュアなマルチパーティ計算(MPC)のようなセキュアな計算技術に依存しているため、クラウドサーバはそれらを復号することなくクライアント入力を処理できる。
従来のプライバシ保護推論システムは、MPCとネットワーク最適化を共同設計するが、それらは遅くてコストがかかり、実際のデプロイメントが制限される。
主要なボトルネックは、すべての暗号化された入力に対して単一の固定されたトランスフォーマーモデルを使用することであり、効率と精度のバランスをとるために異なる入力が異なるモデルサイズを必要とすることを無視している。
我々はSecureRouterを提案する。SecureRouterはエンドツーエンドの暗号化ルーティングおよび推論フレームワークで、暗号化下での入力適応モデル選択によってセキュアなトランスフォーマー推論を高速化する。
SecureRouterは、セキュアなルータとMPC最適化モデルプールを統合し、完全なデータとモデルの機密性を保ちながら、協調的なルーティング、推論、プロトコルの実行を可能にする、統一された暗号化パイプラインを確立する。
このフレームワークには、トレーニングフェーズと推論フェーズのコンポーネントが含まれており、モデル毎の実用性とコストを暗号化機能から予測するMPCコスト対応セキュアルータと、MPC通信と計算オーバーヘッドを最小限に抑えるためにアーキテクチャと量子化スキームを併用したMPC最適化モデルプールである。
以前の作業と比較すると、SecureRouterは無視できる精度損失で1.95倍のレイテンシ削減を実現しており、スケーラブルで効率的なセキュアなAI推論への実践的なパスを提供する。
私たちのオープンソース実装は、https://github.com/UCF-ML-Research/SecureRouterで利用可能です。
関連論文リスト
- Design and Optimization of Cloud Native Homomorphic Encryption Workflows for Privacy-Preserving ML Inference [0.0]
ホモモルフィック暗号化(HE)は、暗号化されたデータに対する暗号計算を可能にする魅力的な技術として登場した。
大規模クラウドネイティブパイプラインにおけるHEの統合は、高い計算オーバーヘッド、オーケストレーションの複雑さ、モデル互換性の問題によって制限されている。
本稿では、プライバシML推論をサポートするクラウドネイティブな同型暗号化の設計と最適化のための体系的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-28T15:13:32Z) - How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。
DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文 参考訳(メタデータ) (2025-03-20T19:52:30Z) - The Communication-Friendly Privacy-Preserving Machine Learning against Malicious Adversaries [14.232901861974819]
プライバシー保護機械学習(PPML)は、機密情報を保護しながらセキュアなデータ分析を可能にする革新的なアプローチである。
セキュアな線形関数評価のための効率的なプロトコルを導入する。
我々は、このプロトコルを拡張して、線形層と非線形層を扱い、幅広い機械学習モデルとの互換性を確保する。
論文 参考訳(メタデータ) (2024-11-14T08:55:14Z) - SLIP: Securing LLMs IP Using Weights Decomposition [3.097016309594195]
クラウドベースのデプロイメントのコストが高いことから、エッジデバイス上でモデルを実行することへの関心が高まっている。
本稿では,エッジデプロイされたモデルを盗難から保護するために設計されたハイブリッド推論アルゴリズムSLIPを紹介する。
論文 参考訳(メタデータ) (2024-07-15T16:37:55Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - SOCI^+: An Enhanced Toolkit for Secure OutsourcedComputation on Integers [50.608828039206365]
本稿では,SOCIの性能を大幅に向上させるSOCI+を提案する。
SOCI+は、暗号プリミティブとして、高速な暗号化と復号化を備えた(2, 2)ホールドのPaillier暗号システムを採用している。
実験の結果,SOCI+は計算効率が最大5.4倍,通信オーバヘッドが40%少ないことがわかった。
論文 参考訳(メタデータ) (2023-09-27T05:19:32Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Harnessing Wireless Channels for Scalable and Privacy-Preserving
Federated Learning [56.94644428312295]
無線接続は、フェデレートラーニング(FL)の実現に有効である
Channel randomnessperturbs 各ワーカはモデル更新をインバージョンし、複数のワーカはバンド幅に大きな干渉を発生させる。
A-FADMMでは、すべてのワーカーがモデル更新をアナログ送信を介して単一のチャンネルを使用してパラメータサーバにアップロードする。
これは通信帯域幅を節約するだけでなく、各ワーカーの正確なモデル更新軌跡を任意の盗聴者から隠蔽する。
論文 参考訳(メタデータ) (2020-07-03T16:31:15Z) - CryptoSPN: Privacy-preserving Sum-Product Network Inference [84.88362774693914]
総生産ネットワーク(SPN)のプライバシ保護のためのフレームワークを提案する。
CryptoSPNは、中規模のSPNに対して秒の順序で高効率で正確な推論を行う。
論文 参考訳(メタデータ) (2020-02-03T14:49:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。