論文の概要: Trust-Aware Routing for Distributed Generative AI Inference at the Edge
- arxiv url: http://arxiv.org/abs/2603.28622v1
- Date: Mon, 30 Mar 2026 16:07:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.501393
- Title: Trust-Aware Routing for Distributed Generative AI Inference at the Edge
- Title(参考訳): エッジにおける分散型生成AI推論のための信頼意識ルーティング
- Authors: Chanh Nguyen, Erik Elmroth,
- Abstract要約: 本稿では,分散生成推論のための信頼度を考慮した協調フレームワークG-TRACを提案する。
G-TRACは、アルゴリズム経路選択とシステムレベルのプロトコル設計を統合し、堅牢な分散推論を保証する。
- 参考スコア(独自算出の注目度): 0.34376560669160394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emerging deployments of Generative AI increasingly execute inference across decentralized and heterogeneous edge devices rather than on a single trusted server. In such environments, a single device failure or misbehavior can disrupt the entire inference process, making traditional best-effort peer-to-peer routing insufficient. Coordinating distributed generative inference therefore requires mechanisms that explicitly account for reliability, performance variability, and trust among participating peers. In this paper, we present G-TRAC, a trust-aware coordination framework that integrates algorithmic path selection with system-level protocol design to ensure robust distributed inference. First, we formulate the routing problem as a \textit{Risk-Bounded Shortest Path} computation and introduce a polynomial-time solution that combines trust-floor pruning with Dijkstra's search, achieving sub-millisecond median routing latency at practical edge scales, and remaining below 10 ms at larger scales. Second, to operationally support the routing logic in dynamic environments, the framework employs a \textit{Hybrid Trust Architecture} that maintains global reputation state at stable anchors while disseminating lightweight updates to edge peers via background synchronization. Experimental evaluation on a heterogeneous testbed of commodity devices demonstrates that G-TRAC significantly improves inference completion rates, effectively isolates unreliable peers, and sustains robust execution even under node failures and network partitions.
- Abstract(参考訳): Generative AIの新たなデプロイメントは、単一の信頼できるサーバではなく、分散化された、異質なエッジデバイス間での推論をますます実行します。
このような環境では、単一のデバイス障害や誤動作によって推論プロセス全体が破壊され、従来のベストエフォートなピアツーピアルーティングが不十分になる。
したがって、分散生成推論のコーディネートには、信頼性、性能変数、および参加する仲間間の信頼を明示的に考慮するメカニズムが必要である。
本稿では,アルゴリズム経路選択とシステムレベルのプロトコル設計を統合し,ロバストな分散推論を保証する信頼対応協調フレームワークG-TRACを提案する。
まず、ルーティング問題を「textit{Risk-Bounded Shortest Path}」計算として定式化し、信頼床プルーニングとDijkstraの探索を組み合わせた多項式時間解を導入する。
第二に、動的環境におけるルーティングロジックを運用的にサポートするために、フレームワークは、バックグラウンド同期を通じてエッジピアに軽量な更新を分散しながら、安定したアンカーでグローバルな評価状態を維持する、‘textit{Hybrid Trust Architecture} を使用する。
商品機器の異種テストベッド上での実験評価により,G-TRACは推論完了率を大幅に向上し,信頼できないピアを効果的に分離し,ノード障害やネットワーク分割の下でも堅牢な実行を維持できることが示された。
関連論文リスト
- Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems [52.842088497389746]
この手紙は、悪意のあるジャマーの存在下での、アンチジャミングの協調推論システムに焦点を当てている。
まず、ジャミングとDNNパーティショニングがデータ回帰による推測精度に与える影響を解析する。
問題を3つのサブプロブレムに分解する,効率的な交互最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-03T03:52:52Z) - Blockchain-Enabled Routing for Zero-Trust Low-Altitude Intelligent Networks [77.17664010626726]
低高度インテリジェントネットワーク(LAIN)における複数のUAVクラスタによるルーティングに焦点を当てる。
潜在的な脅威によるダメージを最小限に抑えるため,ソフトウェア定義の周辺技術とブロックチェーン技術を用いたゼロトラストアーキテクチャを提案する。
提案手法は,平均E2E遅延を59%削減し,TSRを29%改善することを示した。
論文 参考訳(メタデータ) (2026-02-27T04:30:35Z) - A Secure and Private Distributed Bayesian Federated Learning Design [56.92336577799572]
DFL(Distributed Federated Learning)は、中央パラメータサーバを持たない大規模システム間の分散モデルトレーニングを可能にする。
DFLは、3つの重要な課題に直面している: 正直な隣人からのプライバシー漏洩、中央調整の欠如による収束の遅さ、モデルの精度の低下を目指すビザンティンの敵に対する脆弱性。
本稿では,ビザンチンの堅牢性,プライバシー保護,収束促進を統合した新しいDFLフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-23T16:12:02Z) - Reliable and Private Anonymous Routing for Satellite Constellations [1.9499120576896225]
この研究は、不安定なトポロジにおいて堅牢なセキュリティと信頼性を提供するために、Loopixmix-networkを進化させる、拡張された匿名アーキテクチャを提案する。
標準ミキシングネットワークを信頼できないような高リンクのボラティリティと断続接続に対抗するために,$(n, k)$消去符号を利用したマルチパストランスポートプロトコルを提案する。
このアーキテクチャはLEO星座の高忠実でパケットレベルのシミュレーションによって検証する。
論文 参考訳(メタデータ) (2026-02-12T09:43:55Z) - Efficient Mixture-of-Agents Serving via Tree-Structured Routing, Adaptive Pruning, and Dependency-Aware Prefill-Decode Overlap [15.352230356342366]
混合エージェント(MoA)推論は、密度の高いエージェント間通信と低いハードウェア利用に悩まされる。
本稿では,アルゴリズム・システムの共同設計を通じて,これらのボトルネックをターゲットとしたサービス設計を提案する。
論文 参考訳(メタデータ) (2025-12-19T23:06:58Z) - Robust Fully-Asynchronous Methods for Distributed Training over General Architecture [11.480605289411807]
分散機械学習問題における完全な同期は、レイテンシ、パッケージの損失、ストラグラーの存在のため、非効率であり、不可能である。
本稿では,R-FAST (Fully-Asynchronous Gradient Tracking Method) を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:36:40Z) - Design and Prototyping Distributed CNN Inference Acceleration in Edge
Computing [85.74517957717363]
HALPはエッジコンピューティングにおけるエッジデバイス(ED)間のシームレスなコラボレーションを設計することで推論を加速する。
実験により、分散推論HALPはVGG-16に対して1.7倍の推論加速を達成することが示された。
分散推論HALPを用いたモデル選択は,サービスの信頼性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-24T19:48:30Z) - Towards Higher-order Topological Consistency for Unsupervised Network
Alignment [41.763907024585926]
完全教師なしネットワークアライメントフレームワークであるHTCを提案する。
提案した高次位相整合性は、エッジ軌道に基づいて定式化される。
エンコーダはマルチビット対応に訓練され、さらに信頼性の高いアンカーリンクを特定するように洗練される。
論文 参考訳(メタデータ) (2022-08-26T07:09:13Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。