Fugu-MT 論文翻訳(概要): COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

論文の概要: COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

arxiv url: http://arxiv.org/abs/2603.10436v1
Date: Wed, 11 Mar 2026 05:38:00 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-21 18:33:56.663592
Title: COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints
Title（参考訳）: COHORT: リアルタイム制約下でのマルチロボットシステム上での協調的大DNN推論のためのハイブリッドRL
Authors: Mohammad Saeid Anwar, Anuradha Ravi, Indrajeet Ghosh, Gaurav Shinde, Carl Busart, Nirmalya Roy,
Abstract要約: 大規模ディープニューラルネットワーク(DNN)は、計算的に要求され、フィールドロボットのようなリソース制約のあるエッジプラットフォームにデプロイすることを困難にしている。ロボットオペレーティングシステム(ROS)上に構築されたマルチロボットシステムのための協調的DNN推論とタスク実行フレームワークCOHORTを提案する。実験の結果、COHORTはバッテリ消費を15.4%削減し、GPU使用率を51.67%向上し、フレームレートと期限の制約を2.55倍に満たした。
参考スコア（独自算出の注目度）: 0.769672852567215
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large deep neural networks (DNNs), especially transformer-based and multimodal architectures, are computationally demanding and challenging to deploy on resource-constrained edge platforms like field robots. These challenges intensify in mission-critical scenarios (e.g., disaster response), where robots must collaborate under tight constraints on bandwidth, latency, and battery life, often without infrastructure or server support. To address these limitations, we present COHORT, a collaborative DNN inference and task-execution framework for multi-robot systems built on the Robotic Operating System (ROS). COHORT employs a hybrid offline-online reinforcement learning (RL) strategy to dynamically schedule and distribute DNN module execution across robots. Our key contributions are threefold: (a) Offline RL policy learning combined with Advantage-Weighted Regression (AWR), trained on auction-based task allocation data from heterogeneous DNN workloads across distributed robots, (b) Online policy adaptation via Multi-Agent PPO (MAPPO), initialized from the offline policy and fine-tuned in real time, and (c) comprehensive evaluation of COHORT on vision-language model (VLM) inference tasks such as CLIP and SAM, analyzing scalability with increasing robot/workload and robustness under . We benchmark COHORT against genetic algorithms and multiple RL baselines. Experimental results demonstrate that COHORT reduces battery consumption by 15.4% and increases GPU utilization by 51.67%, while satisfying frame-rate and deadline constraints 2.55 times of the time.
Abstract（参考訳）: 大規模ディープニューラルネットワーク(DNN)、特にトランスフォーマーベースおよびマルチモーダルアーキテクチャは、計算的に要求され、フィールドロボットのようなリソース制約のあるエッジプラットフォームにデプロイすることを困難にしている。これらの課題はミッションクリティカルなシナリオ(災害対応など)を強化し、ロボットは、しばしばインフラストラクチャやサーバのサポートなしで、帯域幅、レイテンシ、バッテリ寿命の厳しい制約の下で協力する必要がある。ロボットオペレーティングシステム(ROS)上に構築されたマルチロボットシステムのための協調的DNN推論およびタスク実行フレームワークであるCOHORTを提案する。 COHORTは、ロボット間でDNNモジュールの実行を動的にスケジュールし、分散するために、ハイブリッドオフラインオンライン強化学習(RL)戦略を採用している。私たちの重要な貢献は3つあります。 (a)オフラインRLポリシー学習とAdvantage-Weighted Regression(AWR)を組み合わせることで、分散ロボット間の異種DNNワークロードからのオークションベースのタスク割り当てデータをトレーニングする。ロマルチエージェントPPO(MAPPO)によるオンライン政策適応(オフライン方針から初期化してリアルタイムに微調整) (c)CLIPやSAMのような視覚言語モデル(VLM)推論タスクにおけるCOHORTの包括的評価、ロボット/作業負荷の増加によるスケーラビリティの分析、.NETでの堅牢性。遺伝的アルゴリズムと複数のRLベースラインに対してCOHORTをベンチマークする。実験の結果、COHORTはバッテリ消費を15.4%削減し、GPU使用率を51.67%向上し、フレームレートと期限の制約を2.55倍に満たした。

論文の概要: COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

関連論文リスト