論文の概要: Bit Allocation for Multi-Task Collaborative Intelligence
- arxiv url: http://arxiv.org/abs/2002.07048v1
- Date: Fri, 14 Feb 2020 02:02:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 05:15:04.872924
- Title: Bit Allocation for Multi-Task Collaborative Intelligence
- Title(参考訳): マルチタスク協調インテリジェンスのためのビット割り当て
- Authors: Saeed Ranjbar Alvar and Ivan V. Baji\'c
- Abstract要約: コラボレーションインテリジェンス(CI)は、モバイルデバイスにAIベースのサービスをデプロイするための、有望なフレームワークである。
マルチストリームマルチタスクCIのための第1ビット割当手法を提案する。
- 参考スコア(独自算出の注目度): 39.11380888887304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies have shown that collaborative intelligence (CI) is a promising
framework for deployment of Artificial Intelligence (AI)-based services on
mobile devices. In CI, a deep neural network is split between the mobile device
and the cloud. Deep features obtained at the mobile are compressed and
transferred to the cloud to complete the inference. So far, the methods in the
literature focused on transferring a single deep feature tensor from the mobile
to the cloud. Such methods are not applicable to some recent, high-performance
networks with multiple branches and skip connections. In this paper, we propose
the first bit allocation method for multi-stream, multi-task CI. We first
establish a model for the joint distortion of the multiple tasks as a function
of the bit rates assigned to different deep feature tensors. Then, using the
proposed model, we solve the rate-distortion optimization problem under a total
rate constraint to obtain the best rate allocation among the tensors to be
transferred. Experimental results illustrate the efficacy of the proposed
scheme compared to several alternative bit allocation methods.
- Abstract(参考訳): 近年の研究では、コラボレーティブ・インテリジェンス(CI)が、モバイルデバイスにAIベースのサービスを展開する上で有望なフレームワークであることが示されている。
CIでは、モバイルデバイスとクラウドの間にディープニューラルネットワークが分割される。
モバイルで得られた深い特徴は圧縮されてクラウドに転送され、推論が完了する。
これまでの文献では、モバイルからクラウドへの1つの深い機能テンソルの転送に重点を置いていた。
このような方法は、複数の分岐とスキップ接続を持つ最近の高性能ネットワークには適用できない。
本稿では,マルチストリームマルチタスクCIのための最初のビット割り当て手法を提案する。
まず,異なる深部特徴テンソルに割り当てられたビットレートの関数として,複数のタスクの結合歪みのモデルを構築した。
そこで,提案モデルを用いて,全レート制約下でのレートゆらぎ最適化問題を解き,転送するテンソルの最適レート割当を求める。
実験により,提案手法の有効性を,いくつかの代替ビット割り当て法と比較した。
関連論文リスト
- Resource Management for Low-latency Cooperative Fine-tuning of Foundation Models at the Network Edge [35.40849522296486]
大規模ファウンデーションモデル(FoMos)は、人間のような知性を実現することができる。
FoMosは微調整技術により、特定の下流タスクに適応する必要がある。
デバイスエッジ協調微調整パラダイムにおける多デバイス連携を提唱する。
論文 参考訳(メタデータ) (2024-07-13T12:47:14Z) - Sparse Interaction Additive Networks via Feature Interaction Detection
and Sparse Selection [10.191597755296163]
我々は,必要な特徴の組み合わせを効率的に識別する,抽出可能な選択アルゴリズムを開発した。
提案するスパース・インタラクション・アダプティブ・ネットワーク(SIAN)は,単純かつ解釈可能なモデルから完全に接続されたニューラルネットワークへのブリッジを構築する。
論文 参考訳(メタデータ) (2022-09-19T19:57:17Z) - Multi-Agent Collaborative Inference via DNN Decoupling: Intermediate
Feature Compression and Edge Learning [31.291738577705257]
単一エッジサーバが複数のUEの推論を調整するマルチエージェント協調推論シナリオについて検討する。
この目的を達成するために、我々はまず、大きな中間特徴を圧縮する軽量オートエンコーダベースの手法を設計する。
次に、DNNの推測オーバーヘッドに応じてタスクを定義し、マルコフ決定プロセスとして問題を定式化する。
論文 参考訳(メタデータ) (2022-05-24T07:29:33Z) - Communication-Computation Efficient Device-Edge Co-Inference via AutoML [4.06604174802643]
デバイスエッジのコ推論は、リソース制約のあるモバイルデバイスとエッジサーバの間のディープニューラルネットワークを分割する。
オンデバイスモデルスパーシリティレベルと中間特徴圧縮比は、ワークロードと通信オーバーヘッドに直接的な影響を与える。
深部強化学習(DRL)に基づく新しい自動機械学習(AutoML)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-30T06:36:30Z) - Multi-task Over-the-Air Federated Learning: A Non-Orthogonal
Transmission Approach [52.85647632037537]
複数の学習タスクがエッジサーバ(ES)の協調の下でデータ収集および学習モデルのためのエッジデバイスを共有するマルチタスク・オーバーテア・フェデレーション・ラーニング(MOAFL)フレームワークを提案する。
収束解析と数値計算の両方の結果から,MOAFLフレームワークは学習性能を著しく低下させることなく,複数のタスクのアップリンク帯域幅の消費を大幅に削減できることが示された。
論文 参考訳(メタデータ) (2021-06-27T13:09:32Z) - All at Once Network Quantization via Collaborative Knowledge Transfer [56.95849086170461]
オールオンス量子化ネットワークを効率的にトレーニングするための新しい共同知識伝達アプローチを開発しています。
具体的には、低精度の学生に知識を伝達するための高精度のエンクォータを選択するための適応的選択戦略を提案する。
知識を効果的に伝達するために,低精度の学生ネットワークのブロックを高精度の教師ネットワークのブロックにランダムに置き換える動的ブロックスワッピング法を開発した。
論文 参考訳(メタデータ) (2021-03-02T03:09:03Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Pareto-Optimal Bit Allocation for Collaborative Intelligence [39.11380888887304]
コラボレーションインテリジェンス(CI)は、人工知能(AI)ベースのサービスをモバイル/エッジデバイスにデプロイするための、有望なフレームワークとして登場した。
本稿では,マルチストリームCIシステムにおける特徴符号化のためのビット割り当てについて検討する。
論文 参考訳(メタデータ) (2020-09-25T20:48:33Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。