Fugu-MT 論文翻訳(概要): SC2 Benchmark: Supervised Compression for Split Computing

論文の概要: SC2 Benchmark: Supervised Compression for Split Computing

arxiv url: http://arxiv.org/abs/2203.08875v2
Date: Wed, 14 Jun 2023 17:59:07 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-17 04:22:20.911070
Title: SC2 Benchmark: Supervised Compression for Split Computing
Title（参考訳）: SC2ベンチマーク:スプリットコンピューティングの圧縮を改善
Authors: Yoshitomo Matsubara, Ruihan Yang, Marco Levorato, Stephan Mandt
Abstract要約: 本研究では,スプリットコンピューティング(SC2)の教師付き圧縮について紹介し,新しい評価基準を提案する。 10のベースライン手法,3つのコンピュータビジョンタスク,180以上のトレーニングモデルを用いた総合的なベンチマーク研究を行う。提案したメトリクスとパッケージは、スプリットコンピューティングにおける教師あり圧縮のトレードオフをよりよく理解するのに役立ちます。
参考スコア（独自算出の注目度）: 21.7175821221294
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the increasing demand for deep learning models on mobile devices, splitting neural network computation between the device and a more powerful edge server has become an attractive solution. However, existing split computing approaches often underperform compared to a naive baseline of remote computation on compressed data. Recent studies propose learning compressed representations that contain more relevant information for supervised downstream tasks, showing improved tradeoffs between compressed data size and supervised performance. However, existing evaluation metrics only provide an incomplete picture of split computing. This study introduces supervised compression for split computing (SC2) and proposes new evaluation criteria: minimizing computation on the mobile device, minimizing transmitted data size, and maximizing model accuracy. We conduct a comprehensive benchmark study using 10 baseline methods, three computer vision tasks, and over 180 trained models, and discuss various aspects of SC2. We also release sc2bench, a Python package for future research on SC2. Our proposed metrics and package will help researchers better understand the tradeoffs of supervised compression in split computing.
Abstract（参考訳）: モバイルデバイスのディープラーニングモデルに対する需要が高まっているため、デバイスとより強力なエッジサーバの間のニューラルネットワーク計算の分割は魅力的なソリューションとなっている。しかし、既存の分割コンピューティングアプローチは、圧縮されたデータに対する遠隔計算の単純なベースラインに比べて性能が劣ることが多い。最近の研究では、教師付き下流タスクの関連情報を含む圧縮表現の学習を提案し、圧縮されたデータサイズと教師付きパフォーマンスのトレードオフを改善した。しかし、既存の評価指標は分割計算の不完全な図のみを提供する。本研究では,スプリットコンピューティング(SC2)の教師付き圧縮を導入し,モバイルデバイス上での計算の最小化,送信データサイズの最小化,モデル精度の最大化という新たな評価基準を提案する。 10のベースライン手法,3つのコンピュータビジョンタスク,180以上のトレーニングモデルを用いた総合的なベンチマーク研究を行い,SC2の様々な側面について議論する。 sc2benchは、将来のsc2研究のためのpythonパッケージです。提案するメトリクスとパッケージは、スプリットコンピューティングにおける教師付き圧縮のトレードオフを理解するのに役立つでしょう。

関連論文リスト

A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification [0.0]
予測性能を維持しながらモデルサイズと計算コストを削減する圧縮技術が提案されている。畳み込みニューラルネットワークにおける3つの広く利用されている圧縮戦略について検討する。その結果, 圧縮モデルでは, 競争的分類性能を維持しながら, モデルサイズと計算コストを大幅に削減できることがわかった。
論文参考訳（メタデータ） (2026-03-05T01:48:30Z)
Re-Densification Meets Cross-Scale Propagation: Real-Time Neural Compression of LiDAR Point Clouds [83.39320394656855]
LiDARポイントクラウドは、様々なアプリケーションに基本的だが、高精度スキャンは、かなりのストレージと送信オーバーヘッドを発生させる。既存の手法では、非順序の点を階層的なオクツリーやボクセル構造に変換して、密度から疎い予測符号化を行うのが一般的である。筆者らのフレームワークは2つの軽量モジュールから構成されている。まず、Geometry Re-Densification Moduleがエンコードされたスパース幾何を再認識し、より密なスケールで特徴を抽出し、予測符号化のための特徴を再分離する。
論文参考訳（メタデータ） (2025-08-28T06:36:10Z)
A Multi-task Supervised Compression Model for Split Computing [4.234757989234096]
分散コンピューティングは、リソース制約のあるエッジコンピューティングシステムのためのディープラーニングモデルに対する有望なアプローチである。マルチタスクスプリットコンピューティングのための最初のマルチタスク型教師付き圧縮モデルであるLadonを提案する。我々のモデルはマルチタスクスプリットコンピューティングシナリオにおいて、エンドツーエンドのレイテンシ(最大95.4%)とモバイルデバイスのエネルギー消費(最大88.2%)を削減した。
論文参考訳（メタデータ） (2025-01-02T18:59:05Z)
Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression [10.233937665979694]
DLRMは最先端のレコメンデーションシステムモデルであり、様々な業界アプリケーションで広く採用されている。このプロセスの重大なボトルネックは、すべてのデバイスから埋め込みデータを集めるのに必要な全通信に時間を要することだ。本稿では,通信データサイズを削減し,DLRMトレーニングを高速化するために,エラーバウンドの損失圧縮を利用する手法を提案する。
論文参考訳（メタデータ） (2024-07-05T05:55:18Z)
Scaling Tractable Probabilistic Circuits: A Systems Perspective [53.76194929291088]
PyJuiceは、いくつかの点で先行技術を改善するPCの一般的な実装設計である。大規模PCのトレーニングでは、既存のシステムよりも1～2桁高速である。 PyJuiceは2～5倍のメモリを消費するので、より大きなモデルをトレーニングすることができます。
論文参考訳（メタデータ） (2024-06-02T14:57:00Z)
Activations and Gradients Compression for Model-Parallel Training [85.99744701008802]
モデル並列分散トレーニングセットアップにおけるアクティベーションと勾配の同時圧縮が収束に与える影響について検討する。グラデーションはアクティベーションよりも軽度な圧縮速度を必要とする。実験では、TopKでトレーニングされたモデルが、推論中に圧縮も適用された場合にのみ正常に動作することが示されている。
論文参考訳（メタデータ） (2024-01-15T15:54:54Z)
Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。 DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文参考訳（メタデータ） (2023-08-21T07:24:29Z)
Towards a Better Theoretical Understanding of Independent Subnetwork Training [56.24689348875711]
独立サブネットワークトレーニング(IST)の理論的考察 ISTは、上記の問題を解決するための、最近提案され、非常に効果的である。圧縮通信を用いた分散手法など,ISTと代替手法の基本的な違いを同定する。
論文参考訳（メタデータ） (2023-06-28T18:14:22Z)
Neural Architecture Search for Improving Latency-Accuracy Trade-off in Split Computing [5.516431145236317]
スプリットコンピューティングは、IoTシステムにディープラーニングをデプロイする際のプライバシとレイテンシの問題に対処する、新たな機械学習推論技術である。スプリットコンピューティングでは、ニューラルネットワークモデルは、エッジサーバとIoTデバイスをネットワークを介して分離し、協調的に処理される。本稿ではスプリットコンピューティングのためのニューラルアーキテクチャサーチ(NAS)手法を提案する。
論文参考訳（メタデータ） (2022-08-30T03:15:43Z)
Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文参考訳（メタデータ） (2022-06-17T04:07:45Z)
Feature Compression for Rate Constrained Object Detection on the Edge [20.18227104333772]
この問題を解決するための新たなアプローチは、ニューラルネットワークの計算をエッジサーバのコンピューティングリソースにオフロードすることだ。本研究では、YOLOオブジェクト検出モデルの計算の一部をオフロードする「分割計算」システムについて検討する。我々は、速度制約下でのオブジェクト検出精度を最適化するために、YOLOモデルとともに特徴圧縮および非圧縮モジュールを訓練する。
論文参考訳（メタデータ） (2022-04-15T03:39:30Z)
Compact representations of convolutional neural networks via weight pruning and quantization [63.417651529192014]
本稿では、音源符号化に基づく畳み込みニューラルネットワーク(CNN)の新しいストレージフォーマットを提案し、重み付けと量子化の両方を活用する。我々は、全接続層で0.6%、ネットワーク全体で5.44%のスペース占有率を削減し、最低でもベースラインと同じくらいの競争力を発揮する。
論文参考訳（メタデータ） (2021-08-28T20:39:54Z)
Supervised Compression for Resource-constrained Edge Computing Systems [26.676557573171618]
フルスケールのディープニューラルネットワークは、エネルギーとストレージの面でリソース集約的すぎることが多い。本稿では、知識蒸留とニューラルイメージ圧縮のアイデアを採用し、中間特徴表現をより効率的に圧縮する。教師付きレート歪み性能を向上するとともに、エンドツーエンドのレイテンシも小さくする。
論文参考訳（メタデータ） (2021-08-21T11:10:29Z)
PowerGossip: Practical Low-Rank Communication Compression in Decentralized Deep Learning [62.440827696638664]
本稿では,近隣労働者間のモデル差を直接圧縮する簡単なアルゴリズムを提案する。中央集権的なディープラーニングのためにPowerSGDにインスパイアされたこのアルゴリズムは、パワーステップを使用して、1ビットあたりの転送情報を最大化する。
論文参考訳（メタデータ） (2020-08-04T09:14:52Z)
Split Computing for Complex Object Detectors: Challenges and Preliminary Results [8.291242737118482]
大規模データセット(COCO 2017)でトレーニングされた強力なR-CNNオブジェクト検出器のための分割計算手法開発における課題について論じる。単純な分割計算法では推論時間を短縮できないことを示す。これは、そのような物体検出器に小さなボトルネックを注入し、スプリットコンピューティングアプローチの可能性を明らかにする最初の研究である。
論文参考訳（メタデータ） (2020-07-27T05:03:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。