論文の概要: Multi-Exit Semantic Segmentation Networks
- arxiv url: http://arxiv.org/abs/2106.03527v1
- Date: Mon, 7 Jun 2021 11:37:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:28:43.523396
- Title: Multi-Exit Semantic Segmentation Networks
- Title(参考訳): マルチエクイト意味セグメンテーションネットワーク
- Authors: Alexandros Kouris, Stylianos I. Venieris, Stefanos Laskaridis,
Nicholas D. Lane
- Abstract要約: 本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
- 参考スコア(独自算出の注目度): 78.44441236864057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation arises as the backbone of many vision systems, spanning
from self-driving cars and robot navigation to augmented reality and
teleconferencing. Frequently operating under stringent latency constraints
within a limited resource envelope, optimising for efficient execution becomes
important. To this end, we propose a framework for converting state-of-the-art
segmentation models to MESS networks; specially trained CNNs that employ
parametrised early exits along their depth to save computation during inference
on easier samples. Designing and training such networks naively can hurt
performance. Thus, we propose a two-staged training process that pushes
semantically important features early in the network. We co-optimise the
number, placement and architecture of the attached segmentation heads, along
with the exit policy, to adapt to the device capabilities and
application-specific requirements. Optimising for speed, MESS networks can
achieve latency gains of up to 2.83x over state-of-the-art methods with no
accuracy degradation. Accordingly, optimising for accuracy, we achieve an
improvement of up to 5.33 pp, under the same computational budget.
- Abstract(参考訳): セマンティックセグメンテーションは、自動運転車やロボットナビゲーションから拡張現実や遠隔会議まで、多くのビジョンシステムのバックボーンとして生じる。
制限されたリソースエンベロープ内で厳しいレイテンシ制約の下で頻繁に動作し、効率的な実行を最適化することが重要である。
この目的のために我々は,最先端のセグメンテーションモデルを乱雑なネットワークに変換するためのフレームワークを提案する。
このようなネットワークの設計とトレーニングは、パフォーマンスを損なう可能性がある。
そこで本研究では,ネットワークの早期に意味的に重要な機能をプッシュする2段階のトレーニングプロセスを提案する。
我々は、デバイス機能やアプリケーション固有の要求に適応するために、接続されたセグメンテーションヘッドの数、配置、アーキテクチャをエグジットポリシーとともに最適化する。
速度を最適化することで、MESSネットワークは精度を低下させることなく、最先端の手法よりも最大2.83倍のレイテンシ向上を達成することができる。
したがって, 精度を最適化し, 同じ計算予算で最大5.33ppの精度向上を実現した。
関連論文リスト
- ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。
3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。
これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文 参考訳(メタデータ) (2023-08-30T10:57:41Z) - ATHEENA: A Toolflow for Hardware Early-Exit Network Automation [11.623574576259859]
ATHEENA (Aware Early-Exit Network Automation) のためのツールフロー
このようなネットワークから早期に抜け出すサンプルの確率を利用して、ネットワークの異なるセクションに割り当てられたリソースをスケールするツールフロー。
論文 参考訳(メタデータ) (2023-04-17T16:06:58Z) - Fluid Batching: Exit-Aware Preemptive Serving of Early-Exit Neural
Networks on Edge NPUs [74.83613252825754]
スマートエコシステム(smart ecosystems)"は、スタンドアロンではなく、センセーションが同時に行われるように形成されています。
これはデバイス上の推論パラダイムを、エッジにニューラル処理ユニット(NPU)をデプロイする方向にシフトしている。
そこで本研究では,実行時のプリエンプションが到着・終了プロセスによってもたらされる動的性を考慮に入れた,新しい早期終了スケジューリングを提案する。
論文 参考訳(メタデータ) (2022-09-27T15:04:01Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Architecture Aware Latency Constrained Sparse Neural Networks [35.50683537052815]
本稿では,CNNモデルの作成と高速化を目的として,遅延制約付きスパースフレームワークを設計する。
また,効率的な計算のための新しいスパース畳み込みアルゴリズムを提案する。
我々のシステム・アルゴリズムの共同設計フレームワークは、リソース制約のあるモバイルデバイス上でのネットワークの精度とレイテンシのフロンティアをはるかに向上させることができる。
論文 参考訳(メタデータ) (2021-09-01T03:41:31Z) - Multi-Task Network Pruning and Embedded Optimization for Real-time
Deployment in ADAS [0.0]
カメラベースのディープラーニングアルゴリズムは、自動運転システムにおける認識にますます必要である。
自動車業界からの制約は、限られた計算リソースで組み込みシステムを課すことでCNNの展開に挑戦します。
商用プロトタイププラットフォーム上で,このような条件下でマルチタスクCNNネットワークを埋め込む手法を提案する。
論文 参考訳(メタデータ) (2021-01-19T19:29:38Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - AOWS: Adaptive and optimal network width search with latency constraints [30.39613826468697]
チャネル番号を最適に探索する新しい一発一発NAS手法を提案する。
ImageNet分類実験により,異なるターゲットプラットフォーム上でのリソース制約に適合するネットワークを見つけることができた。
論文 参考訳(メタデータ) (2020-05-21T06:46:16Z) - Real-Time Segmentation Networks should be Latency Aware [0.0]
「平均対合(mIoU)における平均対合(mIoU)の性能指標は、これらのネットワークがリアルタイムに運用する際の真の性能を推定するために必要な情報を完全には捉えていない。」
ネットワークが処理を完了したときの将来の入力フレームにマッチする将来の出力セグメンテーションマップを予測することを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:41:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。