論文の概要: AOWS: Adaptive and optimal network width search with latency constraints
- arxiv url: http://arxiv.org/abs/2005.10481v1
- Date: Thu, 21 May 2020 06:46:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 22:54:07.165329
- Title: AOWS: Adaptive and optimal network width search with latency constraints
- Title(参考訳): AOWS:遅延制約付き適応的かつ最適なネットワーク幅探索
- Authors: Maxim Berman, Leonid Pishchulin, Ning Xu, Matthew B. Blaschko, Gerard
Medioni
- Abstract要約: チャネル番号を最適に探索する新しい一発一発NAS手法を提案する。
ImageNet分類実験により,異なるターゲットプラットフォーム上でのリソース制約に適合するネットワークを見つけることができた。
- 参考スコア(独自算出の注目度): 30.39613826468697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural architecture search (NAS) approaches aim at automatically finding
novel CNN architectures that fit computational constraints while maintaining a
good performance on the target platform. We introduce a novel efficient
one-shot NAS approach to optimally search for channel numbers, given latency
constraints on a specific hardware. We first show that we can use a black-box
approach to estimate a realistic latency model for a specific inference
platform, without the need for low-level access to the inference computation.
Then, we design a pairwise MRF to score any channel configuration and use
dynamic programming to efficiently decode the best performing configuration,
yielding an optimal solution for the network width search. Finally, we propose
an adaptive channel configuration sampling scheme to gradually specialize the
training phase to the target computational constraints. Experiments on ImageNet
classification show that our approach can find networks fitting the resource
constraints on different target platforms while improving accuracy over the
state-of-the-art efficient networks.
- Abstract(参考訳): ニューラルアーキテクチャサーチ(NAS)アプローチは、ターゲットプラットフォーム上で優れたパフォーマンスを維持しながら、計算制約に適合する新しいCNNアーキテクチャを自動的に見つけることを目的としている。
本稿では,特定のハードウェア上での遅延制約を考慮し,チャネル番号を最適に検索する,新しいワンショットNAS手法を提案する。
まず,ブラックボックスアプローチを用いて,推論計算への低レベルアクセスを必要とせずに,特定の推論プラットフォームに対する現実的なレイテンシモデルを推定できることを示した。
次に,任意のチャネル構成をスコアするペアワイズmrfを設計し,動的プログラミングを用いて最適な構成を効率的に復号し,ネットワーク幅探索の最適解を得る。
最後に,対象の計算制約に対して訓練フェーズを徐々に特殊化する適応チャネル構成サンプリング方式を提案する。
イメージネットの分類実験により,ネットワークの精度を向上しつつ,異なるプラットフォーム上のリソース制約に適合するネットワークを見いだせることを示した。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - CONetV2: Efficient Auto-Channel Size Optimization for CNNs [35.951376988552695]
本研究は,チャネルサイズのマイクロサーチ空間を調べることにより,計算制約のある環境において効率的な手法を提案する。
チャネルサイズ最適化に際し、ネットワークの異なる接続層内の依存関係を抽出する自動アルゴリズムを設計する。
また、テスト精度と高い相関性を持ち、個々のネットワーク層を解析できる新しいメトリクスも導入する。
論文 参考訳(メタデータ) (2021-10-13T16:17:19Z) - Architecture Aware Latency Constrained Sparse Neural Networks [35.50683537052815]
本稿では,CNNモデルの作成と高速化を目的として,遅延制約付きスパースフレームワークを設計する。
また,効率的な計算のための新しいスパース畳み込みアルゴリズムを提案する。
我々のシステム・アルゴリズムの共同設計フレームワークは、リソース制約のあるモバイルデバイス上でのネットワークの精度とレイテンシのフロンティアをはるかに向上させることができる。
論文 参考訳(メタデータ) (2021-09-01T03:41:31Z) - CONet: Channel Optimization for Convolutional Neural Networks [33.58529066005248]
畳み込みニューラルネットワーク(CNN)におけるチャネルサイズ最適化の検討
ネットワーク層をまたいだCNNのチャネルサイズを自動的に最適化する,効率的な動的スケーリングアルゴリズムであるConetを導入します。
CIFAR10/100およびImageNetデータセット上で実験を行い、ConetがResNet、DARTS、DARTS+空間で探索された効率的で正確なアーキテクチャを見つけることができることを示す。
論文 参考訳(メタデータ) (2021-08-15T21:48:25Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。