論文の概要: Resolution Switchable Networks for Runtime Efficient Image Recognition
- arxiv url: http://arxiv.org/abs/2007.09558v3
- Date: Mon, 9 Nov 2020 07:18:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 00:15:12.017887
- Title: Resolution Switchable Networks for Runtime Efficient Image Recognition
- Title(参考訳): 実行時画像認識のための分解能スイッチブルネットワーク
- Authors: Yikai Wang, Fuchun Sun, Duo Li, Anbang Yao
- Abstract要約: 本稿では,推論時に画像解像度を切り替えることのできる,単一の畳み込みニューラルネットワークを訓練する一般的な手法を提案する。
提案手法でトレーニングしたネットワークは、Resolvation Switchable Networks (RS-Nets) と呼ばれる。
- 参考スコア(独自算出の注目度): 46.09537029831355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a general method to train a single convolutional neural network
which is capable of switching image resolutions at inference. Thus the running
speed can be selected to meet various computational resource limits. Networks
trained with the proposed method are named Resolution Switchable Networks
(RS-Nets). The basic training framework shares network parameters for handling
images which differ in resolution, yet keeps separate batch normalization
layers. Though it is parameter-efficient in design, it leads to inconsistent
accuracy variations at different resolutions, for which we provide a detailed
analysis from the aspect of the train-test recognition discrepancy. A
multi-resolution ensemble distillation is further designed, where a teacher is
learnt on the fly as a weighted ensemble over resolutions. Thanks to the
ensemble and knowledge distillation, RS-Nets enjoy accuracy improvements at a
wide range of resolutions compared with individually trained models. Extensive
experiments on the ImageNet dataset are provided, and we additionally consider
quantization problems. Code and models are available at
https://github.com/yikaiw/RS-Nets.
- Abstract(参考訳): 本稿では,推論時に画像解像度を切り替えることのできる,単一の畳み込みニューラルネットワークの訓練方法を提案する。
これにより、様々な計算資源限界を満たすために実行速度を選択することができる。
提案手法でトレーニングされたネットワークは、Resolvation Switchable Networks (RS-Nets) と呼ばれる。
基本的なトレーニングフレームワークは、解像度が異なるイメージを扱うためのネットワークパラメータを共有している。
設計においてパラメータ効率は高いが、異なる解像度で不整合な精度の変動をもたらし、列車テスト認識の不一致の側面から詳細な分析を行う。
マルチレゾリューション・アンサンブル蒸留はさらに設計され、教師は解像度の重み付けアンサンブルとしてオンザフライで学習される。
アンサンブルと知識蒸留により、RS-Netは個々の訓練されたモデルと比較して幅広い解像度で精度の向上を享受する。
ImageNetデータセットに関する大規模な実験を行い、量子化問題についても検討する。
コードとモデルはhttps://github.com/yikaiw/rs-netsで入手できる。
関連論文リスト
- ResFormer: Scaling ViTs with Multi-Resolution Training [100.01406895070693]
私たちはResFormerを紹介します。ResFormerは、広く、ほとんど目に見えない、テストの解像度でパフォーマンスを改善するフレームワークです。
特にResFormerは、異なる解像度の再現されたイメージを実行し、さまざまなスケールでインタラクティブな情報をエンゲージするスケール一貫性の損失を強制する。
さらに、ResFormerは柔軟性があり、セマンティックセグメンテーション、オブジェクト検出、ビデオアクション認識に容易に拡張できることを示す。
論文 参考訳(メタデータ) (2022-12-01T18:57:20Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Dynamic Resolution Network [40.64164953983429]
現代のCNNの入力解像度の冗長性については、完全には研究されていない。
本稿では,各サンプルに基づいて動的に分解能を決定できる新しい動的分解能ネットワーク(DRNet)を提案する。
DRNetは34%の精度で同様の性能を実現しているが、ImageNetのResNet-50に比べて10%の精度で1.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2021-06-05T13:48:33Z) - Differentiable Patch Selection for Image Recognition [37.11810982945019]
そこで我々は,高解像度画像を処理するために,入力の最も関連性の高い部分を選択可能なTop-K演算子を提案する。
オブジェクト/部分境界ボックスアノテーションを使わずに,トラフィックサイン認識,パッチ間関係推論,微粒化認識の結果を示す。
論文 参考訳(メタデータ) (2021-04-07T11:15:51Z) - Deep Iterative Residual Convolutional Network for Single Image
Super-Resolution [31.934084942626257]
我々は、ISRResCNet(Deep Iterative Super-Resolution Residual Convolutional Network)を提案する。
残差学習アプローチを用いて、深層ネットワークを反復的に訓練することにより、強力な画像正規化と大規模最適化手法を活用する。
トレーニング可能なパラメータがいくつかある本手法は,最先端の手法と比較して,異なるスケーリング要因に対する結果を改善する。
論文 参考訳(メタデータ) (2020-09-07T12:54:14Z) - Cascade Convolutional Neural Network for Image Super-Resolution [15.650515790147189]
画像超解像のためのカスケード畳み込みニューラルネットワーク(CSRCNN)を提案する。
異なるスケールのイメージを同時にトレーニングすることができ、学習されたネットワークは、異なるスケールのイメージに存在する情報をフル活用することができる。
論文 参考訳(メタデータ) (2020-08-24T11:34:03Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。