論文の概要: Characterizing and Taming Resolution in Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2110.14819v1
- Date: Thu, 28 Oct 2021 00:08:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 14:57:01.429304
- Title: Characterizing and Taming Resolution in Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークにおけるキャラクタリゼーションとテーミングレゾリューション
- Authors: Eddie Yan, Liang Luo, Luis Ceze
- Abstract要約: 画像解像度は、コンピュータビジョンモデル推論の精度、計算量、記憶量、帯域幅コストに大きな影響を及ぼす。
本稿では,画像解像度,画質,畳み込みニューラルネットワーク演算子のシステマティックかつ自動チューニングによる精度と効率のトレードオフについて検討する。
そこで本稿では,静的に解像度を選択する必要をなくす動的解決機構を提案する。
- 参考スコア(独自算出の注目度): 4.412616624011115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image resolution has a significant effect on the accuracy and computational,
storage, and bandwidth costs of computer vision model inference. These costs
are exacerbated when scaling out models to large inference serving systems and
make image resolution an attractive target for optimization. However, the
choice of resolution inherently introduces additional tightly coupled choices,
such as image crop size, image detail, and compute kernel implementation that
impact computational, storage, and bandwidth costs. Further complicating this
setting, the optimal choices from the perspective of these metrics are highly
dependent on the dataset and problem scenario. We characterize this tradeoff
space, quantitatively studying the accuracy and efficiency tradeoff via
systematic and automated tuning of image resolution, image quality and
convolutional neural network operators. With the insights from this study, we
propose a dynamic resolution mechanism that removes the need to statically
choose a resolution ahead of time.
- Abstract(参考訳): 画像解像度は、コンピュータビジョンモデル推論の精度、計算量、記憶量、帯域幅コストに大きな影響を及ぼす。
これらのコストは、モデルを大規模推論サービスシステムにスケールアウトし、画像解像度を最適化の魅力的なターゲットにするときに悪化する。
しかし、解像度の選択は本質的には、画像のクロップサイズ、画像の詳細、計算、ストレージ、帯域幅のコストに影響を与える計算カーネルの実装など、密結合した選択をもたらす。
この設定をさらに複雑にすると、これらのメトリクスの観点からの最適な選択は、データセットと問題シナリオに大きく依存します。
我々はこのトレードオフ空間を特徴付け、画像解像度、画質、畳み込みニューラルネットワーク演算子のシステマティックかつ自動チューニングにより精度と効率のトレードオフを定量的に研究する。
そこで本研究では,先行する解像度を静的に選択する必要をなくした動的解決機構を提案する。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - VmambaIR: Visual State Space Model for Image Restoration [36.11385876754612]
VmambaIRは、画像復元タスクに線形に複雑な状態空間モデル(SSM)を導入する。
VmambaIRは、より少ない計算資源とパラメータで最先端(SOTA)性能を達成する。
論文 参考訳(メタデータ) (2024-03-18T02:38:55Z) - DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors [0.669087470775851]
本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。
ロス関数は、スケールのための異なるサイズのオブジェクトの異なる目的に対する精度低下を最小限に抑えるために考案された。
論文 参考訳(メタデータ) (2023-11-28T07:52:41Z) - Semantically Accurate Super-Resolution Generative Adversarial Networks [2.0454959820861727]
セマンティックセグメンテーションの性能を高めるために,新しいアーキテクチャとドメイン固有の特徴損失を提案する。
提案手法は,全ての予測クラスにおいて,知覚的画像品質と定量的セグメンテーションの精度を向上することを示す。
この研究は、画像ベースとタスク固有の損失を共同で検討することにより、両者のパフォーマンスを向上し、空中画像のセマンティック・アウェア・スーパーレゾリューションにおける最先端の進歩を実証する。
論文 参考訳(メタデータ) (2022-05-17T23:05:27Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Dynamic Resolution Network [40.64164953983429]
現代のCNNの入力解像度の冗長性については、完全には研究されていない。
本稿では,各サンプルに基づいて動的に分解能を決定できる新しい動的分解能ネットワーク(DRNet)を提案する。
DRNetは34%の精度で同様の性能を実現しているが、ImageNetのResNet-50に比べて10%の精度で1.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2021-06-05T13:48:33Z) - Enhancing sensor resolution improves CNN accuracy given the same number
of parameters or FLOPS [53.10151901863263]
パラメータ数やFLOPSが同じで、高い入力解像度で高い精度が得られるように、ネットワークを変更することは、ほぼ常に可能であることを示す。
MNIST、Fashion MNIST、CIFAR10データセットに関する予備的研究は、提案手法の効率性を実証している。
論文 参考訳(メタデータ) (2021-03-09T06:47:01Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Perceptual Image Super-Resolution with Progressive Adversarial Network [17.289101902846358]
Single Image Super-Resolution (SISR) は、小型の低画質画像の解像度を1つの画像から改善することを目的としている。
本稿では,現在最先端のアルゴリズムの性能を制限している理由として,次元の呪いを論じる。
本稿では,ドメイン固有画像の超解像化の難しさに対処できるプログレッシブ・アドバイサル・ネットワーク(PAN)を提案する。
論文 参考訳(メタデータ) (2020-03-08T10:19:34Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。