論文の概要: Characterizing and Taming Resolution in Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2110.14819v1
- Date: Thu, 28 Oct 2021 00:08:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 14:57:01.429304
- Title: Characterizing and Taming Resolution in Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークにおけるキャラクタリゼーションとテーミングレゾリューション
- Authors: Eddie Yan, Liang Luo, Luis Ceze
- Abstract要約: 画像解像度は、コンピュータビジョンモデル推論の精度、計算量、記憶量、帯域幅コストに大きな影響を及ぼす。
本稿では,画像解像度,画質,畳み込みニューラルネットワーク演算子のシステマティックかつ自動チューニングによる精度と効率のトレードオフについて検討する。
そこで本稿では,静的に解像度を選択する必要をなくす動的解決機構を提案する。
- 参考スコア(独自算出の注目度): 4.412616624011115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image resolution has a significant effect on the accuracy and computational,
storage, and bandwidth costs of computer vision model inference. These costs
are exacerbated when scaling out models to large inference serving systems and
make image resolution an attractive target for optimization. However, the
choice of resolution inherently introduces additional tightly coupled choices,
such as image crop size, image detail, and compute kernel implementation that
impact computational, storage, and bandwidth costs. Further complicating this
setting, the optimal choices from the perspective of these metrics are highly
dependent on the dataset and problem scenario. We characterize this tradeoff
space, quantitatively studying the accuracy and efficiency tradeoff via
systematic and automated tuning of image resolution, image quality and
convolutional neural network operators. With the insights from this study, we
propose a dynamic resolution mechanism that removes the need to statically
choose a resolution ahead of time.
- Abstract(参考訳): 画像解像度は、コンピュータビジョンモデル推論の精度、計算量、記憶量、帯域幅コストに大きな影響を及ぼす。
これらのコストは、モデルを大規模推論サービスシステムにスケールアウトし、画像解像度を最適化の魅力的なターゲットにするときに悪化する。
しかし、解像度の選択は本質的には、画像のクロップサイズ、画像の詳細、計算、ストレージ、帯域幅のコストに影響を与える計算カーネルの実装など、密結合した選択をもたらす。
この設定をさらに複雑にすると、これらのメトリクスの観点からの最適な選択は、データセットと問題シナリオに大きく依存します。
我々はこのトレードオフ空間を特徴付け、画像解像度、画質、畳み込みニューラルネットワーク演算子のシステマティックかつ自動チューニングにより精度と効率のトレードオフを定量的に研究する。
そこで本研究では,先行する解像度を静的に選択する必要をなくした動的解決機構を提案する。
関連論文リスト
- DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors [0.669087470775851]
本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。
ロス関数は、スケールのための異なるサイズのオブジェクトの異なる目的に対する精度低下を最小限に抑えるために考案された。
論文 参考訳(メタデータ) (2023-11-28T07:52:41Z) - CompenHR: Efficient Full Compensation for High-resolution Projector [68.42060996280064]
プロジェクター補償はプロジェクターカメラシステムの実用的なタスクである。
プロジェクター入力画像、名前付き補償画像を見つけることを目的としており、プロジェクターが投影されると幾何学的および測光的歪みがキャンセルされる。
最先端の手法では、ディープラーニングを使ってこの問題に対処し、低解像度のセットアップで有望なパフォーマンスを示す。
しかし、ディープラーニングを高精細なセットアップに直接適用することは、長いトレーニング時間と高いメモリコストのために現実的ではない。
論文 参考訳(メタデータ) (2023-11-22T14:13:27Z) - Semantically Accurate Super-Resolution Generative Adversarial Networks [2.0454959820861727]
セマンティックセグメンテーションの性能を高めるために,新しいアーキテクチャとドメイン固有の特徴損失を提案する。
提案手法は,全ての予測クラスにおいて,知覚的画像品質と定量的セグメンテーションの精度を向上することを示す。
この研究は、画像ベースとタスク固有の損失を共同で検討することにより、両者のパフォーマンスを向上し、空中画像のセマンティック・アウェア・スーパーレゾリューションにおける最先端の進歩を実証する。
論文 参考訳(メタデータ) (2022-05-17T23:05:27Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Dynamic Resolution Network [40.64164953983429]
現代のCNNの入力解像度の冗長性については、完全には研究されていない。
本稿では,各サンプルに基づいて動的に分解能を決定できる新しい動的分解能ネットワーク(DRNet)を提案する。
DRNetは34%の精度で同様の性能を実現しているが、ImageNetのResNet-50に比べて10%の精度で1.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2021-06-05T13:48:33Z) - Enhancing sensor resolution improves CNN accuracy given the same number
of parameters or FLOPS [53.10151901863263]
パラメータ数やFLOPSが同じで、高い入力解像度で高い精度が得られるように、ネットワークを変更することは、ほぼ常に可能であることを示す。
MNIST、Fashion MNIST、CIFAR10データセットに関する予備的研究は、提案手法の効率性を実証している。
論文 参考訳(メタデータ) (2021-03-09T06:47:01Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Perceptual Image Super-Resolution with Progressive Adversarial Network [17.289101902846358]
Single Image Super-Resolution (SISR) は、小型の低画質画像の解像度を1つの画像から改善することを目的としている。
本稿では,現在最先端のアルゴリズムの性能を制限している理由として,次元の呪いを論じる。
本稿では,ドメイン固有画像の超解像化の難しさに対処できるプログレッシブ・アドバイサル・ネットワーク(PAN)を提案する。
論文 参考訳(メタデータ) (2020-03-08T10:19:34Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。