Fugu-MT 論文翻訳(概要): Characterizing and Taming Resolution in Convolutional Neural Networks

論文の概要: Characterizing and Taming Resolution in Convolutional Neural Networks

arxiv url: http://arxiv.org/abs/2110.14819v1
Date: Thu, 28 Oct 2021 00:08:23 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-29 14:57:01.429304
Title: Characterizing and Taming Resolution in Convolutional Neural Networks
Title（参考訳）: 畳み込みニューラルネットワークにおけるキャラクタリゼーションとテーミングレゾリューション
Authors: Eddie Yan, Liang Luo, Luis Ceze
Abstract要約: 画像解像度は、コンピュータビジョンモデル推論の精度、計算量、記憶量、帯域幅コストに大きな影響を及ぼす。本稿では,画像解像度,画質,畳み込みニューラルネットワーク演算子のシステマティックかつ自動チューニングによる精度と効率のトレードオフについて検討する。そこで本稿では,静的に解像度を選択する必要をなくす動的解決機構を提案する。
参考スコア（独自算出の注目度）: 4.412616624011115
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image resolution has a significant effect on the accuracy and computational, storage, and bandwidth costs of computer vision model inference. These costs are exacerbated when scaling out models to large inference serving systems and make image resolution an attractive target for optimization. However, the choice of resolution inherently introduces additional tightly coupled choices, such as image crop size, image detail, and compute kernel implementation that impact computational, storage, and bandwidth costs. Further complicating this setting, the optimal choices from the perspective of these metrics are highly dependent on the dataset and problem scenario. We characterize this tradeoff space, quantitatively studying the accuracy and efficiency tradeoff via systematic and automated tuning of image resolution, image quality and convolutional neural network operators. With the insights from this study, we propose a dynamic resolution mechanism that removes the need to statically choose a resolution ahead of time.
Abstract（参考訳）: 画像解像度は、コンピュータビジョンモデル推論の精度、計算量、記憶量、帯域幅コストに大きな影響を及ぼす。これらのコストは、モデルを大規模推論サービスシステムにスケールアウトし、画像解像度を最適化の魅力的なターゲットにするときに悪化する。しかし、解像度の選択は本質的には、画像のクロップサイズ、画像の詳細、計算、ストレージ、帯域幅のコストに影響を与える計算カーネルの実装など、密結合した選択をもたらす。この設定をさらに複雑にすると、これらのメトリクスの観点からの最適な選択は、データセットと問題シナリオに大きく依存します。我々はこのトレードオフ空間を特徴付け、画像解像度、画質、畳み込みニューラルネットワーク演算子のシステマティックかつ自動チューニングにより精度と効率のトレードオフを定量的に研究する。そこで本研究では,先行する解像度を静的に選択する必要をなくした動的解決機構を提案する。

関連論文リスト

Crafting Query-Aware Selective Attention for Single Image Super-Resolution [3.133812520659661]
SISR(Single Image Super-Resolution)は、低解像度の入力から高解像度の画像を再構成し、画像の詳細を向上する。本稿では,クエリの類似性に基づいて,最も関連性の高いキー値ウィンドウを動的に選択するSSCANを提案する。実験の結果、SSCANは既存のアテンションベースSISR法よりも優れており、都市データセットの最大0.14dBPSNR改善を実現していることがわかった。
論文参考訳（メタデータ） (2025-04-09T07:17:29Z)
Resolution Invariant Autoencoder [1.149124112513873]
ネットワークの各層における空間的リサイズを学習変数のリサイズプロセスを介して適応する,分解能不変なオートエンコーダを提案する。これにより、入力や出力の解像度に関わらず、一貫した遅延空間の解像度が保証される。本研究では,不確実性を考慮した超解像,分類,生成的モデリングタスクにおいて,その有効性を示す。
論文参考訳（メタデータ） (2025-03-12T20:47:19Z)
Elastic-DETR: Making Image Resolution Learnable with Content-Specific Network Prediction [0.612477318852572]
我々は,複数の画像解像度の弾性利用を可能にする,Elastic-DETRと呼ばれる学習可能な解像度のための新しい戦略を導入する。我々のネットワークは、コンパクトなスケール予測モジュールを用いて、画像の内容に基づいて適応的なスケールファクタを提供する。解像度の柔軟性を活用することで、精度と計算複雑性のトレードオフを様々に示す様々なモデルを実演することができる。
論文参考訳（メタデータ） (2024-12-09T09:46:21Z)
Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-29T19:02:54Z)
Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文参考訳（メタデータ） (2024-05-23T09:13:36Z)
VmambaIR: Visual State Space Model for Image Restoration [36.11385876754612]
VmambaIRは、画像復元タスクに線形に複雑な状態空間モデル(SSM)を導入する。 VmambaIRは、より少ない計算資源とパラメータで最先端(SOTA)性能を達成する。
論文参考訳（メタデータ） (2024-03-18T02:38:55Z)
DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors [0.669087470775851]
本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。ロス関数は、スケールのための異なるサイズのオブジェクトの異なる目的に対する精度低下を最小限に抑えるために考案された。
論文参考訳（メタデータ） (2023-11-28T07:52:41Z)
Semantically Accurate Super-Resolution Generative Adversarial Networks [2.0454959820861727]
セマンティックセグメンテーションの性能を高めるために,新しいアーキテクチャとドメイン固有の特徴損失を提案する。提案手法は,全ての予測クラスにおいて,知覚的画像品質と定量的セグメンテーションの精度を向上することを示す。この研究は、画像ベースとタスク固有の損失を共同で検討することにより、両者のパフォーマンスを向上し、空中画像のセマンティック・アウェア・スーパーレゾリューションにおける最先端の進歩を実証する。
論文参考訳（メタデータ） (2022-05-17T23:05:27Z)
Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [67.99082021804145]
我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。 DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文参考訳（メタデータ） (2022-01-04T08:30:09Z)
High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。提案手法は画像分割精細化において高速かつ効果的である。
論文参考訳（メタデータ） (2021-11-29T11:53:06Z)
Dynamic Resolution Network [40.64164953983429]
現代のCNNの入力解像度の冗長性については、完全には研究されていない。本稿では,各サンプルに基づいて動的に分解能を決定できる新しい動的分解能ネットワーク(DRNet)を提案する。 DRNetは34%の精度で同様の性能を実現しているが、ImageNetのResNet-50に比べて10%の精度で1.4%の精度向上を実現している。
論文参考訳（メタデータ） (2021-06-05T13:48:33Z)
Enhancing sensor resolution improves CNN accuracy given the same number of parameters or FLOPS [53.10151901863263]
パラメータ数やFLOPSが同じで、高い入力解像度で高い精度が得られるように、ネットワークを変更することは、ほぼ常に可能であることを示す。 MNIST、Fashion MNIST、CIFAR10データセットに関する予備的研究は、提案手法の効率性を実証している。
論文参考訳（メタデータ） (2021-03-09T06:47:01Z)
Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文参考訳（メタデータ） (2020-05-12T09:55:53Z)
Perceptual Image Super-Resolution with Progressive Adversarial Network [17.289101902846358]
Single Image Super-Resolution (SISR) は、小型の低画質画像の解像度を1つの画像から改善することを目的としている。本稿では,現在最先端のアルゴリズムの性能を制限している理由として,次元の呪いを論じる。本稿では,ドメイン固有画像の超解像化の難しさに対処できるプログレッシブ・アドバイサル・ネットワーク(PAN)を提案する。
論文参考訳（メタデータ） (2020-03-08T10:19:34Z)
Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文参考訳（メタデータ） (2020-03-02T13:28:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。