Fugu-MT 論文翻訳(概要): edge-SR: Super-Resolution For The Masses

論文の概要: edge-SR: Super-Resolution For The Masses

arxiv url: http://arxiv.org/abs/2108.10335v1
Date: Mon, 23 Aug 2021 18:00:19 GMT
ステータス: 翻訳完了
システム内更新日: 2021-08-26 00:34:37.007954
Title: edge-SR: Super-Resolution For The Masses
Title（参考訳）: edge-SR: 大衆の超解答
Authors: Pablo Navarrete Michelini, Yunhua Lu, Xingqun Jiang
Abstract要約: エッジAIチップは、ディープラーニングタスクを効率的に実行可能なハードウェアの迅速な開発において、将来性を示す。画像の超解像度では、限界を極端に小さなサイズまで押し上げ、エッジデバイス上でリアルタイムで実行できるアーキテクチャはごくわずかである。画像のスケールアップに解釈可能な機構を用いる一層アーキテクチャの集合であるエッジSR(eSR)を提案する。
参考スコア（独自算出の注目度）: 9.316821586509484
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Classic image scaling (e.g. bicubic) can be seen as one convolutional layer and a single upscaling filter. Its implementation is ubiquitous in all display devices and image processing software. In the last decade deep learning systems have been introduced for the task of image super-resolution (SR), using several convolutional layers and numerous filters. These methods have taken over the benchmarks of image quality for upscaling tasks. Would it be possible to replace classic upscalers with deep learning architectures on edge devices such as display panels, tablets, laptop computers, etc.? On one hand, the current trend in Edge-AI chips shows a promising future in this direction, with rapid development of hardware that can run deep-learning tasks efficiently. On the other hand, in image SR only few architectures have pushed the limit to extreme small sizes that can actually run on edge devices at real-time. We explore possible solutions to this problem with the aim to fill the gap between classic upscalers and small deep learning configurations. As a transition from classic to deep-learning upscaling we propose edge-SR (eSR), a set of one-layer architectures that use interpretable mechanisms to upscale images. Certainly, a one-layer architecture cannot reach the quality of deep learning systems. Nevertheless, we find that for high speed requirements, eSR becomes better at trading-off image quality and runtime performance. Filling the gap between classic and deep-learning architectures for image upscaling is critical for massive adoption of this technology. It is equally important to have an interpretable system that can reveal the inner strategies to solve this problem and guide us to future improvements and better understanding of larger networks.
Abstract（参考訳）: 古典的な画像スケーリング(例) bicubic)は1つの畳み込み層と1つのアップスケーリングフィルタと見なすことができる。その実装は、すべてのディスプレイデバイスと画像処理ソフトウェアでユビキタスである。過去10年間、複数の畳み込み層と多数のフィルタを用いた画像超解像(sr)タスクのためにディープラーニングシステムが導入された。これらの手法は、アップスケールタスクのための画像品質のベンチマークを引き継いだ。ディスプレイパネルやタブレット,ラップトップなど,エッジデバイス上でのディープラーニングアーキテクチャを,古典的なアップスケールに置き換えることは可能でしょうか? 一方、Edge-AIチップの現在のトレンドは、ディープラーニングタスクを効率的に実行できるハードウェアの急速な開発によって、この方向への有望な未来を示している。一方、画像SRでは、エッジデバイス上でリアルタイムに実行可能な極端に小さなサイズに制限を押し上げるアーキテクチャはごくわずかである。古典的なアップスケーラと小さなディープラーニング構成のギャップを埋めることを目的として,この問題に対する潜在的な解決策を探究する。古典的なアップスケーリングからディープラーニングへの遷移として、画像のスケールアップに解釈可能なメカニズムを使用する一層アーキテクチャのセットであるエッジSR(eSR)を提案する。確かに、一層アーキテクチャはディープラーニングシステムの品質に到達できない。それでも、高速要求では、esrは画像品質と実行時のパフォーマンスのトレードオフがより良くなります。イメージアップスケールのための古典的アーキテクチャとディープラーニングアーキテクチャのギャップを埋めることが、このテクノロジの大規模採用に不可欠である。同様に、この問題を解決するための内部戦略を明らかにし、将来の改善と大規模ネットワークの理解を深めるための解釈可能なシステムを持つことが重要である。

関連論文リスト

In Pursuit of Pixel Supervision for Visual Pre-training [60.63095313440605]
Pixioは、最小限の人間のキュレーションで自己キュレーション戦略を備えた、2Bのウェブクローリング画像に基づいて訓練された強化マスク付きオートエンコーダ(MAE)である。 Pixioは、単眼深度推定、フィードフォワード3D再構成、セマンティックセグメンテーション、ロボット学習など、幅広い下流タスクで競争力を発揮する。この結果から,画素空間の自己教師型学習は有望な代替手段となり,潜在空間アプローチの補完となる可能性が示唆された。
論文参考訳（メタデータ） (2025-12-17T18:59:58Z)
PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images [58.73779101355669]
PixelCraftは、高忠実度画像処理と、構造化画像に対する柔軟な視覚的推論のための、新しいマルチエージェントシステムである。この基盤の上に構築されたPixelCraftは、ツールの選択、エージェントの議論、自己批判といった3段階の動的なワークフローを通じて、視覚的推論を容易にする。
論文参考訳（メタデータ） (2025-09-29T17:59:49Z)
Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。 PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-06T17:59:10Z)
Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [49.81353382211113]
マルチヘッド自己認識を高分解能表現CNNに効率的に組み込むという課題に対処する。本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文参考訳（メタデータ） (2024-03-15T15:47:54Z)
T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文参考訳（メタデータ） (2023-05-12T04:10:42Z)
LR-Net: A Block-based Convolutional Neural Network for Low-Resolution Image Classification [0.0]
ノイズや低解像度の画像から低レベル特徴と大域特徴の両方を学習するためのブロックで構成された,新しい画像分類アーキテクチャを開発した。ブロックの設計は,性能向上とパラメータサイズ削減のために,Residual ConnectionとInceptionモジュールの影響を強く受けていた。我々は、提示されたアーキテクチャが既存の最先端畳み込みニューラルネットワークよりも高速で正確であることを示す詳細なテストを実施した。
論文参考訳（メタデータ） (2022-07-19T20:01:11Z)
Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文参考訳（メタデータ） (2022-07-09T13:35:12Z)
Learning to Resize Images for Computer Vision Tasks [15.381549764216134]
そこで本研究では,リニアリシライザを学習リシライザに置き換えることで,性能を大幅に向上できることを示す。我々の学習画像復調器はベースライン視覚モデルで共同で訓練されている。提案手法は,他の視覚タスクの分類ベースラインの微調整にも有用であることを示す。
論文参考訳（メタデータ） (2021-03-17T23:43:44Z)
ClassSR: A General Framework to Accelerate Super-Resolution Networks by Data Characteristic [35.02837100573671]
大型画像(2K-8K)上での超解像(SR)ネットワークの高速化を目指す。異なる画像領域は復元の困難度が異なり、異なるキャパシティを持つネットワークで処理できることがわかった。分類とSRを統一したフレームワークで組み合わせた新しいソリューションパイプラインであるClassSRを提案する。
論文参考訳（メタデータ） (2021-03-06T06:00:31Z)
Deep Unrolled Network for Video Super-Resolution [0.45880283710344055]
ビデオスーパーリゾリューション(VSR)は、対応する低リゾリューション(LR)バージョンから高リゾリューション(HR)画像のシーケンスを再構築することを目的としています。伝統的に、VSR問題の解法は、画像形成や動きの仮定に関する事前知識を利用する反復アルゴリズムに基づいている。ディープラーニング(DL)アルゴリズムは、大量の画像から空間パターンを効率的に学習できます。未使用の最適化技術に基づく新しいVSRニューラルネットワークを提案し,その性能を議論する。
論文参考訳（メタデータ） (2021-02-23T14:35:09Z)
Deep Burst Super-Resolution [165.90445859851448]
バースト超解像タスクのための新しいアーキテクチャを提案する。我々のネットワークは複数のノイズRAW画像を入力として取り出し、出力として分解された超解像RGB画像を生成する。実世界のデータのトレーニングと評価を可能にするため,BurstSRデータセットも導入する。
論文参考訳（メタデータ） (2021-01-26T18:57:21Z)
GLEAN: Generative Latent Bank for Large-Factor Image Super-Resolution [85.53811497840725]
我々は,大因子画像超解像(SR)の復元品質を向上させるために,GAN(Generative Adversarial Networks),例えばStyleGAN(StyleGAN)が潜時バンクとして使用できることを示す。我々の手法であるGenerative LatEnt bANk(GLEAN)は、事前訓練されたGANにカプセル化されているリッチで多様な事前情報を直接活用することで、既存のプラクティスを越えている。 GLEANによってアップスケールされた画像は、既存の方法と比較して忠実さとテクスチャ忠実さの点で明らかに改善されている。
論文参考訳（メタデータ） (2020-12-01T18:56:14Z)
Lightweight Modules for Efficient Deep Learning based Image Restoration [20.701733377216932]
そこで我々は,与えられたベースラインモデルの計算的低コストな変種を生成するために,いくつかの軽量な低レベルモジュールを提案する。その結果,提案するネットワークは,全容量ベースラインと比較して,視覚的に類似した再構成を一貫して出力することがわかった。
論文参考訳（メタデータ） (2020-07-11T19:35:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。