論文の概要: Transformer-based Selective Super-Resolution for Efficient Image
Refinement
- arxiv url: http://arxiv.org/abs/2312.05803v1
- Date: Sun, 10 Dec 2023 07:31:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 18:42:02.790698
- Title: Transformer-based Selective Super-Resolution for Efficient Image
Refinement
- Title(参考訳): 画像の高精細化のための変圧器による選択的超解像法
- Authors: Tianyi Zhang, Kishore Kasichainula, Yaoxin Zhuo, Baoxin Li, Jae-sun
Seo, Yu Cao
- Abstract要約: SSR(Selective Super-Resolution)は、画像を重複しないタイルに分割し、ピラミッドアーキテクチャで様々なスケールで興味あるタイルを選択し、これら選択したタイルを深い特徴で再構築する。
最先端の手法と比較して、FIDスコアは26.78から10.41に削減され、BDD100Kデータセットの計算コストは40%削減された。
- 参考スコア(独自算出の注目度): 20.838511460733038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conventional super-resolution methods suffer from two drawbacks: substantial
computational cost in upscaling an entire large image, and the introduction of
extraneous or potentially detrimental information for downstream computer
vision tasks during the refinement of the background. To solve these issues, we
propose a novel transformer-based algorithm, Selective Super-Resolution (SSR),
which partitions images into non-overlapping tiles, selects tiles of interest
at various scales with a pyramid architecture, and exclusively reconstructs
these selected tiles with deep features. Experimental results on three datasets
demonstrate the efficiency and robust performance of our approach for
super-resolution. Compared to the state-of-the-art methods, the FID score is
reduced from 26.78 to 10.41 with 40% reduction in computation cost for the
BDD100K dataset. The source code is available at
https://github.com/destiny301/SSR.
- Abstract(参考訳): 従来の超解像法には、2つの欠点がある: 大きな画像全体をアップスケールする際の相当な計算コストと、背景の洗練中に下流コンピュータビジョンタスクに異常または潜在的に有害な情報を導入することである。
そこで本研究では,非重複タイルにイメージを分割し,ピラミッドアーキテクチャを用いて様々なスケールで興味のあるタイルを選択し,これら選択したタイルを精巧に再構築する,トランスフォーマティブ・ベースの新しいアルゴリズムであるssrを提案する。
3つのデータセットにおける実験結果は,超解像に対するアプローチの効率性とロバスト性を示している。
最先端の手法と比較して、FIDスコアは26.78から10.41に削減され、BDD100Kデータセットの計算コストは40%削減された。
ソースコードはhttps://github.com/destiny301/ssrで入手できる。
関連論文リスト
- Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - PTSR: Patch Translator for Image Super-Resolution [16.243363392717434]
画像超解像(PTSR)のためのパッチトランスレータを提案し,この問題に対処する。
提案するPTSRは、畳み込み動作のないトランスフォーマーベースGANネットワークである。
マルチヘッドアテンションを利用した改良パッチを再生するための新しいパッチトランスレータモジュールを提案する。
論文 参考訳(メタデータ) (2023-10-20T01:45:00Z) - Pixel Adapter: A Graph-Based Post-Processing Approach for Scene Text
Image Super-Resolution [22.60056946339325]
アップサンプリングによる画素歪みに対処するために,グラフアテンションに基づくPixel Adapter Module (PAM)を提案する。
PAMは、各ピクセルが隣人と対話し、機能を更新することで、ローカルな構造情報を効果的にキャプチャする。
提案手法は,従来の認識精度を上回り,高品質な超解像を生成することを実証する。
論文 参考訳(メタデータ) (2023-09-16T08:12:12Z) - Spatially-Adaptive Feature Modulation for Efficient Image
Super-Resolution [90.16462805389943]
視覚変換器(ViT)のようなブロック上に,空間適応型特徴変調(SAFM)機構を開発する。
提案法は最先端のSR法よりも3倍程度小さい。
論文 参考訳(メタデータ) (2023-02-27T14:19:31Z) - Very Low-Resolution Iris Recognition Via Eigen-Patch Super-Resolution
and Matcher Fusion [69.53542497693086]
局所像パッチの固有変換に基づいて虹彩画像の再構成に用いる超解像アルゴリズムの評価を行った。
コントラストの強化は再現性を向上させるのに用いられ、マーカ融合は虹彩認識性能を改善するために採用されている。
論文 参考訳(メタデータ) (2022-10-18T11:25:19Z) - CUF: Continuous Upsampling Filters [25.584630142930123]
本稿では,画像処理における最も重要な操作の一つとして,アップサンプリングについて考察する。
本稿では、アップサンプリングカーネルをニューラルネットワークとしてパラメータ化することを提案する。
このパラメータ化により、競合する任意のスケールの超解像アーキテクチャと比較して40倍のパラメータ数の削減が得られる。
論文 参考訳(メタデータ) (2022-10-13T12:45:51Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - ShuffleMixer: An Efficient ConvNet for Image Super-Resolution [88.86376017828773]
本稿では、大きな畳み込みとチャネル分割シャッフル操作を探索する軽量画像超解像のためのShuffleMixerを提案する。
具体的には,チャネル分割とシャッフルを基本成分とする2つのプロジェクション層を効率よく混合する。
実験結果から,ShuffleMixerはモデルパラメータやFLOPの手法に比べて約6倍小さいことがわかった。
論文 参考訳(メタデータ) (2022-05-30T15:26:52Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。