Fugu-MT 論文翻訳(概要): C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales

論文の概要: C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales

arxiv url: http://arxiv.org/abs/2503.13740v1
Date: Mon, 17 Mar 2025 21:52:18 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-19 16:29:12.067604
Title: C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales
Title（参考訳）: C2D-ISR:連続的から離散的スケールへの注意に基づく画像超解像の最適化
Authors: Yuxuan Jiang, Chengxi Zeng, Siyue Teng, Fan Zhang, Xiaoqing Zhu, Joel Sole, David Bull,
Abstract要約: 我々は、注目に基づく画像超解像モデルの最適化のための新しいフレームワーク、textbfC2D-ISRを提案する。このアプローチは、2段階のトレーニング手法と階層的なエンコーディング機構に基づいている。さらに,既存のアテンションベースネットワーク構造を用いて階層符号化機構を一般化する。
参考スコア（独自算出の注目度）: 6.700548615812325
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In recent years, attention mechanisms have been exploited in single image super-resolution (SISR), achieving impressive reconstruction results. However, these advancements are still limited by the reliance on simple training strategies and network architectures designed for discrete up-sampling scales, which hinder the model's ability to effectively capture information across multiple scales. To address these limitations, we propose a novel framework, \textbf{C2D-ISR}, for optimizing attention-based image super-resolution models from both performance and complexity perspectives. Our approach is based on a two-stage training methodology and a hierarchical encoding mechanism. The new training methodology involves continuous-scale training for discrete scale models, enabling the learning of inter-scale correlations and multi-scale feature representation. In addition, we generalize the hierarchical encoding mechanism with existing attention-based network structures, which can achieve improved spatial feature fusion, cross-scale information aggregation, and more importantly, much faster inference. We have evaluated the C2D-ISR framework based on three efficient attention-based backbones, SwinIR-L, SRFormer-L and MambaIRv2-L, and demonstrated significant improvements over the other existing optimization framework, HiT, in terms of super-resolution performance (up to 0.2dB) and computational complexity reduction (up to 11%). The source code will be made publicly available at www.github.com.
Abstract（参考訳）: 近年、単一画像超解像(SISR)において注意機構が活用され、印象的な再構成結果が得られている。しかしながら、これらの進歩は、離散的なアップサンプリングスケールのために設計された単純なトレーニング戦略やネットワークアーキテクチャに依存しているため、モデルが複数のスケールで情報を効果的にキャプチャする能力を妨げているため、依然として制限されている。これらの制約に対処するために,パフォーマンスと複雑性の両面から注目に基づく画像超解像モデルを最適化するための新しいフレームワークである「textbf{C2D-ISR}」を提案する。このアプローチは、2段階のトレーニング手法と階層的なエンコーディング機構に基づいている。新しいトレーニング手法には、離散スケールモデルの連続的なスケールトレーニングが含まれており、スケール間の相関とマルチスケールの特徴表現の学習を可能にする。さらに,空間的特徴融合,大規模情報集約,さらにはるかに高速な推論を実現するために,既存の注目ネットワーク構造を用いた階層的符号化機構を一般化する。我々は、SwinIR-L、SRFormer-L、MambaIRv2-Lの3つの効率的な注目ベースバックボーンに基づいてC2D-ISRフレームワークを評価し、超解像性能(0.2dB)と計算複雑性低減(最大11%)の観点から、他の既存の最適化フレームワークであるHiTよりも大幅に改善されていることを示した。ソースコードはwww.github.comで公開されている。

関連論文リスト

CFMD: Dynamic Cross-layer Feature Fusion for Salient Object Detection [7.262250906929891]
クロス層機能ピラミッドネットワーク(CFPN)は,多層機能融合と境界詳細保存において顕著な進歩を遂げている。これらの課題に対処するために,CFMDという,2つの重要なイノベーションを取り入れた,新しいクロスレイヤ機能ピラミッドネットワークを提案する。まず,現在最先端のMambaアーキテクチャを組み込んで動的重み分布機構を構築するコンテキスト認識機能集約モジュール(CFLMA)を設計する。第2に,分解能回復時に空間的詳細を保存する適応動的アップサンプリングユニット(CFLMD)を導入する。
論文参考訳（メタデータ） (2025-04-02T03:22:36Z)
Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する既存の二項化法では性能が著しく低下する。画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳（メタデータ） (2024-06-09T10:30:25Z)
Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文参考訳（メタデータ） (2023-03-16T21:06:13Z)
Towards Lightweight Cross-domain Sequential Recommendation via External Attention-enhanced Graph Convolution Network [7.1102362215550725]
クロスドメインシークエンシャルレコメンデーション(CSR)は、複数のドメインからのインタラクションをモデル化することで、重複したユーザの振る舞いパターンの進化を描いている。上記の課題,すなわちLEA-GCNを解決するために,軽量な外部注意強化GCNベースのフレームワークを導入する。フレームワークの構造をさらに緩和し、ユーザ固有のシーケンシャルパターンを集約するために、新しい二重チャネル外部注意(EA)コンポーネントを考案する。
論文参考訳（メタデータ） (2023-02-07T03:06:29Z)
CRC-RL: A Novel Visual Feature Representation Architecture for Unsupervised Reinforcement Learning [7.4010632660248765]
改良された視覚的特徴を学習するために,CRC損失と呼ばれる不均一な損失関数を用いた新しいアーキテクチャを提案する。提案したアーキテクチャはCRC-RLと呼ばれ、Deep Mind Controlスイート環境における既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2023-01-31T08:41:18Z)
GARNet: Global-Aware Multi-View 3D Reconstruction Network and the Cost-Performance Tradeoff [10.8606881536924]
本稿では,各ブランチとグローバル間の相関関係を構築し,重み付け推論の包括的基盤を提供する,グローバルアウェアアテンションベースの融合手法を提案する。ネットワークの能力を高めるために,ネットワーク全体の形状を監督する新たな損失関数を導入する。 ShapeNetの実験により,本手法が既存のSOTA法より優れていることを確認した。
論文参考訳（メタデータ） (2022-11-04T07:45:19Z)
Hierarchical Residual Attention Network for Single Image Super-Resolution [2.0571256241341924]
本稿では,残差特徴と注意集約の効率的な手法に基づく新しい軽量超解像モデルを提案する。提案アーキテクチャは,比較的少ない計算量とメモリフットプリントを維持しながら,いくつかのデータセットにおける最先端性能を上回る。
論文参考訳（メタデータ） (2020-12-08T17:24:28Z)
Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文参考訳（メタデータ） (2020-11-29T03:53:49Z)
MPRNet: Multi-Path Residual Network for Lightweight Image Super Resolution [2.3576437999036473]
軽量SRにおけるSOTA性能を向上させる軽量超解像ネットワークを提案する。提案アーキテクチャには新たなアテンション機構であるTwo-Fold Attention Moduleが含まれており,モデルの表現能力を最大化することができる。
論文参考訳（メタデータ） (2020-11-09T17:11:15Z)
Sequential Hierarchical Learning with Distribution Transformation for Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文参考訳（メタデータ） (2020-07-19T01:35:53Z)
Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。 3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文参考訳（メタデータ） (2020-07-10T08:08:20Z)
Learning Deformable Image Registration from Optimization: Perspective, Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文参考訳（メタデータ） (2020-04-30T03:23:45Z)
Spatial-Spectral Residual Network for Hyperspectral Image Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文参考訳（メタデータ） (2020-01-14T03:34:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。