論文の概要: Frequency-Integrated Transformer for Arbitrary-Scale Super-Resolution
- arxiv url: http://arxiv.org/abs/2504.18818v1
- Date: Sat, 26 Apr 2025 06:12:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.005754
- Title: Frequency-Integrated Transformer for Arbitrary-Scale Super-Resolution
- Title(参考訳): 任意スケール超解像用周波数印加変圧器
- Authors: Xufei Wang, Fei Ge, Jinchen Zhu, Mingjian Zhang, Qi Wu, Jifeng Ren Shizhuang Weng,
- Abstract要約: 暗黙の神経表現に基づく手法は、任意のスケールの超解像(ASSR)タスクにおいて顕著な機能を示した。
本稿では、周波数情報を組み込んでASSR性能を向上させるためのFIT( Frequency-Integrated Transformer)と呼ばれる新しいネットワークを提案する。
- 参考スコア(独自算出の注目度): 8.303267303436613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Methods based on implicit neural representation have demonstrated remarkable capabilities in arbitrary-scale super-resolution (ASSR) tasks, but they neglect the potential value of the frequency domain, leading to sub-optimal performance. We proposes a novel network called Frequency-Integrated Transformer (FIT) to incorporate and utilize frequency information to enhance ASSR performance. FIT employs Frequency Incorporation Module (FIM) to introduce frequency information in a lossless manner and Frequency Utilization Self-Attention module (FUSAM) to efficiently leverage frequency information by exploiting spatial-frequency interrelationship and global nature of frequency. FIM enriches detail characterization by incorporating frequency information through a combination of Fast Fourier Transform (FFT) with real-imaginary mapping. In FUSAM, Interaction Implicit Self-Attention (IISA) achieves cross-domain information synergy by interacting spatial and frequency information in subspace, while Frequency Correlation Self-attention (FCSA) captures the global context by computing correlation in frequency. Experimental results demonstrate FIT yields superior performance compared to existing methods across multiple benchmark datasets. Visual feature map proves the superiority of FIM in enriching detail characterization. Frequency error map validates IISA productively improve the frequency fidelity. Local attribution map validates FCSA effectively captures global context.
- Abstract(参考訳): 暗黙的な神経表現に基づく手法は、任意のスケールの超解像(ASSR)タスクにおいて顕著な能力を示すが、周波数領域の潜在的な価値を無視し、準最適性能をもたらす。
本稿では、周波数情報を組み込んでASSR性能を向上させるためのFIT( Frequency-Integrated Transformer)と呼ばれる新しいネットワークを提案する。
FITは、周波数情報を損失のない方法で導入するために周波数Incorporation Module(FIM)と、周波数利用自己認識モジュール(FUSAM)を用い、空間周波数相互関係と周波数のグローバルな性質を利用して周波数情報を効率的に活用する。
FIMは、Fast Fourier Transform (FFT)と実画像マッピングを組み合わせることで、周波数情報を組み込むことにより、詳細な特徴付けを強化する。
FUSAMにおいて、IISA(Interaction Implicit Self-Attention)は、サブスペース内の空間情報と周波数情報を相互作用させることにより、ドメイン間の情報シナジーを実現する。
実験により、FITは複数のベンチマークデータセットにまたがる既存手法と比較して優れた性能を示す。
視覚特徴マップは、詳細な特徴付けを充実させる上で、FIMの優位性を証明している。
周波数誤差マップは、IISAが周波数忠実度を生産的に向上することを検証する。
ローカル属性マップは、FCSAがグローバルコンテキストを効果的にキャプチャすることを検証する。
関連論文リスト
- FMNet: Frequency-Assisted Mamba-Like Linear Attention Network for Camouflaged Object Detection [7.246630480680039]
カモフラージュ対象物検出(COD)は、カモフラージュ対象物とその周囲の強い類似性のために困難である。
既存の手法は主に空間的局所的特徴に依存しており、グローバルな情報を捉えていない。
これを解決するために、FMNet ( Frequency-Assisted Mamba-Like Linear Attention Network) を提案する。
論文 参考訳(メタデータ) (2025-03-14T02:55:19Z) - FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - F-SE-LSTM: A Time Series Anomaly Detection Method with Frequency Domain Information [10.113418621891281]
F-SE-LSTMと呼ばれる新しい時系列異常検出法を提案する。
この方法は、2つのスライディングウィンドウと高速フーリエ変換(FFT)を用いて周波数行列を構成する。
F-SE-LSTMは、通常の時間領域や周波数領域のデータよりも識別能力が高いことを示す。
論文 参考訳(メタデータ) (2024-12-03T14:36:24Z) - Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.74383395813782]
本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T12:02:47Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Adaptive Frequency Filters As Efficient Global Token Mixers [100.27957692579892]
適応周波数フィルタは効率的なグローバルトークンミキサーとして機能することを示す。
我々は、AFFNetと呼ばれる軽量ニューラルネットワークを構築するために、AFFトークンミキサーを主要なニューラルネットワークとして捉えています。
論文 参考訳(メタデータ) (2023-07-26T07:42:28Z) - FreConv: Frequency Branch-and-Integration Convolutional Networks [37.51672240863451]
本稿では、バニラ畳み込みを置き換えるためにFreConv(周波数分岐積分畳み込み)を提案する。
FreConvは、高周波数情報と低周波情報を抽出し統合するためのデュアルブランチアーキテクチャを採用している。
FreConvを組み込んだネットワークは、常に最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2023-04-10T12:24:14Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。