Fugu-MT 論文翻訳(概要): DDT: Dual-branch Deformable Transformer for Image Denoising

論文の概要: DDT: Dual-branch Deformable Transformer for Image Denoising

arxiv url: http://arxiv.org/abs/2304.06346v1
Date: Thu, 13 Apr 2023 08:54:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-14 15:12:30.343283
Title: DDT: Dual-branch Deformable Transformer for Image Denoising
Title（参考訳）: ddt:画像デノイジング用デュアルブランチ変形変圧器
Authors: Kangliang Liu, Xiangcheng Du, Sijie Liu, Yingbin Zheng, Xingjiao Wu, Cheng Jin
Abstract要約: Transformerは、帰納的畳み込みバイアスによって引き起こされる制限を克服するために、長距離依存をモデル化できるため、画像記述タスクに有用である。本稿では,DDT(Dual-branch Deformable Transformer)とDDT(Dual-branch Deformable Transformer)を並列に処理するネットワークを提案する。
参考スコア（独自算出の注目度）: 6.596462333804802
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Transformer is beneficial for image denoising tasks since it can model long-range dependencies to overcome the limitations presented by inductive convolutional biases. However, directly applying the transformer structure to remove noise is challenging because its complexity grows quadratically with the spatial resolution. In this paper, we propose an efficient Dual-branch Deformable Transformer (DDT) denoising network which captures both local and global interactions in parallel. We divide features with a fixed patch size and a fixed number of patches in local and global branches, respectively. In addition, we apply deformable attention operation in both branches, which helps the network focus on more important regions and further reduces computational complexity. We conduct extensive experiments on real-world and synthetic denoising tasks, and the proposed DDT achieves state-of-the-art performance with significantly fewer computational costs.
Abstract（参考訳）: インダクティブ畳み込みバイアス(inductive convolutional bias)によって提示される制限を克服するために長距離依存をモデル化できるため、トランスフォーマーは画像デノイジングタスクに有用である。しかし, ノイズ除去に変換器構造を直接適用することは, 空間分解能と重なり合うため困難である。本稿では,局所的および大域的相互作用を並列に捉える効率的な二重分岐変形型変圧器(ddt)デノイジングネットワークを提案する。ローカルブランチとグローバルブランチでそれぞれ、固定パッチサイズと固定パッチ数で特徴を分割します。さらに,両ブランチに変形可能な注意操作を適用することで,ネットワークがより重要な領域に集中し,計算の複雑さをさらに低減する。実世界および合成復調タスクについて広範な実験を行い,提案したDDTは計算コストを著しく低減して最先端の性能を実現する。

関連論文リスト

Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。本研究では, 回転同変ASISR法の構築に尽力する。
論文参考訳（メタデータ） (2025-08-07T08:51:03Z)
Attention-Only Transformers via Unrolled Subspace Denoising [19.832264029213515]
必要なコンポーネントのみを持つ完全に解釈可能なトランスフォーマーアーキテクチャを導出する。このような反復的なdenoising操作をディープネットワークにアンロールすることで、我々は非常にコンパクトなアーキテクチャに到達します。その単純さにもかかわらず、ビジョンと言語タスクの実験は、そのようなトランスフォーマーが標準的なトランスフォーマーアーキテクチャに近い性能を達成することを示した。
論文参考訳（メタデータ） (2025-06-04T09:53:14Z)
A TRPCA-Inspired Deep Unfolding Network for Hyperspectral Image Denoising via Thresholded t-SVD and Top-K Sparse Transformer [20.17660504535571]
本稿では,低ランクとスパースという2つの密に統合されたモジュール間のステージワイドな交互化を実現する新しいディープ展開ネットワーク(DU-TRPCA)を提案する。合成および実世界のHSIの実験により、DU-TRPCAは高密度混合雑音下で最先端の手法を超越していることが示された。
論文参考訳（メタデータ） (2025-06-03T02:01:39Z)
PiT: Progressive Diffusion Transformer [50.46345527963736]
Pseudo textbfProgressive Dtextbfiffusion textbfTransformer (textbfPiT)を提案する。提案したPiT-Lは,演算量が少なく,DiT-XL/2よりも54%$uparrow$FIDの改善を実現している。
論文参考訳（メタデータ） (2025-05-19T15:02:33Z)
RSRWKV: A Linear-Complexity 2D Attention Mechanism for Efficient Remote Sensing Vision Task [20.16344973940904]
高分解能リモートセンシング分析は、シーンの複雑さとスケールの多様性による課題に直面している。逐次処理と2次元空間推論を橋渡しする新しい2D-WKVスキャン機構を特徴とするSRWKVを提案する。
論文参考訳（メタデータ） (2025-03-26T10:03:46Z)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。 PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。 FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳（メタデータ） (2025-03-25T15:04:53Z)
Task-Aware Dynamic Transformer for Efficient Arbitrary-Scale Image Super-Resolution [8.78015409192613]
Arbitrary-scale Super- resolution (ASSR) は、任意の拡大スケールで画像超解像の1つのモデルを学ぶことを目的としている。既存のASSRネットワークは、通常、既製のスケール非依存の特徴抽出器と任意のスケールアップサンプラーから構成される。本稿では,効率的な画像ASSRのための入力適応型特徴抽出器として,タスク対応動的変換器(TADT)を提案する。
論文参考訳（メタデータ） (2024-08-16T13:35:52Z)
Efficient Diffusion Transformer with Step-wise Dynamic Attention Mediators [83.48423407316713]
本稿では,クエリとキーを別々に扱うために,追加の仲介者トークンを組み込んだ新しい拡散トランスフォーマーフレームワークを提案する。本モデルでは, 正確な非曖昧な段階を呈し, 詳細に富んだ段階へと徐々に遷移する。本手法は,最近のSiTと統合した場合に,最先端のFIDスコア2.01を達成する。
論文参考訳（メタデータ） (2024-08-11T07:01:39Z)
Efficient Multi-disparity Transformer for Light Field Image Super-resolution [6.814658355110824]
本稿では,光フィールド画像超解像(LFSR)に適した新しい変圧器であるMulti-scale Disparity Transformer(MDT)を提案する。 MDTは、サブアパーチャ画像の不特定処理による計算冗長性と不均一な絡み合いの問題に対処する。このアーキテクチャに基づいて,効率的なLFSRネットワークLF-MDTNetを提案する。
論文参考訳（メタデータ） (2024-07-22T02:23:09Z)
Adaptive Step-size Perception Unfolding Network with Non-local Hybrid Attention for Hyperspectral Image Reconstruction [0.39134031118910273]
FISTAアルゴリズムに基づく深層展開ネットワークであるASPUNを提案する。さらに,非局所的ハイブリッドアテンショントランス (NHAT) モジュールを設計し,コンバータの受容場特性をフル活用する。実験の結果, ASPUNは既存のSOTAアルゴリズムよりも優れ, 最高の性能が得られることがわかった。
論文参考訳（メタデータ） (2024-07-04T16:09:52Z)
Multi-Grid Tensorized Fourier Neural Operator for High-Resolution PDEs [93.82811501035569]
本稿では,メモリ要求を低減し,より一般化したデータ効率・並列化可能な演算子学習手法を提案する。 MG-TFNOは、実世界の実世界の現象の局所的構造と大域的構造を活用することで、大規模な分解能にスケールする。乱流ナビエ・ストークス方程式において150倍以上の圧縮で誤差の半分以下を達成できる優れた性能を示す。
論文参考訳（メタデータ） (2023-09-29T20:18:52Z)
Mutual Information-driven Triple Interaction Network for Efficient Image Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文参考訳（メタデータ） (2023-08-14T08:23:58Z)
Short Range Correlation Transformer for Occluded Person Re-Identification [4.339510167603376]
PFTと呼ばれる部分的特徴変換器に基づく人物識別フレームワークを提案する。提案したPFTは3つのモジュールを用いて視覚変換器の効率を向上する。包括的および包括的再同定データセットに対する実験結果から,提案したPFTネットワークが一貫した性能を実現することを示す。
論文参考訳（メタデータ） (2022-01-04T11:12:39Z)
CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文参考訳（メタデータ） (2021-12-31T04:37:11Z)
Adaptive Fourier Neural Operators: Efficient Token Mixers for Transformers [55.90468016961356]
本稿では,Fourierドメインのミキシングを学習する効率的なトークンミキサーを提案する。 AFNOは、演算子学習の原則的基礎に基づいている。 65kのシーケンスサイズを処理でき、他の効率的な自己認識機構より優れている。
論文参考訳（メタデータ） (2021-11-24T05:44:31Z)
Dispensed Transformer Network for Unsupervised Domain Adaptation [21.256375606219073]
本稿では,新しい非教師付き領域適応 (UDA) 方式であるディスペンデントトランスフォーマーネットワーク (DTNet) について述べる。提案するネットワークは,いくつかの最先端技術と比較して,最高の性能を実現している。
論文参考訳（メタデータ） (2021-10-28T08:27:44Z)
Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文参考訳（メタデータ） (2021-06-14T17:39:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。