論文の概要: Bilateral Network with Channel Splitting Network and Transformer for
Thermal Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2206.12046v1
- Date: Fri, 24 Jun 2022 02:48:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 13:30:24.813469
- Title: Bilateral Network with Channel Splitting Network and Transformer for
Thermal Image Super-Resolution
- Title(参考訳): 熱画像超解像用チャネル分割ネットワークと変圧器を用いたバイラテラルネットワーク
- Authors: Bo Yan, Leilei Cao, Fengliang Qi and Hongbin Wang
- Abstract要約: 本稿では,PBVS-2022におけるチャネル分割ネットワークとトランスフォーマーを用いたバイラテラルネットワークの設計に関する技術的考察を紹介する。
提案手法は,PSNR=33.64,SSIM=0.9263,PSNR=21.08,SSIM=0.7803をPBVS-2022チャレンジテストデータセットで達成できる。
- 参考スコア(独自算出の注目度): 8.754793353368255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the Thermal Image Super-Resolution (TISR) problem has become
an attractive research topic. TISR would been used in a wide range of fields,
including military, medical, agricultural and animal ecology. Due to the
success of PBVS-2020 and PBVS-2021 workshop challenge, the result of TISR keeps
improving and attracts more researchers to sign up for PBVS-2022 challenge. In
this paper, we will introduce the technical details of our submission to
PBVS-2022 challenge designing a Bilateral Network with Channel Splitting
Network and Transformer(BN-CSNT) to tackle the TISR problem. Firstly, we
designed a context branch based on channel splitting network with transformer
to obtain sufficient context information. Secondly, we designed a spatial
branch with shallow transformer to extract low level features which can
preserve the spatial information. Finally, for the context branch in order to
fuse the features from channel splitting network and transformer, we proposed
an attention refinement module, and then features from context branch and
spatial branch are fused by proposed feature fusion module. The proposed method
can achieve PSNR=33.64, SSIM=0.9263 for x4 and PSNR=21.08, SSIM=0.7803 for x2
in the PBVS-2022 challenge test dataset.
- Abstract(参考訳): 近年、熱画像超解像(tisr)問題は魅力的な研究課題となっている。
TISRは、軍、医療、農業、動物の生態学など幅広い分野で使用される。
PBVS-2020とPBVS-2021ワークショップの課題の成功により、TISRの結果は改善され続け、より多くの研究者がPBVS-2022チャレンジに登録するようになった。
本稿では,チャネル分割ネットワークとトランスフォーマー(BN-CSNT)を備えたバイラテラルネットワークを設計し,TISR問題に対処するためのPBVS-2022チャレンジの技術的詳細を紹介する。
まず,トランスを用いたチャネル分割ネットワークに基づくコンテキスト分岐を設計し,十分なコンテキスト情報を得る。
第2に,浅層変圧器を用いた空間分岐を設計し,空間情報を保存できる低レベル特徴を抽出した。
最後に,チャネル分割ネットワークとトランスフォーマーから特徴を融合させるためのコンテキストブランチについて,注意改善モジュールを提案し,その後,特徴融合モジュールによってコンテキストブランチと空間ブランチの機能を融合させる。
提案手法は,PSNR=33.64,SSIM=0.9263,PSNR=21.08,SSIM=0.7803をPBVS-2022チャレンジテストデータセットで達成できる。
関連論文リスト
- SC-HVPPNet: Spatial and Channel Hybrid-Attention Video Post-Processing Network with CNN and Transformer [23.134971252569038]
畳み込みニューラルネットワーク(CNN)とTransformerは最近、ビデオ後処理に多くの注目を集めている。
空間・チャネルのハイブリッド・アテンション・ビデオ・ポスト・プロセシング・ネットワーク(SC-HVPPNet)を提案する。
SC-HVPPNetは、VTM-11.0-NNVC RA構成において、Y、U、Vコンポーネントの5.29%、12.42%、および13.09%の保存率で、ビデオ復元品質を著しく向上させる。
論文 参考訳(メタデータ) (2024-04-23T03:35:27Z) - Cross-Spatial Pixel Integration and Cross-Stage Feature Fusion Based
Transformer Network for Remote Sensing Image Super-Resolution [13.894645293832044]
変換器を用いたモデルでは、リモートセンシング画像超解像(RSISR)の競合性能が示されている。
本稿では,RSISRのための新しいトランスアーキテクチャであるCross-Spatial Pixel IntegrationとCross-Stage Feature Fusion Based Transformer Network (SPIFFNet)を提案する。
提案手法は,画像全体のグローバル認知と理解を効果的に促進し,機能統合の効率化を図っている。
論文 参考訳(メタデータ) (2023-07-06T13:19:06Z) - Cross-receptive Focused Inference Network for Lightweight Image
Super-Resolution [64.25751738088015]
トランスフォーマーに基づく手法は、単一画像超解像(SISR)タスクにおいて顕著な性能を示した。
動的に特徴を抽出するために文脈情報を組み込む必要がある変換器は無視される。
我々は,CNNとTransformerを混合したCTブロックのカスケードで構成される,軽量なクロスレセプティブ・フォーカスド・推論・ネットワーク(CFIN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T16:32:29Z) - BSRT: Improving Burst Super-Resolution with Swin Transformer and
Flow-Guided Deformable Alignment [84.82352123245488]
この研究は新しいアーキテクチャを使ってBurst Super-Resolution (BurstSR)タスクに対処し、ノイズ、不一致、低解像度のRAWバーストから高品質な画像を復元する必要がある。
本稿では,フレーム間情報抽出と再構築の能力を大幅に向上するBurst Super-Resolution Transformer (BSRT)を提案する。
我々のBSRTはNTIRE2022 Burst Super-Resolution Challengeで優勝した。
論文 参考訳(メタデータ) (2022-04-18T14:23:10Z) - P2T: Pyramid Pooling Transformer for Scene Understanding [62.41912463252468]
私たちはP2Tと呼ばれる下流タスク指向のトランスネットワークを構築します。
プールベースのMHSAを組み込んで、P2Tと呼ばれる下流タスク指向のトランスネットワークを構築しました。
論文 参考訳(メタデータ) (2021-06-22T18:28:52Z) - Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。
実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文 参考訳(メタデータ) (2021-06-14T17:39:49Z) - TransFuse: Fusing Transformers and CNNs for Medical Image Segmentation [9.266588373318688]
低レベルディテールのローカリゼーション能力を失うことなく、グローバルコンテキストのモデリングにおける効率性を改善する問題を検討する。
TransFuse、並列スタイルでトランスフォーマーとCNNを組み合わせた新しい2ブランチアーキテクチャが提案されています。
TransFuseでは、グローバル依存性と低レベルの空間詳細の両方を、はるかに浅い方法で効率的にキャプチャできます。
論文 参考訳(メタデータ) (2021-02-16T08:09:45Z) - TransGAN: Two Transformers Can Make One Strong GAN [111.07699201175919]
我々は、純粋なトランスフォーマーベースのアーキテクチャのみを用いて、完全に畳み込みのないGANテキストを構築できる最初のパイロット研究を行う。
バニラGANアーキテクチャはtextbfTransGANと呼ばれ、メモリフレンドリーなトランスフォーマーベースのジェネレータで構成されています。
当社の最高のアーキテクチャは、コンボリューションバックボーンに基づく最新のGANと比較して非常に競争力のあるパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-02-14T05:24:48Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。