論文の概要: Exploring Multi-Scale Feature Propagation and Communication for Image
Super Resolution
- arxiv url: http://arxiv.org/abs/2008.00239v2
- Date: Fri, 14 Aug 2020 08:03:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 01:04:03.651391
- Title: Exploring Multi-Scale Feature Propagation and Communication for Image
Super Resolution
- Title(参考訳): 画像超解像のためのマルチスケール特徴伝搬と通信の探索
- Authors: Ruicheng Feng, Weipeng Guan, Yu Qiao, Chao Dong
- Abstract要約: 広義のマルチスケール構造に対する統一的な定式化を提案する。
汎用的で効率的なマルチスケール・コンボリューション・ユニット - マルチスケール・クロススケール・シェアウェイト・コンボリューション(MS$3$-Conv)を提案する。
- 参考スコア(独自算出の注目度): 37.91175933401261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-scale techniques have achieved great success in a wide range of
computer vision tasks. However, while this technique is incorporated in
existing works, there still lacks a comprehensive investigation on variants of
multi-scale convolution in image super resolution. In this work, we present a
unified formulation over widely-used multi-scale structures. With this
framework, we systematically explore the two factors of multi-scale convolution
-- feature propagation and cross-scale communication. Based on the
investigation, we propose a generic and efficient multi-scale convolution unit
-- Multi-Scale cross-Scale Share-weights convolution (MS$^3$-Conv). Extensive
experiments demonstrate that the proposed MS$^3$-Conv can achieve better SR
performance than the standard convolution with less parameters and
computational cost. Beyond quantitative analysis, we comprehensively study the
visual quality, which shows that MS$^3$-Conv behave better to recover
high-frequency details.
- Abstract(参考訳): マルチスケール技術は、幅広いコンピュータビジョンタスクで大きな成功を収めてきた。
しかし、この手法は既存の作品に取り入れられているが、画像超解像におけるマルチスケール畳み込みの変種に関する包括的調査はいまだに欠けている。
本研究では,広義のマルチスケール構造に対する統一的な定式化を提案する。
このフレームワークでは,機能伝播とクロススケール通信という,マルチスケールの畳み込みの2つの要因を体系的に検討する。
本研究では,汎用的かつ効率的なマルチスケール畳み込みユニット -- マルチスケールクロススケール共有重み付け畳み込み (ms$^3$-conv) を提案する。
拡張実験により、提案したMS$^3$-Convは、より少ないパラメータと計算コストで標準の畳み込みよりも優れたSR性能が得られることを示した。
定量的解析の他に,MS$^3$-Convが高頻度の細部を回復する上で,より優れた振る舞いを示す視覚的品質を包括的に研究する。
関連論文リスト
- MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。
具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文 参考訳(メタデータ) (2024-08-25T06:20:28Z) - Implicit Grid Convolution for Multi-Scale Image Super-Resolution [6.8410780175245165]
我々は,Implicit Grid Convolution(IGConv)と連携して,単一エンコーダを用いたマルチスケールフレームワークを提案する。
本フレームワークは,既存の固定スケール手法に匹敵する性能を達成しつつ,トレーニング予算を削減し,パラメータを3倍に抑える。
論文 参考訳(メタデータ) (2024-08-19T03:30:15Z) - Multi-Scale Implicit Transformer with Re-parameterize for
Arbitrary-Scale Super-Resolution [2.4865475189445405]
マルチスケールインプリシットトランス(MSIT)
MSITは、MSNO(Multi-scale Neural Operator)とMSSA(Multi-scale Self-Attention)から構成される。
論文 参考訳(メタデータ) (2024-03-11T09:23:20Z) - Joint Depth Prediction and Semantic Segmentation with Multi-View SAM [59.99496827912684]
我々は,Segment Anything Model(SAM)のリッチなセマンティック特徴を利用した深度予測のためのマルチビューステレオ(MVS)手法を提案する。
この拡張深度予測は、Transformerベースのセマンティックセグメンテーションデコーダのプロンプトとして役立ちます。
論文 参考訳(メタデータ) (2023-10-31T20:15:40Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - Deep Diversity-Enhanced Feature Representation of Hyperspectral Images [87.47202258194719]
トポロジを改良して3次元畳み込みを補正し,上行階の高次化を図る。
また、要素間の独立性を最大化するために特徴マップに作用する新しい多様性対応正規化(DA-Reg)項を提案する。
提案したRe$3$-ConvSetとDA-Regの優位性を実証するために,様々なHS画像処理および解析タスクに適用する。
論文 参考訳(メタデータ) (2023-01-15T16:19:18Z) - Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution [50.10987776141901]
近年の視覚変換器と自己注意は,様々なコンピュータビジョンタスクにおいて有望な成果を上げている。
我々は,CNNの局所的特徴とトランスフォーマーが捉えた長距離依存性を活用する,超解像(SR)タスクのための効果的なハイブリッドアーキテクチャを提案する。
提案手法は,多数のベンチマークデータセットから最先端のSR結果を得る。
論文 参考訳(メタデータ) (2022-03-15T06:52:25Z) - Cross-MPI: Cross-scale Stereo for Image Super-Resolution using
Multiplane Images [44.85260985973405]
Cross-MPIは、新しい平面対応MPI機構、マルチスケールガイドアップサンプリングモジュール、超高分解能合成・融合モジュールからなるエンドツーエンドのRefSRネットワークである。
デジタル合成および光ズームクロススケールデータによる実験結果から,Cross-MPIフレームワークは既存のRefSR手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-11-30T09:14:07Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。