論文の概要: Uformer-ICS: A U-Shaped Transformer for Image Compressive Sensing Service
- arxiv url: http://arxiv.org/abs/2209.01763v2
- Date: Tue, 2 Jul 2024 02:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 10:36:26.881252
- Title: Uformer-ICS: A U-Shaped Transformer for Image Compressive Sensing Service
- Title(参考訳): Uformer-ICS:画像圧縮センシングサービス用U字型トランス
- Authors: Kuiyuan Zhang, Zhongyun Hua, Yuanman Li, Yushu Zhang, Yicong Zhou,
- Abstract要約: 画像CSタスクのための新しいU字型トランスとしてUformer-ICSを提案する。
推定ブロック間隔に基づいて測定資源を割り当てる適応型サンプリングアーキテクチャを設計する。
本モデルでは,画像の局所的特徴と長距離依存性を同時に利用することができる。
- 参考スコア(独自算出の注目度): 43.23436916495013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many service computing applications require real-time dataset collection from multiple devices, necessitating efficient sampling techniques to reduce bandwidth and storage pressure. Compressive sensing (CS) has found wide-ranging applications in image acquisition and reconstruction. Recently, numerous deep-learning methods have been introduced for CS tasks. However, the accurate reconstruction of images from measurements remains a significant challenge, especially at low sampling rates. In this paper, we propose Uformer-ICS as a novel U-shaped transformer for image CS tasks by introducing inner characteristics of CS into transformer architecture. To utilize the uneven sparsity distribution of image blocks, we design an adaptive sampling architecture that allocates measurement resources based on the estimated block sparsity, allowing the compressed results to retain maximum information from the original image. Additionally, we introduce a multi-channel projection (MCP) module inspired by traditional CS optimization methods. By integrating the MCP module into the transformer blocks, we construct projection-based transformer blocks, and then form a symmetrical reconstruction model using these blocks and residual convolutional blocks. Therefore, our reconstruction model can simultaneously utilize the local features and long-range dependencies of image, and the prior projection knowledge of CS theory. Experimental results demonstrate its significantly better reconstruction performance than state-of-the-art deep learning-based CS methods.
- Abstract(参考訳): 多くのサービスコンピューティングアプリケーションは、複数のデバイスからのリアルタイムデータセット収集を必要とし、帯域幅とストレージの圧力を減らすために効率的なサンプリング技術を必要とする。
圧縮センシング(CS)は画像の取得と再構成に広く応用されている。
近年,CSタスクに多くのディープラーニング手法が導入されている。
しかし、特にサンプリングレートの低い場合には、計測による画像の正確な再構成は重要な課題である。
本稿では,CSの内部特性をトランスアーキテクチャに導入することにより,画像CSタスクのための新しいU字型変換器としてUformer-ICSを提案する。
画像ブロックの不均一な間隔分布を利用するために,推定ブロック間隔に基づいて測定資源を割り当てる適応サンプリングアーキテクチャを設計し,圧縮された結果が元の画像から最大情報を保持できるようにする。
さらに,従来のCS最適化手法にインスパイアされたマルチチャネルプロジェクション(MCP)モジュールを導入する。
MCPモジュールをトランスブロックに統合することにより、プロジェクションベースのトランスフォーマーブロックを構築し、これらのブロックと残差畳み込みブロックを用いて対称再構成モデルを構築する。
したがって,画像の局所的特徴と長距離依存性と,CS理論の事前予測知識を同時に利用することができる。
実験により, 最先端の深層学習に基づくCS法に比べて, 再構成性能が有意に向上した。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - MsDC-DEQ-Net: Deep Equilibrium Model (DEQ) with Multi-scale Dilated
Convolution for Image Compressive Sensing (CS) [0.0]
圧縮センシング(CS)は、従来のサンプリング法よりも少ない測定値を用いてスパース信号の回復を可能にする技術である。
我々はCSを用いた自然画像再構成のための解釈可能かつ簡潔なニューラルネットワークモデルを構築した。
MsDC-DEQ-Netと呼ばれるこのモデルは、最先端のネットワークベースの手法と比較して、競争力のある性能を示す。
論文 参考訳(メタデータ) (2024-01-05T16:25:58Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - AICT: An Adaptive Image Compression Transformer [18.05997169440533]
我々は、より単純で効果的なTranformerベースのチャネルワイド自動回帰事前モデルを提案し、絶対画像圧縮変換器(ICT)を実現する。
提案したICTは、潜在表現からグローバルとローカルの両方のコンテキストをキャプチャできる。
我々は、サンドイッチのConvNeXtベースのプリ/ポストプロセッサで学習可能なスケーリングモジュールを活用し、よりコンパクトな潜在表現を正確に抽出する。
論文 参考訳(メタデータ) (2023-07-12T11:32:02Z) - Image Compressed Sensing with Multi-scale Dilated Convolutional Neural
Network [2.719222831651969]
本稿では,CS計測と再構成のためのMsDCNN(Multiscale Dilated Convolution Neural Network)という新しいフレームワークを提案する。
測定期間中、完全に畳み込み構造を用いる訓練された測定ネットワークから、すべての測定値を直接取得する。
再建期間中に,人間の視覚システムを模倣するマルチスケール特徴抽出(MFE)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-28T01:11:56Z) - Cross-receptive Focused Inference Network for Lightweight Image
Super-Resolution [64.25751738088015]
トランスフォーマーに基づく手法は、単一画像超解像(SISR)タスクにおいて顕著な性能を示した。
動的に特徴を抽出するために文脈情報を組み込む必要がある変換器は無視される。
我々は,CNNとTransformerを混合したCTブロックのカスケードで構成される,軽量なクロスレセプティブ・フォーカスド・推論・ネットワーク(CFIN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T16:32:29Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Towards End-to-End Image Compression and Analysis with Transformers [99.50111380056043]
本稿では,クラウドベースの画像分類アプリケーションを対象として,トランスフォーマーを用いたエンドツーエンドの画像圧縮解析モデルを提案する。
我々は、圧縮された特徴から画像分類を行うためにビジョントランスフォーマー(ViT)モデルを再設計し、トランスフォーマーからの長期情報を用いて画像圧縮を容易にすることを目指している。
画像圧縮と分類作業の両方において,提案モデルの有効性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2021-12-17T03:28:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。