論文の概要: SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer
- arxiv url: http://arxiv.org/abs/2503.15934v1
- Date: Thu, 20 Mar 2025 08:18:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 16:34:00.416471
- Title: SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer
- Title(参考訳): SaMam: 任意画像スタイル転送のためのスタイル認識状態空間モデル
- Authors: Hongda Liu, Longguang Wang, Ye Zhang, Ziru Yu, Yulan Guo,
- Abstract要約: 私たちはSaMamと呼ばれるMambaベースのスタイル転送フレームワークを開発した。
具体的には、コンテンツやスタイル情報を効率的に抽出するマンバエンコーダを設計する。
既存のSSMの局所的画素分割やチャネル冗長性,空間的不連続性といった問題に対処するために,局所的拡張とジグザグスキャンを導入する。
- 参考スコア(独自算出の注目度): 41.09041735653436
- License:
- Abstract: Global effective receptive field plays a crucial role for image style transfer (ST) to obtain high-quality stylized results. However, existing ST backbones (e.g., CNNs and Transformers) suffer huge computational complexity to achieve global receptive fields. Recently, the State Space Model (SSM), especially the improved variant Mamba, has shown great potential for long-range dependency modeling with linear complexity, which offers a approach to resolve the above dilemma. In this paper, we develop a Mamba-based style transfer framework, termed SaMam. Specifically, a mamba encoder is designed to efficiently extract content and style information. In addition, a style-aware mamba decoder is developed to flexibly adapt to various styles. Moreover, to address the problems of local pixel forgetting, channel redundancy and spatial discontinuity of existing SSMs, we introduce both local enhancement and zigzag scan. Qualitative and quantitative results demonstrate that our SaMam outperforms state-of-the-art methods in terms of both accuracy and efficiency.
- Abstract(参考訳): 大域的有効受容場は,高品質なスタイリング結果を得るために,画像スタイル転送(ST)において重要な役割を担っている。
しかし、既存のSTバックボーン(例えば、CNNやTransformers)は、グローバルな受容場を達成するために膨大な計算複雑性を被る。
近年,SSM(State Space Model),特に改良された変種Mambaは,線形複雑性を伴う長距離依存性モデリングに大きな可能性を示し,上記のジレンマを解決するためのアプローチを提供している。
本稿では,SaMamと呼ばれるMambaベースのスタイル転送フレームワークを開発する。
具体的には、コンテンツやスタイル情報を効率的に抽出するマンバエンコーダを設計する。
また、様々なスタイルに柔軟に対応するために、スタイル対応のマンバデコーダが開発されている。
さらに,既存のSSMの局所的画素認識,チャネル冗長性,空間的不連続性といった問題に対処するために,局所的拡張とジグザグスキャンを導入する。
定性的かつ定量的な結果から,我々のSaMamは精度と効率の両面で最先端の手法より優れていることが示された。
関連論文リスト
- MatIR: A Hybrid Mamba-Transformer Image Restoration Model [95.17418386046054]
そこで我々は,MatIRと呼ばれるMamba-Transformerハイブリッド画像復元モデルを提案する。
MatIRはTransformer層とMamba層のブロックをクロスサイクルして特徴を抽出する。
Mambaモジュールでは、4つのスキャンパスに沿って横断するImage Inpainting State Space (IRSS)モジュールを導入する。
論文 参考訳(メタデータ) (2025-01-30T14:55:40Z) - Detail Matters: Mamba-Inspired Joint Unfolding Network for Snapshot Spectral Compressive Imaging [40.80197280147993]
本研究では,HSI再建の非線形および不適切な特徴を克服するために,マンバインスパイアされたジョイント・アンフォールディング・ネットワーク(MiJUN)を提案する。
本稿では,初期最適化段階への依存を減らすために,高速化された展開ネットワーク方式を提案する。
テンソルモード-$k$展開をMambaネットワークに統合することにより,Mambaによる走査戦略を洗練する。
論文 参考訳(メタデータ) (2025-01-02T13:56:23Z) - StyleRWKV: High-Quality and High-Efficiency Style Transfer with RWKV-like Architecture [29.178246094092202]
スタイル転送は、スタイルソースの芸術的表現ではなく、コンテンツを保存する新しいイメージを生成することを目的としている。
既存の手法の多くはトランスフォーマーや拡散モデルに基づいているが、2次計算の複雑さと高い推論時間に悩まされている。
本稿では,メモリ使用量と線形時間複雑性を制限した高品質なスタイル転送を実現するための新しいフレームワークであるStyleRWKVを提案する。
論文 参考訳(メタデータ) (2024-12-27T09:01:15Z) - MobileMamba: Lightweight Multi-Receptive Visual Mamba Network [51.33486891724516]
従来の軽量モデルの研究は、主にCNNとTransformerベースの設計に重点を置いてきた。
効率と性能のバランスをとるMobileMambaフレームワークを提案する。
MobileMambaはTop-1で83.6%を達成し、既存の最先端の手法を上回っている。
論文 参考訳(メタデータ) (2024-11-24T18:01:05Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Deform-Mamba Network for MRI Super-Resolution [7.97504951029884]
MR画像の超解像のための新しいアーキテクチャDeform-Mambaを提案する。
変形ブロックと視覚マンバブロックの2つの分岐からなるデフォルム・マンバエンコーダを開発する。
コンテンツ適応型ローカルかつ効率的なグローバル情報を含むエンコーダの抽出された特徴により、視覚的Mambaデコーダは最終的に高品質なMR画像を生成する。
論文 参考訳(メタデータ) (2024-07-08T14:07:26Z) - Sigma: Siamese Mamba Network for Multi-Modal Semantic Segmentation [16.298890431384564]
先進マンバを用いたマルチモーダルセマンティックセマンティックセグメンテーションのためのシームズ・マンバネットワークであるSigmaを紹介する。
シームズエンコーダを用いて,マンバをベースとした核融合機構を革新することにより,様々なモーダルから重要な情報を効果的に選択する。
提案手法は, RGB-Thermal と RGB-Depth のセマンティックセマンティックセグメンテーションタスクに対して厳密に評価する。
論文 参考訳(メタデータ) (2024-04-05T17:59:44Z) - MambaIR: A Simple Baseline for Image Restoration with State-Space Model [46.827053426281715]
我々は,バニラ・マンバを改善するために,局部増強とチャンネルアテンションを導入するMambaIRを紹介した。
本手法は,画像SR上でSwinIRを最大0.45dB向上させる。
論文 参考訳(メタデータ) (2024-02-23T23:15:54Z) - PointMamba: A Simple State Space Model for Point Cloud Analysis [65.59944745840866]
我々は、最近の代表的状態空間モデル(SSM)であるMambaの成功を、NLPからポイントクラウド分析タスクへ転送するPointMambaを提案する。
従来のトランスフォーマーとは異なり、PointMambaは線形複雑性アルゴリズムを採用し、グローバルなモデリング能力を示しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2024-02-16T14:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。