論文の概要: Scan Clusters, Not Pixels: A Cluster-Centric Paradigm for Efficient Ultra-high-definition Image Restoration
- arxiv url: http://arxiv.org/abs/2602.21917v1
- Date: Wed, 25 Feb 2026 13:45:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.848986
- Title: Scan Clusters, Not Pixels: A Cluster-Centric Paradigm for Efficient Ultra-high-definition Image Restoration
- Title(参考訳): Scan Clusters, not Pixels: A Cluster-Centric Paradigm for Efficient Ultra-High-Definition Image Restoration (特集:画像認識と画像認識)
- Authors: Chen Wu, Ling Wang, Zhuoran Zheng, Yuning Cui, Zhixiong Yang, Xiangyu Chen, Yue Zhang, Weidong Jiang, Jingyuan Xia,
- Abstract要約: C$2$SSMは、ピクセルシリアルからクラスタシリアルスキャニングに移行する視覚状態空間モデルである。
中心となる発見は、UHD画像の豊富な特徴分布を、セマンティックセントロイドのスパースセットに蒸留できることである。
ソリューション以上のものでは、C$2$SSMは効率的な大規模ビジョンのための新しいコースをグラフ化している。
- 参考スコア(独自算出の注目度): 28.17529244607509
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultra-High-Definition (UHD) image restoration is trapped in a scalability crisis: existing models, bound to pixel-wise operations, demand unsustainable computation. While state space models (SSMs) like Mamba promise linear complexity, their pixel-serial scanning remains a fundamental bottleneck for the millions of pixels in UHD content. We ask: must we process every pixel to understand the image? This paper introduces C$^2$SSM, a visual state space model that breaks this taboo by shifting from pixel-serial to cluster-serial scanning. Our core discovery is that the rich feature distribution of a UHD image can be distilled into a sparse set of semantic centroids via a neural-parameterized mixture model. C$^2$SSM leverages this to reformulate global modeling into a novel dual-path process: it scans and reasons over a handful of cluster centers, then diffuses the global context back to all pixels through a principled similarity distribution, all while a lightweight modulator preserves fine details. This cluster-centric paradigm achieves a decisive leap in efficiency, slashing computational costs while establishing new state-of-the-art results across five UHD restoration tasks. More than a solution, C$^2$SSM charts a new course for efficient large-scale vision: scan clusters, not pixels.
- Abstract(参考訳): UHD(Ultra-High-Definition)イメージ復元はスケーラビリティの危機に陥り、既存のモデルはピクセル単位の演算に縛られ、持続不可能な計算を必要とする。
Mambaのような状態空間モデル(SSM)は線形複雑性を約束するが、そのピクセルシリアルスキャンはUHDコンテンツの数百万ピクセルの基本的なボトルネックである。
すべてのピクセルを処理して画像を理解する必要がありますか?
本稿では,C$^2$SSMという視覚状態空間モデルを紹介した。
核となる発見は、UHD画像の豊富な特徴分布を、ニューラルパラメータ化混合モデルを用いて、セマンティックセントロイドのスパースセットに蒸留することができることである。
C$^2$SSMは、これを利用して、グローバルモデリングを新しいデュアルパスプロセスに再構築する。これは、少数のクラスタセンターをスキャンし、その後、原則化された類似度分布を通じてグローバルコンテキストを全ピクセルに拡散させる。
このクラスタ中心のパラダイムは、計算コストを削減しつつ、5つのUHD復元タスクにまたがる新たな最先端の結果を確立しながら、効率を決定的に向上させる。
解よりは、C$^2$SSMは効率的な大規模ビジョンのための新しいコース、すなわちスキャンクラスタをピクセルではなくグラフ化する。
関連論文リスト
- Pixel to Gaussian: Ultra-Fast Continuous Super-Resolution with 2D Gaussian Modeling [50.34513854725803]
Arbitrary-scale Super- resolution (ASSR) は、低解像度(LR)入力から任意のアップサンプリング係数で高解像度(HR)イメージを再構成することを目的としている。
本稿では,Gaussian Splattingを用いたLR画像から2次元連続HR信号を明示的に再構成する,Pixel-to-Gaussianパラダイムを用いた新しいContinuousSRフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-09T13:43:57Z) - HAIR: Hypernetworks-based All-in-One Image Restoration [46.681872835394095]
HairはHypernetworksベースのオールインワンイメージ復元プラグイン・アンド・プレイ方式である。
入力画像に基づいてパラメータを生成し、モデルを動的に特定の劣化に適応させる。
シングルタスクとオールインワンの設定の両方において、既存の画像復元モデルの性能をプラグアンドプレイで大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-08-15T11:34:33Z) - Superpixel Graph Contrastive Clustering with Semantic-Invariant Augmentations for Hyperspectral Images [73.01141916544103]
ハイパースペクトル画像(HSI)クラスタリングは重要な課題だが難しい課題である。
まず3次元と2次元のハイブリッド畳み込みニューラルネットワークを用いてHSIの高次空間およびスペクトルの特徴を抽出する。
次に,超画素グラフの対比クラスタリングモデルを設計し,識別的超画素表現を学習する。
論文 参考訳(メタデータ) (2024-03-04T07:40:55Z) - Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。
提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-23T10:57:54Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution [74.82282301089994]
本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。
UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2021-03-23T17:36:42Z) - Implicit Integration of Superpixel Segmentation into Fully Convolutional
Networks [11.696069523681178]
スーパーピクセル方式をCNNに暗黙的に統合する方法を提案する。
提案手法では,下地層に画素を階層的にグループ化し,スーパーピクセルを生成する。
本手法は,セマンティックセグメンテーション,スーパーピクセルセグメンテーション,モノクル深度推定などのタスクで評価する。
論文 参考訳(メタデータ) (2021-03-05T02:20:26Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。