論文の概要: Superpixel-informed Continuous Low-Rank Tensor Representation for Multi-Dimensional Data Recovery
- arxiv url: http://arxiv.org/abs/2508.12261v2
- Date: Wed, 20 Aug 2025 12:20:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 12:38:45.407932
- Title: Superpixel-informed Continuous Low-Rank Tensor Representation for Multi-Dimensional Data Recovery
- Title(参考訳): マルチ次元データ復元のための超画素インフォーム型連続低ランクテンソル表現
- Authors: Zhizhou Wang, Jianli Wang, Ruijing Zheng, Zhenyu Wu,
- Abstract要約: 低ランクテンソル表現(LRTR)は多次元データ処理の強力なツールとして登場した。
Superpixel-informed Continuous Low-rank Representation (SCTR)フレームワークは、多次元データの連続的かつ柔軟なモデリングを可能にする。
SCTRは、マルチスペクトル画像、ビデオ、カラー画像にまたがる既存のLRTR法よりも3~5dBのPSNRの改善を実現している。
- 参考スコア(独自算出の注目度): 17.554617777765866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low-rank tensor representation (LRTR) has emerged as a powerful tool for multi-dimensional data processing. However, classical LRTR-based methods face two critical limitations: (1) they typically assume that the holistic data is low-rank, this assumption is often violated in real-world scenarios with significant spatial variations; and (2) they are constrained to discrete meshgrid data, limiting their flexibility and applicability. To overcome these limitations, we propose a Superpixel-informed Continuous low-rank Tensor Representation (SCTR) framework, which enables continuous and flexible modeling of multi-dimensional data beyond traditional grid-based constraints. Our approach introduces two main innovations: First, motivated by the observation that semantically coherent regions exhibit stronger low-rank characteristics than holistic data, we employ superpixels as the basic modeling units. This design not only encodes rich semantic information, but also enhances adaptability to diverse forms of data streams. Second, we propose a novel asymmetric low-rank tensor factorization (ALTF) where superpixel-specific factor matrices are parameterized by a shared neural network with specialized heads. By strategically separating global pattern learning from local adaptation, this framework efficiently captures both cross-superpixel commonalities and within-superpixel variations. This yields a representation that is both highly expressive and compact, balancing model efficiency with adaptability. Extensive experiments on several benchmark datasets demonstrate that SCTR achieves 3-5 dB PSNR improvements over existing LRTR-based methods across multispectral images, videos, and color images.
- Abstract(参考訳): 低ランクテンソル表現(LRTR)は多次元データ処理の強力なツールとして登場した。
しかし、古典的なLRTRベースの手法は、2つの重要な制限に直面している:(1) 概略的データが低ランクであると仮定し、この仮定は空間的変動が著しい現実のシナリオでしばしば違反される; (2) 離散メッシュグリッドデータに制約され、その柔軟性と適用性が制限される。
これらの制約を克服するために,従来のグリッドベース制約を超えた多次元データの連続的かつ柔軟なモデリングを可能にする,Superpixel-informed Continuous Low-rank Tensor Representation (SCTR)フレームワークを提案する。
まず、セマンティックコヒーレントな領域が全体データよりも強い低ランク特性を示すという観察に動機付けられ、基本モデリング単位としてスーパーピクセルを用いる。
この設計は、リッチなセマンティック情報をエンコードするだけでなく、多様なデータストリームの形式への適応性を高める。
第2に,スーパーピクセル固有の因子行列を専用ヘッドを持つ共有ニューラルネットワークによりパラメータ化する,新しい非対称な低ランクテンソル因子化(ALTF)を提案する。
グローバルなパターン学習を局所的な適応から戦略的に分離することにより、超画素間の共通点と超画素内変動の両方を効率的に捉えることができる。
これにより、非常に表現力が高くコンパクトであり、モデルの効率と適応性とのバランスをとる表現が得られる。
いくつかのベンチマークデータセットに対する大規模な実験により、SCTRは、マルチスペクトル画像、ビデオ、カラー画像にわたる既存のLRTRベースの手法よりも3,5dBのPSNRの改善を達成している。
関連論文リスト
- C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales [6.700548615812325]
我々は、注目に基づく画像超解像モデルの最適化のための新しいフレームワーク、textbfC2D-ISRを提案する。
このアプローチは、2段階のトレーニング手法と階層的なエンコーディング機構に基づいている。
さらに,既存のアテンションベースネットワーク構造を用いて階層符号化機構を一般化する。
論文 参考訳(メタデータ) (2025-03-17T21:52:18Z) - Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains [1.5124439914522694]
DeDiNATはDilated Neighborhood Attentionに基づくデブロアリングトランスフォーマーである。
チャンネル横断学習者は、隣接するチャンネル間の短距離関係を理解するためにトランスフォーマーブロックを支援する。
最先端モデルと比較して、コンパクトなDeDiNATはより優れた一般化能力を示し、知覚的メトリクスにおいて顕著な性能を達成する。
論文 参考訳(メタデータ) (2024-03-19T21:31:31Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Multi-Context Dual Hyper-Prior Neural Image Compression [10.349258638494137]
入力画像から局所的情報と大域的情報の両方を効率的にキャプチャするトランスフォーマーに基づく非線形変換を提案する。
また、2つの異なるハイパープライヤを組み込んだ新しいエントロピーモデルを導入し、潜在表現のチャネル間および空間的依存関係をモデル化する。
実験の結果,提案するフレームワークは,速度歪み性能の観点から,最先端の手法よりも優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-09-19T17:44:44Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Neural BRDF Representation and Importance Sampling [79.84316447473873]
本稿では,リフレクタンスBRDFデータのコンパクトニューラルネットワークに基づく表現について述べる。
BRDFを軽量ネットワークとしてエンコードし、適応角サンプリングによるトレーニングスキームを提案する。
複数の実世界のデータセットから等方性および異方性BRDFの符号化結果を評価する。
論文 参考訳(メタデータ) (2021-02-11T12:00:24Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。