論文の概要: RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation
- arxiv url: http://arxiv.org/abs/2508.04190v1
- Date: Wed, 06 Aug 2025 08:19:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.621801
- Title: RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation
- Title(参考訳): RPCANet++: スパースオブジェクトセグメンテーションのための深い解釈可能なロバストPCA
- Authors: Fengyi Wu, Yimian Dai, Tianfang Zhang, Yixuan Ding, Jian Yang, Ming-Ming Cheng, Zhenming Peng,
- Abstract要約: RPCANet++は、RPCAの解釈可能性と効率的なディープアーキテクチャを融合したスパースオブジェクトセグメンテーションフレームワークである。
我々のアプローチは、緩やかなRPCAモデルを背景近似モジュール(BAM)、対象抽出モジュール(OEM)、画像復元モジュール(IRM)からなる構造化ネットワークに展開する。
さまざまなデータセットの実験では、RPCANet++がさまざまなイメージングシナリオの下で最先端のパフォーマンスを達成することが示されている。
- 参考スコア(独自算出の注目度): 51.37553739930992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust principal component analysis (RPCA) decomposes an observation matrix into low-rank background and sparse object components. This capability has enabled its application in tasks ranging from image restoration to segmentation. However, traditional RPCA models suffer from computational burdens caused by matrix operations, reliance on finely tuned hyperparameters, and rigid priors that limit adaptability in dynamic scenarios. To solve these limitations, we propose RPCANet++, a sparse object segmentation framework that fuses the interpretability of RPCA with efficient deep architectures. Our approach unfolds a relaxed RPCA model into a structured network comprising a Background Approximation Module (BAM), an Object Extraction Module (OEM), and an Image Restoration Module (IRM). To mitigate inter-stage transmission loss in the BAM, we introduce a Memory-Augmented Module (MAM) to enhance background feature preservation, while a Deep Contrast Prior Module (DCPM) leverages saliency cues to expedite object extraction. Extensive experiments on diverse datasets demonstrate that RPCANet++ achieves state-of-the-art performance under various imaging scenarios. We further improve interpretability via visual and numerical low-rankness and sparsity measurements. By combining the theoretical strengths of RPCA with the efficiency of deep networks, our approach sets a new baseline for reliable and interpretable sparse object segmentation. Codes are available at our Project Webpage https://fengyiwu98.github.io/rpcanetx.
- Abstract(参考訳): ロバスト・プリンシパル・コンポーネント分析(RPCA)は、観測行列を低ランクなバックグラウンドとスパースなオブジェクト・コンポーネントに分解する。
この機能は、画像復元からセグメンテーションまでのタスクに応用できる。
しかし、従来のRPCAモデルは、行列演算による計算負荷、微調整されたハイパーパラメータへの依存、動的シナリオにおける適応性を制限する厳密な事前処理に悩まされている。
これらの制限を解決するために,RPCAの解釈可能性と効率的な深層アーキテクチャを融合したスパースオブジェクトセグメンテーションフレームワークであるRPCANet++を提案する。
提案手法は,緩やかなRPCAモデルを背景近似モジュール(BAM),対象抽出モジュール(OEM),画像復元モジュール(IRM)からなる構造化ネットワークに展開する。
BAMにおける段間伝送損失を軽減するため,メモリ拡張モジュール (MAM) を導入し,背景特徴の保存性を高める一方,Deep Contrast Prior Module (DCPM) はサリエンシキューを利用してオブジェクト抽出を高速化する。
多様なデータセットに関する大規模な実験は、RPCANet++がさまざまなイメージングシナリオの下で最先端のパフォーマンスを達成することを実証している。
さらに,視覚的および数値的低ランク度と疎度測定による解釈可能性の向上を図る。
RPCAの理論的強みとディープネットワークの効率を組み合わせることで、我々は、信頼性と解釈可能なスパースオブジェクトセグメンテーションのための新しいベースラインを設定した。
コードは私たちのプロジェクトWebページ https://fengyiwu98.github.io/rpcanetx.comで公開されている。
関連論文リスト
- DRPCA-Net: Make Robust PCA Great Again for Infrared Small Target Detection [16.863479323884956]
赤外線小目標検出は、リモートセンシング、産業監視、一般用途において重要な役割を担っている。
近年のディープラーニングによる進歩にもかかわらず、多くのエンドツーエンドの畳み込みモデルは、ますます複雑なアーキテクチャを積み重ねることでパフォーマンスを追求する傾向にある。
本研究では,空間認識を学習可能なアーキテクチャに統合した新しい深層展開ネットワークであるDynamic RPCA Network (CA-Net)を提案する。
論文 参考訳(メタデータ) (2025-07-13T08:55:51Z) - MFPNet: Multi-scale Feature Propagation Network For Lightweight Semantic
Segmentation [5.58363644107113]
マルチスケール特徴伝達ネットワーク(Net)と呼ばれる,新しい軽量セグメンテーションアーキテクチャを提案する。
フレキシブル・ボトルネック・残差モジュール(BRM)からなる対称残差ブロックを有するロバスト・デコーダ構造を設計する。
遅延長範囲のコンテキスト関係をモデル化する能力の利点を生かして、グラフ畳み込みネットワーク(GCN)を活用し、BRMブロック間のマルチスケールフィーチャの伝搬を容易にする。
論文 参考訳(メタデータ) (2023-09-10T02:02:29Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - ISTR: End-to-End Instance Segmentation with Transformers [147.14073165997846]
ISTRと呼ばれるインスタンスセグメンテーショントランスフォーマーを提案します。これは、その種類の最初のエンドツーエンドフレームワークです。
ISTRは低次元マスクの埋め込みを予測し、それらのマスクの埋め込みと一致する。
ISTRは、提案されたエンドツーエンドのメカニズムにより、近似ベースのサブオプティマティック埋め込みでも最先端のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-05-03T06:00:09Z) - Hyper RPCA: Joint Maximum Correntropy Criterion and Laplacian Scale
Mixture Modeling On-the-Fly for Moving Object Detection [27.76948564419732]
移動物体検出は、多くの視覚関連タスクにおける自動ビデオ解析において重要である。
本稿では,高速で動く物体を検出するための新しいRPCAモデルHyper RPCAを提案する。
論文 参考訳(メタデータ) (2020-06-14T04:35:45Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。