論文の概要: Large-scale Global Low-rank Optimization for Computational Compressed
Imaging
- arxiv url: http://arxiv.org/abs/2301.03047v1
- Date: Sun, 8 Jan 2023 14:12:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 18:49:07.214071
- Title: Large-scale Global Low-rank Optimization for Computational Compressed
Imaging
- Title(参考訳): 計算圧縮画像の大規模グローバル低ランク最適化
- Authors: Daoyu Li, Hanwen Xu, Miao Cao, Xin Yuan, David J. Brady, and Liheng
Bian
- Abstract要約: 本稿では,グローバルな自己相似性と高効率な大規模再構成を実現するグローバル低ランク(GLR)最適化手法を提案する。
深層学習における自己認識機構に触発されたGLRは、従来の一様選択の代わりに特徴検出によって画像パッチを抽出する。
時間・周波数・スペクトル次元におけるGLRの有効性を実験的に実証した。
- 参考スコア(独自算出の注目度): 8.594666859332124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computational reconstruction plays a vital role in computer vision and
computational photography. Most of the conventional optimization and deep
learning techniques explore local information for reconstruction. Recently,
nonlocal low-rank (NLR) reconstruction has achieved remarkable success in
improving accuracy and generalization. However, the computational cost has
inhibited NLR from seeking global structural similarity, which consequentially
keeps it trapped in the tradeoff between accuracy and efficiency and prevents
it from high-dimensional large-scale tasks. To address this challenge, we
report here the global low-rank (GLR) optimization technique, realizing
highly-efficient large-scale reconstruction with global self-similarity.
Inspired by the self-attention mechanism in deep learning, GLR extracts
exemplar image patches by feature detection instead of conventional uniform
selection. This directly produces key patches using structural features to
avoid burdensome computational redundancy. Further, it performs patch matching
across the entire image via neural-based convolution, which produces the global
similarity heat map in parallel, rather than conventional sequential block-wise
matching. As such, GLR improves patch grouping efficiency by more than one
order of magnitude. We experimentally demonstrate GLR's effectiveness on
temporal, frequency, and spectral dimensions, including different computational
imaging modalities of compressive temporal imaging, magnetic resonance imaging,
and multispectral filter array demosaicing. This work presents the superiority
of inherent fusion of deep learning strategies and iterative optimization, and
breaks the persistent dilemma of the tradeoff between accuracy and efficiency
for various large-scale reconstruction tasks.
- Abstract(参考訳): 計算再構成はコンピュータビジョンと計算写真において重要な役割を果たす。
従来の最適化とディープラーニング技術のほとんどは、再構築のためのローカルな情報を探索する。
近年,非局所低位 (nlr) 再構成が精度向上と一般化に成功している。
しかし、計算コストはnlrがグローバルな構造的類似性を求めることを妨げており、精度と効率のトレードオフに閉じ込められ、高次元の大規模タスクを妨げている。
この課題に対処するために,グローバルな低ランク(GLR)最適化手法を報告し,グローバルな自己相似性を備えた大規模再構築を実現する。
深層学習における自己注意機構に触発されたGLRは、従来の均一選択ではなく特徴検出によって、典型的な画像パッチを抽出する。
これにより、構造的特徴を使ってキーパッチを直接生成し、負担の多い計算冗長性を回避する。
さらに、ニューラルネットワークによる畳み込みによって画像全体のパッチマッチングを実行し、従来のシーケンシャルなブロックワイドマッチングではなく、グローバルな類似性ヒートマップを並列に生成する。
したがって、GLRはパッチグループ化効率を1桁以上改善する。
GLRの時間, 周波数, スペクトル次元に対する効果を実験的に実証し, 圧縮時間像, 磁気共鳴画像, マルチスペクトルフィルタアレイの復調の異なる計算画像特性について検討した。
本研究は,深層学習戦略と反復最適化の融合の優越性を示し,様々な大規模再構築タスクにおける精度と効率のトレードオフの持続的ジレンマを破るものである。
関連論文リスト
- DGTR: Distributed Gaussian Turbo-Reconstruction for Sparse-View Vast Scenes [81.56206845824572]
新規ビュー合成(NVS)アプローチは、広大なシーン再構築において重要な役割を担っている。
大規模な環境下では、復元の質が悪くなる場合が少なくない。
本稿では,スパース・ビュー・ワイド・シーンのための効率的なガウス再構成のための分散フレームワークであるDGTRを提案する。
論文 参考訳(メタデータ) (2024-11-19T07:51:44Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - Efficient Real-world Image Super-Resolution Via Adaptive Directional Gradient Convolution [80.85121353651554]
畳み込みカーネル内でのカーネル単位の微分演算を導入し、学習可能な方向勾配畳み込みを開発する。
これらの畳み込みは、新しい線形重み付け機構と平行に統合され、適応方向勾配畳み込み(DGConv)を形成する。
さらに,適応情報相互作用ブロック(AIIBlock)を設計し,テクスチャとコントラストの強化のバランスをとるとともに,相互依存性を慎重に検討し,単純な積み重ねによるリアルSRのためのDGPNetを作成する。
論文 参考訳(メタデータ) (2024-05-11T14:21:40Z) - Efficient Model Agnostic Approach for Implicit Neural Representation
Based Arbitrary-Scale Image Super-Resolution [5.704360536038803]
単一の画像超解像(SISR)は、主に深層畳み込みネットワークによって大きく進歩した。
従来のネットワークは、画像を一定のスケールにスケールアップすることに限定されており、任意のスケールのイメージを生成するために暗黙の神経機能を利用することになる。
我々は,任意のスケールで超解像を実現する,新しい,効率的なフレームワークであるMixture of Experts Implicit Super-Resolution(MoEISR)を導入する。
論文 参考訳(メタデータ) (2023-11-20T05:34:36Z) - DiffSCI: Zero-Shot Snapshot Compressive Imaging via Iterative Spectral
Diffusion Model [18.25548360119976]
マルチスペクトル画像(MSI)におけるスナップショット圧縮画像(SCI)再構成の精度向上を目指した。
DiffSCIと呼ばれる新しいゼロショット拡散モデルを提案する。
我々は,DiffSCIが自己監督的,ゼロショット的アプローチよりも顕著な性能向上を示すことを示すため,広範囲な試験を行った。
論文 参考訳(メタデータ) (2023-11-19T20:27:14Z) - SST-ReversibleNet: Reversible-prior-based Spectral-Spatial Transformer
for Efficient Hyperspectral Image Reconstruction [15.233185887461826]
Reversible-prior-based methodと呼ばれる新しいフレームワークが提案されている。
ReversibleNetは、シミュレートされた実HSIデータセットの最先端メソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2023-05-06T14:01:02Z) - Reconstruction of compressed spectral imaging based on global structure
and spectral correlation [17.35611893815407]
提案手法は、畳み込みカーネルを用いてグローバルイメージを操作する。
畳み込みスパース符号化が低周波数に不感な問題を解決するため、大域的全変量(TV)制約を加算する。
提案手法は,PSNRで最大7dB,SSIMで最大10%向上する。
論文 参考訳(メタデータ) (2022-10-27T14:31:02Z) - Loop Unrolled Shallow Equilibrium Regularizer (LUSER) -- A
Memory-Efficient Inverse Problem Solver [26.87738024952936]
逆問題では、潜在的に破損し、しばしば不適切な測定結果から、いくつかの基本的な関心のシグナルを再構築することを目的としている。
浅い平衡正規化器(L)を用いたLUアルゴリズムを提案する。
これらの暗黙のモデルは、より深い畳み込みネットワークと同じくらい表現力があるが、トレーニング中にはるかにメモリ効率が良い。
論文 参考訳(メタデータ) (2022-10-10T19:50:37Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Kullback-Leibler Divergence-Based Fuzzy $C$-Means Clustering
Incorporating Morphological Reconstruction and Wavelet Frames for Image
Segmentation [152.609322951917]
そこで我々は,厳密なウェーブレットフレーム変換と形態的再構成操作を組み込むことで,Kulback-Leibler (KL) 発散に基づくFuzzy C-Means (FCM) アルゴリズムを考案した。
提案アルゴリズムはよく機能し、他の比較アルゴリズムよりもセグメンテーション性能が優れている。
論文 参考訳(メタデータ) (2020-02-21T05:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。