論文の概要: Convolutional Simultaneous Sparse Approximation with Applications to
RGB-NIR Image Fusion
- arxiv url: http://arxiv.org/abs/2203.09913v1
- Date: Fri, 18 Mar 2022 12:44:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 13:49:05.015644
- Title: Convolutional Simultaneous Sparse Approximation with Applications to
RGB-NIR Image Fusion
- Title(参考訳): 畳み込み同時スパース近似とRGB-NIR画像融合への応用
- Authors: Farshad G. Veshki, Sergiy A. Vorobyov
- Abstract要約: 乗算器の交互方向法に基づく畳み込みSSAのアルゴリズムを提案する。
提案アルゴリズムをマルチモーダル・マルチフォーカス画像融合問題に適用して評価する。
- 参考スコア(独自算出の注目度): 32.90534837348151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simultaneous sparse approximation (SSA) seeks to represent a set of dependent
signals using sparse vectors with identical supports. The SSA model has been
used in various signal and image processing applications involving multiple
correlated input signals. In this paper, we propose algorithms for
convolutional SSA (CSSA) based on the alternating direction method of
multipliers. Specifically, we address the CSSA problem with different sparsity
structures and the convolutional feature learning problem in multimodal
data/signals based on the SSA model. We evaluate the proposed algorithms by
applying them to multimodal and multifocus image fusion problems.
- Abstract(参考訳): 同時スパース近似(SSA)は、同一の支持を持つスパースベクトルを用いて依存信号の集合を表現する。
SSAモデルは、複数の相関入力信号を含む様々な信号および画像処理アプリケーションで使われている。
本稿では,乗算器の交互方向法に基づく畳み込みSSA(CSSA)のアルゴリズムを提案する。
具体的には、SSAモデルに基づくマルチモーダルデータ/信号における空間構造が異なるCSSA問題と畳み込み特徴学習問題に対処する。
提案アルゴリズムをマルチモーダル・マルチフォーカス画像融合問題に適用して評価する。
関連論文リスト
- A Multi-Stage Adaptive Feature Fusion Neural Network for Multimodal Gait
Recognition [15.080096318551346]
多くの既存の歩行認識アルゴリズムは単調であり、少数のマルチモーダル歩行認識アルゴリズムは一度だけマルチモーダル融合を行う。
特徴抽出プロセスの異なる段階において多段階の融合を行う多段階特徴融合戦略(MSFFS)を提案する。
また,シルエットと骨格のセマンティックな関連性を考慮したAFFM(Adaptive Feature fusion Module)を提案する。
論文 参考訳(メタデータ) (2023-12-22T03:25:15Z) - Difference of Anisotropic and Isotropic TV for Segmentation under Blur
and Poisson Noise [2.6381163133447836]
画像をスムーシング・アンド・スレッディング(SaT)セグメンテーションフレームワークを採用して、スムースなソリューションを見つけ、次に$k-meansで画像のセグメンテーションを行う。
具体的には、画像平滑化ステップにおいて、ムムフォードシャーモデルの最大雑音を正則化として、異方性全変動(AITV)の最大変動に置き換える。
スキームの有効性を検証するための収束解析が提供される。
論文 参考訳(メタデータ) (2023-01-06T01:14:56Z) - f-DM: A Multi-stage Diffusion Model via Progressive Signal
Transformation [56.04628143914542]
拡散モデル(DM)は、最近、様々な領域で生成モデリングを行うためのSoTAツールとして登場した。
本稿では、プログレッシブ信号変換が可能なDMの一般化されたファミリであるf-DMを提案する。
我々は、ダウンサンプリング、ぼやけ、学習された変換を含む様々な機能を持つ画像生成タスクにf-DMを適用した。
論文 参考訳(メタデータ) (2022-10-10T18:49:25Z) - Face Super-Resolution Using Stochastic Differential Equations [1.724088622269304]
連続時間への拡散モデルを一般化するために微分方程式(SDE)を導入する。
このようなアプリケーションにSDEが使われるのはこれが初めてです。
一般的な顔特徴抽出器を用いて、超解像度画像と地上の真実を比較する。
論文 参考訳(メタデータ) (2022-09-24T18:26:06Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - AsySQN: Faster Vertical Federated Learning Algorithms with Better
Computation Resource Utilization [159.75564904944707]
垂直連合学習(VFL)のための非同期準ニュートン(AsySQN)フレームワークを提案する。
提案アルゴリズムは、逆ヘッセン行列を明示的に計算することなく、近似して降下ステップをスケールする。
本稿では,非同期計算を採用することにより,計算資源の有効利用が期待できることを示す。
論文 参考訳(メタデータ) (2021-09-26T07:56:10Z) - Fast computation of mutual information in the frequency domain with
applications to global multimodal image alignment [3.584984184069584]
情報理論における相互情報(MI)の概念は,多モードアライメントプロセスの導出のための類似度尺度として広く用いられている。
すべての離散空間変位に対する計算MIの効率的なアルゴリズムを提案する。
提案手法の有効性を3つのベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2021-06-28T13:27:05Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - MuCAN: Multi-Correspondence Aggregation Network for Video
Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。
フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。
VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文 参考訳(メタデータ) (2020-07-23T05:41:27Z) - CoMIR: Contrastive Multimodal Image Representation for Registration [4.543268895439618]
我々は,CoMIR(Contrastive Multimodal Image Representations)と呼ばれる,共有された高密度画像表現を学習するためのコントラスト符号化を提案する。
CoMIRは、十分に類似した画像構造が欠如しているため、既存の登録方法がしばしば失敗するマルチモーダル画像の登録を可能にする。
論文 参考訳(メタデータ) (2020-06-11T10:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。