論文の概要: Quaternion-based dynamic mode decomposition for background modeling in
color videos
- arxiv url: http://arxiv.org/abs/2112.13982v1
- Date: Tue, 28 Dec 2021 03:35:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-30 16:09:27.464417
- Title: Quaternion-based dynamic mode decomposition for background modeling in
color videos
- Title(参考訳): カラービデオにおける背景モデリングのための四元系動的モード分解
- Authors: Juan Han, Kit Ian Kou, Jifei Miao
- Abstract要約: 動的モード分解(DMD)は,映像列を背景モデルと対応する前景部に頑健に分解する手法である。
四元数行列解析によりDMDを拡張する四元数ベースのDMD(Q-DMD)を提案する。
四元数行列の標準固有値を用いてスペクトル分解を計算し、対応するQ-DMDモードと固有値を算出する。
- 参考スコア(独自算出の注目度): 1.0098114696565863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene Background Initialization (SBI) is one of the challenging problems in
computer vision. Dynamic mode decomposition (DMD) is a recently proposed method
to robustly decompose a video sequence into the background model and the
corresponding foreground part. However, this method needs to convert the color
image into the grayscale image for processing, which leads to the neglect of
the coupling information between the three channels of the color image. In this
study, we propose a quaternion-based DMD (Q-DMD), which extends the DMD by
quaternion matrix analysis, so as to completely preserve the inherent color
structure of the color image and the color video. We exploit the standard
eigenvalues of the quaternion matrix to compute its spectral decomposition and
calculate the corresponding Q-DMD modes and eigenvalues. The results on the
publicly available benchmark datasets prove that our Q-DMD outperforms the
exact DMD method, and experiment results also demonstrate that the performance
of our approach is comparable to that of the state-of-the-art ones.
- Abstract(参考訳): 背景初期化(SBI)はコンピュータビジョンにおいて難しい問題の一つである。
動的モード分解(DMD)は,映像列を背景モデルと対応する前景部に頑健に分解する手法である。
しかし,この方法では,カラー画像をグレースケール画像に変換する必要があるため,カラー画像の3つのチャネル間の結合情報が無視される。
本研究では,色画像とカラービデオの固有色構造を完全に保存するために,四元行列解析によりDMDを拡張する四元行列ベースのDMD(Q-DMD)を提案する。
四元数行列の標準固有値を用いてスペクトル分解を計算し、対応するQ-DMDモードと固有値を算出する。
公開されているベンチマークデータセットの結果から、我々のQ-DMDは正確なDMD法よりも優れており、実験結果からも、我々のアプローチの性能は最先端のものと同等であることが示された。
関連論文リスト
- M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.39134873744748]
既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-06-04T12:33:02Z) - Real-Time Motion Detection Using Dynamic Mode Decomposition [0.40964539027092906]
動的モード分解(DMD)に根ざしたストリーミングビデオデータに対する簡易かつ解釈可能なモーション検出アルゴリズムを提案する。
提案手法は,前景運動などの重要な映像特徴の進化と,DMDを映像セグメントに適用した結果となる行列の固有値との間には対応関係があることを生かしている。
論文 参考訳(メタデータ) (2024-05-08T13:52:14Z) - MVD-Fusion: Single-view 3D via Depth-consistent Multi-view Generation [54.27399121779011]
本稿では,多視点RGB-D画像の生成モデルを用いて,単視点3次元推論を行うMVD-Fusionを提案する。
提案手法は,蒸留に基づく3D推論や先行多視点生成手法など,最近の最先端技術と比較して,より正確な合成を実現することができることを示す。
論文 参考訳(メタデータ) (2024-04-04T17:59:57Z) - Diffusion Priors for Dynamic View Synthesis from Monocular Videos [59.42406064983643]
ダイナミックノベルビュー合成は、ビデオ内の視覚的コンテンツの時間的進化を捉えることを目的としている。
まず、ビデオフレーム上に予め訓練されたRGB-D拡散モデルをカスタマイズ手法を用いて微調整する。
動的および静的なニューラルレイディアンス場を含む4次元表現に、微調整されたモデルから知識を蒸留する。
論文 参考訳(メタデータ) (2024-01-10T23:26:41Z) - $PC^2$: Projection-Conditioned Point Cloud Diffusion for Single-Image 3D
Reconstruction [97.06927852165464]
単一のRGB画像から物体の3次元形状を再構築することは、コンピュータビジョンにおける長年の課題である。
条件付き偏光拡散プロセスによりスパース点雲を生成する単一像3次元再構成法を提案する。
論文 参考訳(メタデータ) (2023-02-21T13:37:07Z) - Multi-channel Nuclear Norm Minus Frobenius Norm Minimization for Color
Image Denoising [9.20787253404652]
従来の戦略の1つは、RGBイメージを相関の少ない色空間に変換し、新しい空間の各チャネルを別々に識別することである。
本稿では,核ノルムの最小化フレームワークであるフロベニウス・ノルム最小化フレームワークを用いて,カラー画像のマルチチャネル最適化モデルを提案する。
合成および実ノイズデータセットによる実験結果は,提案モデルが最先端モデルより優れていることを示す。
論文 参考訳(メタデータ) (2022-09-16T04:10:29Z) - Quaternion Optimized Model with Sparse Regularization for Color Image
Recovery [10.137095668835439]
本論文は、音声フォーマットや画像を含む様々な信号タイプが、それぞれのベースに対して本質的に疎い構造を持っているという事実に着想を得たものである。
色画像は四元数領域で全体として処理できるため、四元数離散コサイン変換(QDCT)領域における色画像の空間性について記述した。
より優れた低ランク近似を実現するために、提案モデルでは、クォーテリオンベースのトランケート核ノルム(QTNN)が採用されている。
論文 参考訳(メタデータ) (2022-04-19T03:07:12Z) - Dynamic Mode Decomposition in Adaptive Mesh Refinement and Coarsening
Simulations [58.720142291102135]
動的モード分解(DMD)はコヒーレントなスキームを抽出する強力なデータ駆動方式である。
本稿では,異なるメッシュトポロジと次元の観測からDMDを抽出する戦略を提案する。
論文 参考訳(メタデータ) (2021-04-28T22:14:25Z) - Depth-conditioned Dynamic Message Propagation for Monocular 3D Object
Detection [86.25022248968908]
モノラル3Dオブジェクト検出の問題を解決するために、コンテキストと奥行きを認識する特徴表現を学びます。
KITTIベンチマークデータセットにおける単眼的アプローチにおける最新の結果を示す。
論文 参考訳(メタデータ) (2021-03-30T16:20:24Z) - Generalized Two-Dimensional Quaternion Principal Component Analysis with
Weighting for Color Image Recognition [1.516937009186805]
カラー画像認識の最も強力な方法の1つは、二次元原理成分分析(2DQPCA)アプローチである。
本稿では、重み付けによる一般化された2DQPCA手法について、制約関数と目的関数の両方に$L_p$ノルムを課す。
実顔データベースに基づく数値計算の結果,提案手法は雑音に対して頑健であり,最先端の2DQPCAアルゴリズムと4つの顕著な深層学習法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T03:37:23Z) - Full Quaternion Representation of Color images: A Case Study on
QSVD-based Color Image Compression [0.38073142980732994]
カラー画像を四元数で表現する手法を提案する。
オートエンコーダニューラルネットワークを用いて、カラー画像をフル四元行列に変換するグローバルモデルを生成する。
論文 参考訳(メタデータ) (2020-07-19T19:13:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。