論文の概要: ToTMNet: FFT-Accelerated Toeplitz Temporal Mixing Network for Lightweight Remote Photoplethysmography
- arxiv url: http://arxiv.org/abs/2601.04159v1
- Date: Wed, 07 Jan 2026 18:15:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.713
- Title: ToTMNet: FFT-Accelerated Toeplitz Temporal Mixing Network for Lightweight Remote Photoplethysmography
- Title(参考訳): ToTMNet:軽量リモート光胸腺撮影のためのFFT加速トイプリッツテンポラルミキシングネットワーク
- Authors: Vladimir Frants, Sos Agaian, Karen Panetta,
- Abstract要約: ToTMNetは、時間的注意をFFT加速のToeplitz時間混合層に置き換える軽量なr古典的アーキテクチャである。
Toeplitz演算子は、クリップ長のパラメータの線形数を用いて、フルシーケンスの時間フィールドを提供する。
ToTMNetは、コンパクトな設計で強力な心拍推定精度を実現する。
- 参考スコア(独自算出の注目度): 2.8496753993424817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote photoplethysmography (rPPG) estimates a blood volume pulse (BVP) waveform from facial videos captured by commodity cameras. Although recent deep models improve robustness compared to classical signal-processing approaches, many methods increase computational cost and parameter count, and attention-based temporal modeling introduces quadratic scaling with respect to the temporal length. This paper proposes ToTMNet, a lightweight rPPG architecture that replaces temporal attention with an FFT-accelerated Toeplitz temporal mixing layer. The Toeplitz operator provides full-sequence temporal receptive field using a linear number of parameters in the clip length and can be applied in near-linear time using circulant embedding and FFT-based convolution. ToTMNet integrates the global Toeplitz temporal operator into a compact gated temporal mixer that combines a local depthwise temporal convolution branch with gated global Toeplitz mixing, enabling efficient long-range temporal filtering while only having 63k parameters. Experiments on two datasets, UBFC-rPPG (real videos) and SCAMPS (synthetic videos), show that ToTMNet achieves strong heart-rate estimation accuracy with a compact design. On UBFC-rPPG intra-dataset evaluation, ToTMNet reaches 1.055 bpm MAE with Pearson correlation 0.996. In a synthetic-to-real setting (SCAMPS to UBFC-rPPG), ToTMNet reaches 1.582 bpm MAE with Pearson correlation 0.994. Ablation results confirm that the gating mechanism is important for effectively using global Toeplitz mixing, especially under domain shift. The main limitation of this preprint study is the use of only two datasets; nevertheless, the results indicate that Toeplitz-structured temporal mixing is a practical and efficient alternative to attention for rPPG.
- Abstract(参考訳): RPPG (Remote Photoplethysmography) は、コモディティカメラが捉えた顔画像から血液量パルス (BVP) 波形を推定する。
近年の深層モデルでは,従来の信号処理手法に比べてロバスト性は向上しているが,計算コストやパラメータ数の増加は多く,注意に基づく時間モデルでは時間長に関して2次スケーリングが導入されている。
本稿では、時間的注意をFFT加速トエプリッツ時間混合層に置き換える軽量なrPPGアーキテクチャであるToTMNetを提案する。
Toeplitz演算子は、クリップ長のパラメータの線形数を用いて、フルシーケンスの時間的受容場を提供し、サーキュラント埋め込みとFFTベースの畳み込みを用いて、ほぼ直線時間で適用することができる。
ToTMNetは、グローバルなToeplitz時間演算子を、局所的な深度時間的畳み込み分岐とゲートグローバルなToeplitz混合を組み合わせたコンパクトなゲート時間混合器に統合し、63kパラメータしか持たない効率的な長距離時間的フィルタリングを可能にする。
UBFC-rPPG (real video) とSCAMPS (synthetic video) の2つのデータセットの実験により、ToTMNetは、コンパクトな設計で強力な心拍数推定精度を達成することが示された。
UBFC-rPPG のデータセット内評価では、TTMNet はピアソン相関 0.996 で 1.055 bpm MAE に達した。
ToTMNetは合成現実環境(SCAMPSからUBFC-rPPG)においてピアソン相関0.994で1.582 bpm MAEに達する。
アブレーションの結果,特に領域シフト下では,大域的なToeplitz混合を効果的に利用するためには,ゲーティング機構が重要であることが確認された。
このプレプリント研究の主な限界は2つのデータセットのみを使用することである。しかし、この結果から、Toeplitzで構造化された時間混合は、rPPGの注意に対する実用的で効率的な代替手段であることが示された。
関連論文リスト
- PAS: A Training-Free Stabilizer for Temporal Encoding in Video LLMs [57.790910044227935]
ビデオLLMは時間的不整合に悩まされ、フレームタイミングの小さなシフトは注意をそらすことができ、関連するフレームを抑えることができる。
本稿では, 位相アグリゲード平滑化(PAS)について述べる。これは, 頭部に小さな反対位相オフセットを適用して, 出力を集約する学習自由機構である。
解析の結果,RoPE回転ロジットは,時間核でスケールしたコンテントドット積として近似でき,このカーネルを滑らかにすることで,小さな時間シフトに対する注意のリプシッツ安定性が得られ,マルチフェーズ平均化は,Nyquist-valid サンプリング下での頭当たりスペクトルを保ちながら高周波リップルを減衰させることがわかった。
論文 参考訳(メタデータ) (2025-11-14T05:56:47Z) - AWEMixer: Adaptive Wavelet-Enhanced Mixer Network for Long-Term Time Series Forecasting [12.450099337354017]
適応ウェーブレット強化ミキサーネットワークであるAWEMixerを提案する。
周波数ルータは、Fast Fourier Transformによって達成された大域的周期パターンを利用して、局所化ウェーブレットサブバンドを適応的に重み付けする。
コヒーレントゲート融合ブロックは、多スケール時間表現による顕著な周波数特徴の選択的統合を実現する。
論文 参考訳(メタデータ) (2025-11-06T11:27:12Z) - Identification of Capture Phases in Nanopore Protein Sequencing Data Using a Deep Learning Model [0.0]
ダウンサンプリング信号窓の捕捉位相を検出する軽量な1次元畳み込みニューラルネットワーク (1D CNN) を開発した。
我々の最良のモデルであるCaptureNet-Deepは、ホールドアウトテストデータでF1スコア0.94と精度93.39%を達成した。
これらの結果から,シンプルかつ解釈可能なアーキテクチャを用いて,効率的なリアルタイムキャプチャ検出が可能であることが示唆された。
論文 参考訳(メタデータ) (2025-11-03T06:51:53Z) - FTT-GRU: A Hybrid Fast Temporal Transformer with GRU for Remaining Useful Life Prediction [0.6421270655703623]
本稿では,Fast Temporal Transformer (FTT) とゲートリカレントユニット (GRU) を組み合わせ,逐次モデリングを行うハイブリッドモデル FTT-GRU を提案する。
NASA CMAPSS FD001では、FTT-GRUはRMSE 30.76、MAE 18.97、R2=0.45$に達し、バッチ=1.12msのCPUレイテンシを持つ。
これらの結果は,コンパクトなTransformer-RNNハイブリッドがCMAPSS上で高精度かつ効率的なRUL予測を実現することを示す。
論文 参考訳(メタデータ) (2025-11-01T14:02:03Z) - PPMStereo: Pick-and-Play Memory Construction for Consistent Dynamic Stereo Matching [51.98089287914147]
textbfPick-and-textbflay textbfMemory (PM) construction module for dynamic bfStereo matching, called bftextPPMStereo。
bftextPPMStereo と呼ばれる動的 bfStereo マッチングのための textbfPick-and-textbflay textbfMemory (PM) 構築モジュールを提案する。
論文 参考訳(メタデータ) (2025-10-23T03:52:39Z) - Adaptive Deadline and Batch Layered Synchronized Federated Learning [66.93447103966439]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散エッジデバイス間で協調的なモデルトレーニングを可能にする。
我々は,レイヤワイドアグリゲーションのために,ラウンド単位の期限とユーザ固有のバッチサイズを共同で最適化する新しいフレームワークADEL-FLを提案する。
論文 参考訳(メタデータ) (2025-05-29T19:59:18Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - Adaptive Frequency Filters As Efficient Global Token Mixers [100.27957692579892]
適応周波数フィルタは効率的なグローバルトークンミキサーとして機能することを示す。
我々は、AFFNetと呼ばれる軽量ニューラルネットワークを構築するために、AFFトークンミキサーを主要なニューラルネットワークとして捉えています。
論文 参考訳(メタデータ) (2023-07-26T07:42:28Z) - BolT: Fused Window Transformers for fMRI Time Series Analysis [0.0]
血液酸素レベル依存型トランスフォーマであるBolTをfMRI時系列解析のために提案する。
ウィンドウをまたいだ情報を統合するために、隣接する時間ウィンドウのベーストークンとフランジトークンの間で、クロスウィンドウアテンションが計算される。
公開fMRIデータセットの実験は、最先端の手法に対するBolTの優れた性能を明らかに示している。
論文 参考訳(メタデータ) (2022-05-23T19:17:06Z) - Real-Time Mapping of Tissue Properties for Magnetic Resonance
Fingerprinting [20.834829860562248]
スパイラルk空間MRFデータから直接組織特性をシームレスにマッピングする新しいエンドツーエンドディープラーニングフレームワークを提案する。
本手法は,非カルト的k-空間データを直接消費し,適応密度補正を行い,複数の組織特性マップを前方通過で予測する。
論文 参考訳(メタデータ) (2021-07-16T21:05:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。