論文の概要: Spatial Artifact Coherence Determines Codec Robustness in Patch-Based rPPG
- arxiv url: http://arxiv.org/abs/2606.04198v1
- Date: Tue, 02 Jun 2026 20:33:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.374031
- Title: Spatial Artifact Coherence Determines Codec Robustness in Patch-Based rPPG
- Title(参考訳): 空間アーチファクトコヒーレンスによるパッチベースrPPGのコーデックロバスト性決定
- Authors: Achraf Ben Ahmed,
- Abstract要約: Photoplethysmography (r) は、遠隔医療、新生児ICU、ドライバ疲労の応用において、圧縮されたビデオチャネル上に展開されているベンチマークで低い心拍数誤差を達成している。
事前の作業では、圧縮下でのグローバル射影法を上回る物理量を決定するものはない。
本研究では,4x4のグリーンチャネル間グリーンチャネルにおいて,オフパスと対角エネルギーの比として定義される空間アーチファクトコヒーレンス(マクロ)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote photoplethysmography (rPPG) achieves low heart-rate error on uncompressed benchmarks yet is deployed over compressed video channels in telehealth, neonatal ICU, and driver fatigue applications. No prior work identifies the physical quantity determining when spatial decomposition outperforms global-projection methods under codec compression. We propose Spatial Artifact Coherence (SAC), defined as the ratio of off-diagonal to diagonal energy in the 4x4 inter-patch Green-channel covariance matrix (bandpass 0.75-2.5 Hz), and the PatchPCA algorithm family (four codec-aware rPPG algorithms). We evaluate 280 subjects across three public datasets, 11 codec degradation variants (MPEG-4, H.265, H.264, JPEG, chroma subsampling), and 13 algorithms via Wilcoxon tests (BH-FDR, q < 0.05, 904 tests). SAC explains 93.8% of between-variant variance in PCA advantage (r = +0.969), with zero overlap between codec families: non-MPEG-4 variants cluster at SAC 0.10-0.18 with 84-90% PCA win rates, while MPEG-4 variants cluster at SAC 0.48-0.59 with 61% win rate and a 5.8x reduction in mean improvement. Within subjects, 78% confirm the expected pattern (p < 10^-22, dz = 0.73). Within-variant subject-level SAC correlation is r = +0.099, confirming SAC classifies codec families rather than predicting individual outcomes. MPEG-4's effect is structural (macroblock DCT geometry, not noise amplitude), governed by source codec state, not resolution. P-Hybrid is identified as the most deployment-robust algorithm. Two necessary operating conditions for PatchPCA advantage are established: SAC < 0.30 and low-to-moderate motion, directly ruling out raw-to-MPEG-4 transcoding pipelines. SAC provides a physically grounded metric for codec-aware rPPG algorithm selection in clinical remote monitoring systems.
- Abstract(参考訳): 遠隔プラチスモグラフィー (rPPG) は, 遠隔医療, 新生児ICU, 運転者疲労の応用において, 圧縮されたビデオチャネル上に展開される非圧縮ベンチマークの心拍数誤差を低くする。
空間分解がコーデック圧縮の下で大域射影法を上回ったときの物理量を決定する以前の研究はない。
本研究では, 4x4 個のグリーンチャネル共分散行列(バンドパス 0.75-2.5 Hz)と PatchPCA アルゴリズムファミリ (4コーデック対応 rPPG アルゴリズム) の非対角エネルギーと対角エネルギーの比として定義される空間アーチファクトコヒーレンス (SAC) を提案する。
我々は3つの公開データセット、11のコーデック分解変種(MPEG-4, H.265, H.264, JPEG, クロマサブサンプリング)、13のアルゴリズムをウィルコクソン試験(BH-FDR, q < 0.05, 904)で評価した。
SACはPCAの変種間差異の93.8%(r = +0.969)とコーデックファミリー間の重複がゼロである: SAC 0.10-0.18の非MPEG-4変種クラスタと84-90%のPCA変種クラスタ、SAC 0.48-0.59のMPEG-4変種クラスタと61%の勝利率と平均改善の5.8倍の減少である。
被験者の78%が予測パターン(p < 10^-22, dz = 0.73)を確認した。
変量レベルのSAC相関は r = +0.099 であり、SACは個々の結果を予測するのではなくコーデックファミリーを分類する。
MPEG-4の効果は構造的(ノイズ振幅ではなくマクロブロックDCT)であり、解像度ではなくソースコーデック状態によって制御される。
P-Hybridは最もデプロイ・ロバストなアルゴリズムである。
PatchPCAの利点のためには、SAC < 0.30と低モデレート動作という2つの操作条件が確立され、生からMPEG-4のトランスコーディングパイプラインを直接排除した。
SACは、臨床遠隔監視システムにおいて、コーデックを意識したrPPGアルゴリズムの選択のための物理的根拠付きメトリクスを提供する。
関連論文リスト
- Asymmetric Phase Coding Audio Watermarking [7.627186551029829]
Deepfakeオーディオは音声ベースの認証システムに挑戦する。
トレーニング不要なオーディオ用暗号署名層である非対称位相符号化を提案する。
我々は、平均Q.02および数ミリ秒のレイテンシにおける全ての条件で、97.5%から98.3%の暗号検証率を達成する。
論文 参考訳(メタデータ) (2026-05-08T04:54:59Z) - TAFA-GSGC: Group-wise Scalable Point Cloud Geometry Compression with Progressive Residual Refinement [62.57701599278593]
TAFA-GSGCは,単一ビットストリームと単一トレーニングモデルからのマルチ品質デコードを可能にするスケーラブルな学習ポイントクラウドジオメトリである。
ベースラインのPCGCv2と比較すると、TAFA-GSGCはRDのパフォーマンスが同等で若干向上し、平均BD-RateはD1で-4.99%、D2で-5.92%の節約を達成した。
論文 参考訳(メタデータ) (2026-04-30T15:57:59Z) - Learnable Conformal Prediction with Context-Aware Nonconformity Functions for Robotic Planning and Perception [4.694504497452662]
Learnable Conformal Predictionは、固定スコアを軽量なニューラル関数に置き換えて、コンテキスト認識の不確実性セットを生成する。
CPの理論的保証を維持しつつ、予測セットのサイズを18%減らし、検出間隔を52%減らし、経路計画の安全性を72%から91%に改善し、オーバーヘッドを最小限に抑えている。
ハードウェア評価では、LCPは1%未満のメモリと15.9%の推論オーバーヘッドを追加したが、検出タスクでは39 FPSを維持し、アンサンブルの7.4倍のエネルギー効率を保っている。
論文 参考訳(メタデータ) (2025-09-26T06:44:58Z) - Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression [61.500904231491596]
画像圧縮とビデオ圧縮のほとんどの手法は、画素空間における変換符号化を行い、冗長性を低減する。
画像とビデオの圧縮, GLCイメージ, GLC-Video のための textbfGenerative textbfLatent textbfGLC (textbfGLC) モデルを提案する。
論文 参考訳(メタデータ) (2025-05-22T03:31:33Z) - FlowDec: A flow-based full-band general audio codec with high perceptual quality [90.05968801459524]
FlowDecは、48kHzでサンプリングされた一般的なオーディオのためのニューラルフルバンドオーディオコーデックである。
音声から一般的な音声へ一般化し、24kbit/sから4kbit/sまで移行する。
論文 参考訳(メタデータ) (2025-03-03T12:49:09Z) - Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC [13.122745400640305]
3次元(3D)点雲は3Dオブジェクトやシーンを表現するためにますます人気が高まっている。
この課題に対処するため、Moving Picture Experts Groupは、GeometryベースのPoint Cloud Compression(G-PCC)標準を積極的に開発している。
RAHTの適応スキップ手法を提案し,最後の数層の残余を符号化するか否かを適応的に決定する。
論文 参考訳(メタデータ) (2024-12-07T07:43:44Z) - Pruned Lightweight Encoders for Computer Vision [0.0]
ASTC と JPEG XS の符号化構成は、低レイテンシを確保するために、近接センサエッジデバイスで使用できることを示す。
ASTC圧縮によるmIoU(mIoU)劣化の分類精度とセグメンテーション平均値は,それぞれ4.9-5.0ポイント(pp)と4.4-4.0ppに低下した。
符号化速度の面では、ASTCエンコーダの実装はJPEGよりも2.3倍高速である。
論文 参考訳(メタデータ) (2022-11-23T17:11:48Z) - Low-Complexity Loeffler DCT Approximations for Image and Video Coding [0.0]
本稿では,ローフラー離散コサイン変換(DCT)アルゴリズムに基づく行列パラメトリゼーション手法を提案する。
数個の8点DCT近似の数学的形式を統一する8点DCT近似の新しいクラスが提案された。
論文 参考訳(メタデータ) (2022-07-29T03:56:18Z) - Convex Hull Prediction for Adaptive Video Streaming by Recurrent Learning [38.574550778712236]
本稿では,コンテンツ認識凸船体予測の深層学習に基づく手法を提案する。
再帰的畳み込みネットワーク(RCN)を用いて,映像の複雑さを暗黙的に解析し,その凸殻を予測する。
提案するモデルでは, 最適凸殻の近似精度が向上し, 既存の手法と比較して, 競争時間の節約が期待できる。
論文 参考訳(メタデータ) (2022-06-10T05:11:02Z) - Improved decoding of circuit noise and fragile boundaries of tailored
surface codes [61.411482146110984]
高速かつ高精度なデコーダを導入し、幅広い種類の量子誤り訂正符号で使用することができる。
我々のデコーダは、信仰マッチングと信念フィンドと呼ばれ、すべてのノイズ情報を活用し、QECの高精度なデモを解き放つ。
このデコーダは, 標準の正方形曲面符号に対して, 整形曲面符号において, より高いしきい値と低い量子ビットオーバーヘッドをもたらすことがわかった。
論文 参考訳(メタデータ) (2022-03-09T18:48:54Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。