論文の概要: PPMStereo: Pick-and-Play Memory Construction for Consistent Dynamic Stereo Matching
- arxiv url: http://arxiv.org/abs/2510.20178v1
- Date: Thu, 23 Oct 2025 03:52:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:17.23697
- Title: PPMStereo: Pick-and-Play Memory Construction for Consistent Dynamic Stereo Matching
- Title(参考訳): PPMStereo: 一貫性のある動的ステレオマッチングのためのピック・アンド・プレイメモリの構築
- Authors: Yun Wang, Junjie Hu, Qiaole Dong, Yongjian Zhang, Yanwei Fu, Tin Lun Lam, Dapeng Wu,
- Abstract要約: textbfPick-and-textbflay textbfMemory (PM) construction module for dynamic bfStereo matching, called bftextPPMStereo。
bftextPPMStereo と呼ばれる動的 bfStereo マッチングのための textbfPick-and-textbflay textbfMemory (PM) 構築モジュールを提案する。
- 参考スコア(独自算出の注目度): 51.98089287914147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Temporally consistent depth estimation from stereo video is critical for real-world applications such as augmented reality, where inconsistent depth estimation disrupts the immersion of users. Despite its importance, this task remains challenging due to the difficulty in modeling long-term temporal consistency in a computationally efficient manner. Previous methods attempt to address this by aggregating spatio-temporal information but face a fundamental trade-off: limited temporal modeling provides only modest gains, whereas capturing long-range dependencies significantly increases computational cost. To address this limitation, we introduce a memory buffer for modeling long-range spatio-temporal consistency while achieving efficient dynamic stereo matching. Inspired by the two-stage decision-making process in humans, we propose a \textbf{P}ick-and-\textbf{P}lay \textbf{M}emory (PPM) construction module for dynamic \textbf{Stereo} matching, dubbed as \textbf{PPMStereo}. PPM consists of a `pick' process that identifies the most relevant frames and a `play' process that weights the selected frames adaptively for spatio-temporal aggregation. This two-stage collaborative process maintains a compact yet highly informative memory buffer while achieving temporally consistent information aggregation. Extensive experiments validate the effectiveness of PPMStereo, demonstrating state-of-the-art performance in both accuracy and temporal consistency. % Notably, PPMStereo achieves 0.62/1.11 TEPE on the Sintel clean/final (17.3\% \& 9.02\% improvements over BiDAStereo) with fewer computational costs. Codes are available at \textcolor{blue}{https://github.com/cocowy1/PPMStereo}.
- Abstract(参考訳): ステレオビデオからの時間的に一貫した深度推定は、拡張現実のような現実世界のアプリケーションにとって重要であり、不整合深度推定はユーザの没入を阻害する。
その重要性にもかかわらず、このタスクは、長期的時間的一貫性を計算的に効率的な方法でモデル化することが困難であるため、依然として困難である。
従来の手法では、時空間情報を集約することでこの問題に対処しようとするが、基本的なトレードオフに直面している。
この制限に対処するために、高速な動的ステレオマッチングを実現しつつ、長距離時空間一貫性をモデル化するためのメモリバッファを導入する。
ヒトの2段階決定プロセスにインスパイアされ、動的な \textbf{Stereo} マッチングのための \textbf{P}ick-and-\textbf{P}lay \textbf{M}emory (PPM) 構築モジュールを提案し、これを \textbf{PPMStereo} と呼ぶ。
PPMは最も関連性の高いフレームを識別する 'pick' プロセスと、時空間アグリゲーションのために選択したフレームを適応的に重み付けする 'play' プロセスで構成される。
この2段階の協調プロセスは、時間的に一貫した情報アグリゲーションを達成しつつ、コンパクトで高情報性の高いメモリバッファを維持する。
大規模実験によりPPMStereoの有効性が検証され、精度と時間的整合性の両方で最先端の性能が示された。
PPMStereo は Sintel clean/final (17.3\% \& 9.02\%) で 0.62/1.11 TEPE を達成するが、計算コストは少ない。
コードは \textcolor{blue}{https://github.com/cocowy1/PPMStereo} で公開されている。
関連論文リスト
- Rethinking Irregular Time Series Forecasting: A Simple yet Effective Baseline [12.66709671516384]
本稿では,汎用的で効率的な予測フレームワークであるAPNを紹介する。
APNの中核には、新しい Time-Aware Patch Aggregation (ATAPA) モジュールがある。
パッチ表現をタイムアウェアな重み付けで計算し、すべての生の観察を集約する。
このアプローチは、人工的なデータポイントの導入を回避し、設計による完全な情報カバレッジを確保することによって、データの忠実性を維持する。
論文 参考訳(メタデータ) (2025-05-16T13:42:00Z) - Temporal Feature Matters: A Framework for Diffusion Model Quantization [105.3033493564844]
拡散モデルはマルチラウンド・デノナイジングの時間ステップに依存している。
3つの戦略を含む新しい量子化フレームワークを導入する。
このフレームワークは時間情報のほとんどを保存し、高品質なエンドツーエンド生成を保証する。
論文 参考訳(メタデータ) (2024-07-28T17:46:15Z) - TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models [52.454274602380124]
拡散モデルは非常に時間ステップ$t$に大きく依存し、良好なマルチラウンドデノジングを実現している。
本稿では,時間情報ブロック上に構築した時間的特徴保守量子化(TFMQ)フレームワークを提案する。
先駆的なブロック設計により、時間情報認識再構成(TIAR)と有限集合キャリブレーション(FSC)を考案し、完全な時間的特徴を整列させる。
論文 参考訳(メタデータ) (2023-11-27T12:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。