論文の概要: Consistent Time-of-Flight Depth Denoising via Graph-Informed Geometric Attention
- arxiv url: http://arxiv.org/abs/2506.23542v1
- Date: Mon, 30 Jun 2025 06:29:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.937665
- Title: Consistent Time-of-Flight Depth Denoising via Graph-Informed Geometric Attention
- Title(参考訳): グラフインフォームド幾何学的注意による飛行時間深度決定
- Authors: Weida Wang, Changyong He, Jin Zeng, Di Qiu,
- Abstract要約: 動き不変グラフ融合を利用した新しいToF深度決定ネットワークを提案する。
フレーム間の深さシフトにもかかわらず、グラフ構造は時間的自己相似性を示し、グラフ融合のためのクロスフレーム幾何学的注意を可能にする。
提案手法は,合成DVToFデータセットの精度と整合性の観点から最先端の性能を実現し,Kinectv2データセットの堅牢な一般化を示す。
- 参考スコア(独自算出の注目度): 5.196236145367301
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depth images captured by Time-of-Flight (ToF) sensors are prone to noise, requiring denoising for reliable downstream applications. Previous works either focus on single-frame processing, or perform multi-frame processing without considering depth variations at corresponding pixels across frames, leading to undesirable temporal inconsistency and spatial ambiguity. In this paper, we propose a novel ToF depth denoising network leveraging motion-invariant graph fusion to simultaneously enhance temporal stability and spatial sharpness. Specifically, despite depth shifts across frames, graph structures exhibit temporal self-similarity, enabling cross-frame geometric attention for graph fusion. Then, by incorporating an image smoothness prior on the fused graph and data fidelity term derived from ToF noise distribution, we formulate a maximum a posterior problem for ToF denoising. Finally, the solution is unrolled into iterative filters whose weights are adaptively learned from the graph-informed geometric attention, producing a high-performance yet interpretable network. Experimental results demonstrate that the proposed scheme achieves state-of-the-art performance in terms of accuracy and consistency on synthetic DVToF dataset and exhibits robust generalization on the real Kinectv2 dataset. Source code will be released at \href{https://github.com/davidweidawang/GIGA-ToF}{https://github.com/davidweidawang/GIGA-ToF}.
- Abstract(参考訳): Time-of-Flight (ToF)センサーが捉えた深度画像はノイズに晒されやすいため、信頼性の高い下流のアプリケーションにはデノイングが必要となる。
以前の作業では、単一フレーム処理に重点を置いていたり、フレーム間の対応するピクセルの深度変化を考慮せずにマルチフレーム処理を行ったりすることで、望ましくない時間的矛盾と空間的曖昧さにつながった。
本稿では, 時間的安定性と空間的シャープネスを同時に向上するために, 動き不変グラフ融合を利用したToF深度Denoising Networkを提案する。
特に、フレーム間の深さシフトにもかかわらず、グラフ構造は時間的自己相似性を示し、グラフ融合のためのクロスフレーム幾何学的注意を可能にする。
そして,ToFノイズ分布から導かれる融解グラフとデータ忠実度項に先行して画像の滑らかさを組み込むことで,ToF雑音の最大遅延問題を定式化する。
最後に、この解は、グラフインフォームド幾何的注意から重みを適応的に学習する反復フィルタに展開され、高性能で解釈可能なネットワークを生成する。
実験により,提案手法は合成DVToFデータセット上での精度と整合性の観点から最先端性能を実現し,Kinectv2データセット上での堅牢な一般化を示した。
ソースコードは \href{https://github.com/davidweidawang/GIGA-ToF}{https://github.com/davidweidawang/GIGA-ToF} で公開される。
関連論文リスト
- FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - SVDC: Consistent Direct Time-of-Flight Video Depth Completion with Frequency Selective Fusion [8.23422182642083]
軽量直接飛行(dToF)センサーはモバイルデバイス上での3Dセンシングに最適である。
本稿では,疎度dToFデータを対応するRGBガイダンスと融合させることで,SVDCと呼ばれる新しい映像深度補完手法を提案する。
本手法では, スパースdToFイメージングによる空間的曖昧性を軽減するために, 多フレーム融合方式を用いる。
論文 参考訳(メタデータ) (2025-03-03T07:32:25Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - iToF2dToF: A Robust and Flexible Representation for Data-Driven
Time-of-Flight Imaging [26.17890136713725]
間接飛行時間(iToF)カメラは、有望な深度検出技術です。
マルチパス干渉(MPI)と低信号対雑音比(SNR)によって引き起こされるエラーが発生しやすい。
論文 参考訳(メタデータ) (2021-03-12T04:57:52Z) - Unrolling of Deep Graph Total Variation for Image Denoising [106.93258903150702]
本稿では,従来のグラフ信号フィルタリングと深い特徴学習を併用して,競合するハイブリッド設計を提案する。
解釈可能な低パスグラフフィルタを用い、最先端のDL復調方式DnCNNよりも80%少ないネットワークパラメータを用いる。
論文 参考訳(メタデータ) (2020-10-21T20:04:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。