論文の概要: DPFlow: Adaptive Optical Flow Estimation with a Dual-Pyramid Framework
- arxiv url: http://arxiv.org/abs/2503.14880v1
- Date: Wed, 19 Mar 2025 04:18:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:23:49.360856
- Title: DPFlow: Adaptive Optical Flow Estimation with a Dual-Pyramid Framework
- Title(参考訳): DPFlow:デュアルピラミドフレームワークによる適応光フロー推定
- Authors: Henrique Morimitsu, Xiaobin Zhu, Roberto M. Cesar Jr., Xiangyang Ji, Xu-Cheng Yin,
- Abstract要約: 最大8Kの解像度入力を一般化できる適応型光フローアーキテクチャDPFlowを提案する。
また,1Kから8Kまでの入力解像度を持つ光フロー評価のための新しいベンチマークであるKubric-NKを紹介する。
- 参考スコア(独自算出の注目度): 57.69159159559054
- License:
- Abstract: Optical flow estimation is essential for video processing tasks, such as restoration and action recognition. The quality of videos is constantly increasing, with current standards reaching 8K resolution. However, optical flow methods are usually designed for low resolution and do not generalize to large inputs due to their rigid architectures. They adopt downscaling or input tiling to reduce the input size, causing a loss of details and global information. There is also a lack of optical flow benchmarks to judge the actual performance of existing methods on high-resolution samples. Previous works only conducted qualitative high-resolution evaluations on hand-picked samples. This paper fills this gap in optical flow estimation in two ways. We propose DPFlow, an adaptive optical flow architecture capable of generalizing up to 8K resolution inputs while trained with only low-resolution samples. We also introduce Kubric-NK, a new benchmark for evaluating optical flow methods with input resolutions ranging from 1K to 8K. Our high-resolution evaluation pushes the boundaries of existing methods and reveals new insights about their generalization capabilities. Extensive experimental results show that DPFlow achieves state-of-the-art results on the MPI-Sintel, KITTI 2015, Spring, and other high-resolution benchmarks.
- Abstract(参考訳): 光フロー推定は、再生や行動認識といったビデオ処理タスクに不可欠である。
ビデオの品質は常に向上しており、現在の標準は8K解像度に達している。
しかしながら、光学フロー法は通常、低解像度のために設計されており、その剛体構造のために大きな入力に一般化しない。
ダウンスケーリングや入力タイリングを採用して、入力サイズを削減し、詳細やグローバルな情報が失われる。
また、高分解能サンプルにおける既存の手法の実際の性能を判断する光学フローベンチマークが欠如している。
先行研究は手書きサンプルの質的高分解能評価のみを行った。
本稿では,光流量推定におけるこのギャップを2つの方法で埋める。
低解像度サンプルのみを訓練しながら最大8K解像度の入力を一般化できる適応型光フローアーキテクチャDPFlowを提案する。
また,1Kから8Kまでの入力解像度を持つ光フロー評価のための新しいベンチマークであるKubric-NKを紹介する。
我々の高分解能評価は既存の手法の境界を押し上げ、それらの一般化能力に関する新たな洞察を明らかにする。
MPI-Sintel、KITTI 2015 Spring、その他の高解像度ベンチマークにおいて、DPFlowが最先端の結果を得ることを示す大規模な実験結果が得られた。
関連論文リスト
- Benchmarking the Robustness of Optical Flow Estimation to Corruptions [25.789811424859554]
光フローモデルのベンチマークに特化して設計された7つの時間的破損について紹介する。
2つのロバスト性ベンチマーク、KITTI-FCとGoPro-FCが、光学フロー推定のための最初の汚職性ベンチマークとして確立されている。
15個の光学流法から29種類のモデルが評価され、10個の興味深い観測結果が得られた。
論文 参考訳(メタデータ) (2024-11-22T11:31:01Z) - NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices [6.157420789049589]
計算要求の低減と高い精度のバランスをとる高効率光フロー法を提案する。
より軽量なバックボーンや高速リファインメントモジュールなど,新たなコンポーネントを導入しています。
我々のモデルでは,合成データと実世界のデータの両方で同等の性能を維持しながら,10倍-70倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-08-19T17:13:34Z) - MemFlow: Optical Flow Estimation and Prediction with Memory [54.22820729477756]
本稿では,メモリを用いた光フロー推定と予測をリアルタイムに行うMemFlowを提案する。
本手法では,メモリの読み出しと更新を行うモジュールをリアルタイムに収集する。
われわれのアプローチは、過去の観測に基づいて、将来の光流の予測にシームレスに拡張する。
論文 参考訳(メタデータ) (2024-04-07T04:56:58Z) - AnyFlow: Arbitrary Scale Optical Flow with Implicit Neural
Representation [17.501820140334328]
我々は,様々な解像度の画像から正確な流れを推定するロバストなネットワークであるAnyFlowを紹介した。
我々は,KITTIデータセット上でのクロスデータセット一般化の最先端性能を確立する。
論文 参考訳(メタデータ) (2023-03-29T07:03:51Z) - Rethinking Optical Flow from Geometric Matching Consistent Perspective [38.014569953980754]
本稿では,従来の光流量推定法について再考する。
我々は,より優れた特徴表現を持つ光フロー推定(MatchFlow)のための事前学習タスクとして,GIMを使用している。
Sintel クリーンパスと KITTI テストセットの GMA から 11.5% と 10.1% の誤差削減を実現した。
論文 参考訳(メタデータ) (2023-03-15T06:00:38Z) - Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and
Transformer-Based Method [51.30748775681917]
低照度画像強調(LLIE)の課題を考察し,4K解像度と8K解像度の画像からなる大規模データベースを導入する。
我々は、系統的なベンチマーク研究を行い、現在のLLIEアルゴリズムと比較する。
第2のコントリビューションとして,変換器をベースとした低照度化手法であるLLFormerを紹介する。
論文 参考訳(メタデータ) (2022-12-22T09:05:07Z) - Deep Equilibrium Optical Flow Estimation [80.80992684796566]
最近のSOTA(State-of-the-art)光フローモデルでは、従来のアルゴリズムをエミュレートするために有限ステップの更新操作を使用する。
これらのRNNは大きな計算とメモリオーバーヘッドを課し、そのような安定した推定をモデル化するために直接訓練されていない。
暗黙的層の無限レベル固定点として直接流れを解く手法として,Deep equilibrium Flow estimatorを提案する。
論文 参考訳(メタデータ) (2022-04-18T17:53:44Z) - DIP: Deep Inverse Patchmatch for High-Resolution Optical Flow [7.73554718719193]
本稿では,高分解能光フロー推定のための新しいPatchmatchベースのフレームワークを提案する。
伝播とPatchmatchの局所探索の恩恵を受け、低メモリで高精度な結果が得られる。
提案手法は,KITTI2015ベンチマークのすべての指標で第1位,Sintelクリーンベンチマークでは第2位である。
論文 参考訳(メタデータ) (2022-04-01T10:13:59Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z) - Dense Optical Flow from Event Cameras [55.79329250951028]
本稿では,イベントカメラからの高密度光フロー推定に特徴相関と逐次処理を導入することを提案する。
提案手法は、高密度光流を計算し、MVSEC上での終点誤差を23%削減する。
論文 参考訳(メタデータ) (2021-08-24T07:39:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。