論文の概要: FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement
- arxiv url: http://arxiv.org/abs/2603.28759v1
- Date: Mon, 30 Mar 2026 17:58:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.556646
- Title: FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement
- Title(参考訳): FlowIt:信頼誘導リファインメントによる光流のグローバルマッチング
- Authors: Sadra Safadoust, Fabio Tosi, Matteo Poggi, Fatma Güney,
- Abstract要約: FlowItは光フロー推定のための新しいアーキテクチャである。
大きなピクセルの変位を頑健に扱えるように設計されている。
競合するSintelとKITTIのベンチマークで最先端の結果が得られる。
- 参考スコア(独自算出の注目度): 44.07406912385784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present FlowIt, a novel architecture for optical flow estimation designed to robustly handle large pixel displacements. At its core, FlowIt leverages a hierarchical transformer architecture that captures extensive global context, enabling the model to effectively model long-range correspondences. To overcome the limitations of localized matching, we formulate the flow initialization as an optimal transport problem. This formulation yields a highly robust initial flow field, alongside explicitly derived occlusion and confidence maps. These cues are then seamlessly integrated into a guided refinement stage, where the network actively propagates reliable motion estimates from high-confidence regions into ambiguous, low-confidence areas. Extensive experiments across the Sintel, KITTI, Spring, and LayeredFlow datasets validate the efficacy of our approach. FlowIt achieves state-of-the-art results on the competitive Sintel and KITTI benchmarks, while simultaneously establishing new state-of-the-art cross-dataset zero-shot generalization performance on Sintel, Spring, and LayeredFlow.
- Abstract(参考訳): 本稿では,大きな画素変位を頑健に処理するために設計された光フロー推定のための新しいアーキテクチャであるFlowItを提案する。
FlowItの中核は階層的なトランスフォーマーアーキテクチャを利用して、広範囲のグローバルコンテキストをキャプチャし、モデルが効果的に長距離対応をモデル化できるようにする。
局所マッチングの限界を克服するため,フローの初期化を最適輸送問題として定式化する。
この定式化は、明示的に導出された閉塞写像と信頼写像とともに、非常に堅牢な初期フロー場をもたらす。
これらのキューはガイド付き洗練段階にシームレスに統合され、ネットワークは高信頼領域から不明瞭で低信頼領域への信頼ある動き推定を積極的に伝播する。
Sintel、KITTI、Spring、LayeredFlowデータセットにわたる大規模な実験は、我々のアプローチの有効性を検証する。
FlowItは競合するSintelとKITTIベンチマークの最先端結果を実現し、同時にSintel、Spring、LayeredFlow上での最先端のクロスデータセットゼロショット一般化パフォーマンスを新たに確立する。
関連論文リスト
- CoWTracker: Tracking by Warping instead of Correlation [53.834673070954494]
ワープに有利なコストを削減できる高密度な点トラッカーを提案する。
近年の光学的流れの進展に触発されて,本手法では,現在の推定値に基づいて,対象フレームからクエリフレームへ特徴を変換することで,トラック推定を反復的に洗練する。
我々のモデルは,TAP-Vid-DAVIS,TAP-Vid-Kinetics,Robo-TAPなど,標準的な高密度点追跡ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2026-02-04T18:58:59Z) - Rethinking Unsupervised Cross-modal Flow Estimation: Learning from Decoupled Optimization and Consistency Constraint [20.46870753632375]
DCFlowは、教師なしのクロスモーダルフロー推定フレームワークである。
本稿では,タスク固有の監督機能を備えた非結合最適化戦略を導入し,モダリティの相違と幾何学的相違を明確に解消する。
評価のために、パブリックデータセットを再取得することで、包括的なクロスモーダルフローベンチマークを構築する。
論文 参考訳(メタデータ) (2025-09-29T08:10:41Z) - FlowIE: Efficient Image Enhancement via Rectified Flow [71.6345505427213]
FlowIEはフローベースのフレームワークであり、基本的な分布から高品質な画像への直線パスを推定する。
私たちのコントリビューションは、合成および実世界のデータセットに関する包括的な実験を通じて、厳密に検証されています。
論文 参考訳(メタデータ) (2024-06-01T17:29:29Z) - Sparse Global Matching for Video Frame Interpolation with Large Motion [20.49084881829404]
大きな動きはビデオフレーム補間(VFI)タスクにおいて重要な課題となる。
既存の手法は、しばしば制限された受容場によって制約されるため、大きな動きを持つシナリオを扱う際の準最適性能をもたらす。
我々はVFIのための新しいパイプラインを導入し、グローバルレベルの情報を効果的に統合し、大きな動きに関連する問題を緩和する。
論文 参考訳(メタデータ) (2024-04-10T11:06:29Z) - GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。
本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。
動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文 参考訳(メタデータ) (2023-09-28T07:46:01Z) - AccFlow: Backward Accumulation for Long-Range Optical Flow [70.4251045372285]
本稿では、長距離光フロー推定のためのAccFlowと呼ばれる新しいリカレントフレームワークを提案する。
従来の前方累積よりも後方累積の方が優れていることを示す。
長距離光流量推定におけるAccFlowの有効性を検証する実験
論文 参考訳(メタデータ) (2023-08-25T01:51:26Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。