論文の概要: MegaFlow: Zero-Shot Large Displacement Optical Flow
- arxiv url: http://arxiv.org/abs/2603.25739v1
- Date: Thu, 26 Mar 2026 17:59:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.432413
- Title: MegaFlow: Zero-Shot Large Displacement Optical Flow
- Title(参考訳): メガフロー:ゼロショット大変位光流
- Authors: Dingxi Zhang, Fangjinhua Wang, Marc Pollefeys, Haofei Xu,
- Abstract要約: MegaFlowは、ゼロショット大変位光学フローのためのシンプルだが強力なモデルである。
これは、時間的に一貫した運動場を生成するために、強力な事前訓練された視覚に適応する。
複数の光フローベンチマークで最先端のゼロショット性能を実現する。
- 参考スコア(独自算出の注目度): 54.89185614376759
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate estimation of large displacement optical flow remains a critical challenge. Existing methods typically rely on iterative local search or/and domain-specific fine-tuning, which severely limits their performance in large displacement and zero-shot generalization scenarios. To overcome this, we introduce MegaFlow, a simple yet powerful model for zero-shot large displacement optical flow. Rather than relying on highly complex, task-specific architectural designs, MegaFlow adapts powerful pre-trained vision priors to produce temporally consistent motion fields. In particular, we formulate flow estimation as a global matching problem by leveraging pre-trained global Vision Transformer features, which naturally capture large displacements. This is followed by a few lightweight iterative refinements to further improve the sub-pixel accuracy. Extensive experiments demonstrate that MegaFlow achieves state-of-the-art zero-shot performance across multiple optical flow benchmarks. Moreover, our model also delivers highly competitive zero-shot performance on long-range point tracking benchmarks, demonstrating its robust transferability and suggesting a unified paradigm for generalizable motion estimation. Our project page is at: https://kristen-z.github.io/projects/megaflow.
- Abstract(参考訳): 大規模な変位光流の正確な推定は依然として重要な課題である。
既存の手法は通常、反復的な局所探索やドメイン固有の微調整に依存しており、大きな変位やゼロショットの一般化シナリオにおける性能を著しく制限している。
これを解決するために,ゼロショット大変位光流の簡易かつ強力なモデルであるMegaFlowを紹介した。
高度に複雑なタスク固有のアーキテクチャ設計に頼るのではなく、MegaFlowは、時間的に一貫した運動場を生成するために、強力な事前学習されたビジョンに適応する。
特に,大規模変位を自然に捕捉する,事前訓練されたグローバルビジョン変換器の機能を活用することで,フロー推定を大域的マッチング問題として定式化する。
これに続いて、サブピクセルの精度をさらに向上させるために、いくつかの軽量な反復改良がなされている。
大規模な実験により、MegaFlowは複数の光フローベンチマークで最先端のゼロショット性能を実現している。
さらに,このモデルでは,長距離点追跡ベンチマークにおいて高い競争力を持つゼロショット性能を実現し,その頑健な転送性を示すとともに,一般化可能な動き推定のための統一パラダイムを提案する。
私たちのプロジェクトページは以下の通りです。
関連論文リスト
- FlowFeat: Pixel-Dense Embedding of Motion Profiles [51.933932255458906]
FlowFeatは高解像度でマルチタスクの機能表現である。
我々の研究は、信頼性と多目的な高密度画像表現に向けて一歩前進する。
論文 参考訳(メタデータ) (2025-11-10T23:39:53Z) - FlowIE: Efficient Image Enhancement via Rectified Flow [71.6345505427213]
FlowIEはフローベースのフレームワークであり、基本的な分布から高品質な画像への直線パスを推定する。
私たちのコントリビューションは、合成および実世界のデータセットに関する包括的な実験を通じて、厳密に検証されています。
論文 参考訳(メタデータ) (2024-06-01T17:29:29Z) - Sparse Global Matching for Video Frame Interpolation with Large Motion [20.49084881829404]
大きな動きはビデオフレーム補間(VFI)タスクにおいて重要な課題となる。
既存の手法は、しばしば制限された受容場によって制約されるため、大きな動きを持つシナリオを扱う際の準最適性能をもたらす。
我々はVFIのための新しいパイプラインを導入し、グローバルレベルの情報を効果的に統合し、大きな動きに関連する問題を緩和する。
論文 参考訳(メタデータ) (2024-04-10T11:06:29Z) - GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。
本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。
動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文 参考訳(メタデータ) (2023-09-28T07:46:01Z) - AccFlow: Backward Accumulation for Long-Range Optical Flow [70.4251045372285]
本稿では、長距離光フロー推定のためのAccFlowと呼ばれる新しいリカレントフレームワークを提案する。
従来の前方累積よりも後方累積の方が優れていることを示す。
長距離光流量推定におけるAccFlowの有効性を検証する実験
論文 参考訳(メタデータ) (2023-08-25T01:51:26Z) - Towards Anytime Optical Flow Estimation with Event Cameras [37.892840680923584]
イベントカメラはミリ秒レベルでの対数輝度の変化に反応し、光フロー推定に最適である。
既存のイベントカメラからのデータセットは、光学フローに対して低フレームレートの地上真実を提供するのみである。
本研究では,高フレームレートのイベント光流を生成するEVent-based Anytime Flow推定ネットワークであるEVA-Flowを提案する。
論文 参考訳(メタデータ) (2023-07-11T06:15:12Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。