論文の概要: FlowSeek: Optical Flow Made Easier with Depth Foundation Models and Motion Bases
- arxiv url: http://arxiv.org/abs/2509.05297v1
- Date: Fri, 05 Sep 2025 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.683173
- Title: FlowSeek: Optical Flow Made Easier with Depth Foundation Models and Motion Bases
- Title(参考訳): FlowSeek: 深部基礎モデルとモーションベースでより簡単にできる光フロー
- Authors: Matteo Poggi, Fabio Tosi,
- Abstract要約: FlowSeekは、トレーニングに最小限のハードウェアリソースを必要とする光学フローのための新しいフレームワークである。
最先端の単一画像深度基礎モデルと古典的な低次元運動パラメトリゼーションによる光フローネットワークの設計空間の最新の進歩をマージする。
FlowSeekは1つのコンシューマグレードのGPUでトレーニングされている。
- 参考スコア(独自算出の注目度): 41.93821876168924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present FlowSeek, a novel framework for optical flow requiring minimal hardware resources for training. FlowSeek marries the latest advances on the design space of optical flow networks with cutting-edge single-image depth foundation models and classical low-dimensional motion parametrization, implementing a compact, yet accurate architecture. FlowSeek is trained on a single consumer-grade GPU, a hardware budget about 8x lower compared to most recent methods, and still achieves superior cross-dataset generalization on Sintel Final and KITTI, with a relative improvement of 10 and 15% over the previous state-of-the-art SEA-RAFT, as well as on Spring and LayeredFlow datasets.
- Abstract(参考訳): 本稿では、トレーニングに最小限のハードウェアリソースを必要とする光フローのための新しいフレームワークであるFlowSeekを紹介する。
FlowSeekは、最先端の単一画像深度基礎モデルと古典的な低次元運動パラメトリゼーションにより、コンパクトで正確なアーキテクチャを実装した光学フローネットワークの設計空間を、最新の技術と統合している。
FlowSeekは1つのコンシューマグレードのGPUでトレーニングされており、最新の方法に比べて約8倍低いハードウェア予算で、Sintel FinalとKITTIで優れたクロスデータセットの一般化を実現している。
関連論文リスト
- EDCFlow: Exploring Temporally Dense Difference Maps for Event-based Optical Flow Estimation [17.388776062997813]
本稿では,高分解能で高品質なフロー推定を実現するための軽量なイベントベース光フローネットワーク(EDCFlow)を提案する。
EDCFlowは、既存のメソッドに比べてより少ない複雑さでパフォーマンスを向上し、より優れた一般化を提供する。
論文 参考訳(メタデータ) (2025-06-04T02:55:04Z) - DPFlow: Adaptive Optical Flow Estimation with a Dual-Pyramid Framework [57.69159159559054]
最大8Kの解像度入力を一般化できる適応型光フローアーキテクチャDPFlowを提案する。
また,1Kから8Kまでの入力解像度を持つ光フロー評価のための新しいベンチマークであるKubric-NKを紹介する。
論文 参考訳(メタデータ) (2025-03-19T04:18:18Z) - AccFlow: Backward Accumulation for Long-Range Optical Flow [70.4251045372285]
本稿では、長距離光フロー推定のためのAccFlowと呼ばれる新しいリカレントフレームワークを提案する。
従来の前方累積よりも後方累積の方が優れていることを示す。
長距離光流量推定におけるAccFlowの有効性を検証する実験
論文 参考訳(メタデータ) (2023-08-25T01:51:26Z) - AnyFlow: Arbitrary Scale Optical Flow with Implicit Neural
Representation [17.501820140334328]
我々は,様々な解像度の画像から正確な流れを推定するロバストなネットワークであるAnyFlowを紹介した。
我々は,KITTIデータセット上でのクロスデータセット一般化の最先端性能を確立する。
論文 参考訳(メタデータ) (2023-03-29T07:03:51Z) - Rethinking Optical Flow from Geometric Matching Consistent Perspective [38.014569953980754]
本稿では,従来の光流量推定法について再考する。
我々は,より優れた特徴表現を持つ光フロー推定(MatchFlow)のための事前学習タスクとして,GIMを使用している。
Sintel クリーンパスと KITTI テストセットの GMA から 11.5% と 10.1% の誤差削減を実現した。
論文 参考訳(メタデータ) (2023-03-15T06:00:38Z) - FlowNAS: Neural Architecture Search for Optical Flow Estimation [65.44079917247369]
本研究では,フロー推定タスクにおいて,より優れたエンコーダアーキテクチャを自動で見つけるために,FlowNASというニューラルアーキテクチャ探索手法を提案する。
実験の結果、スーパーネットワークから受け継いだ重み付きアーキテクチャは、KITTI上で4.67%のF1-allエラーを達成していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T09:05:25Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z) - What Matters in Unsupervised Optical Flow [51.45112526506455]
教師なし光流における鍵成分の集合を比較し解析する。
教師なしフローモデルに対する新しい改良点を多数構築する。
本稿では,従来の最先端技術よりもはるかに優れた非教師なしフロー技術を提案する。
論文 参考訳(メタデータ) (2020-06-08T19:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。