論文の概要: From Contrast to Consistency: Rethinking Event-based Continuous-Time Optical Flow Estimation
- arxiv url: http://arxiv.org/abs/2605.25570v2
- Date: Tue, 26 May 2026 05:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.10307
- Title: From Contrast to Consistency: Rethinking Event-based Continuous-Time Optical Flow Estimation
- Title(参考訳): コントラストから一貫性:イベントベース連続時間光フロー推定の再考
- Authors: Rui Hu, Song Wu, Wen Yang, Jinjian Wu,
- Abstract要約: イベントベースのカメラは、明るさの変化を非同期に捉え、微妙な時間的精度で動きをモデル化するユニークな機会を提供する。
時空間構造整合性(STSC)の原理に基づく連続時間光フロー推定のためのハイブリッド制御フレームワークを提案する。
提案手法は,学習パラダイムの有効性を実証し,連続時間および標準光フロー推定における最先端性能を実現する。
- 参考スコア(独自算出の注目度): 39.022447753493346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating continuous optical flow is a fundamental yet challenging problem in dynamic visual perception. Event-based cameras, with microsecond latency and high dynamic range, capture brightness changes asynchronously, offering a unique opportunity to model motion with fine temporal precision. However, the scarcity of temporally dense ground-truth annotations limits the effectiveness of supervised learning, while contrast maximization (CM) frameworks, focused on sharpening the Image of Warped Events (IWE), often neglect temporal continuity and structural coherence, leading to distorted trajectories under complex motion. To overcome these challenges, we propose a hybrid-supervised framework for continuous-time optical flow estimation, grounded in the principle of Spatio-temporal Structural Consistency (STSC). This paradigm jointly enforces local structural stability and trajectory continuity, ensuring physically coherent motion across time. To further enhance representation and robustness, we design a bidirectionally complementary multi-scale architecture and employ a curriculum-guided hybrid training strategy, enabling a smooth transition from supervised point constraints to self-supervised manifold regularization. Comprehensive experiments across multiple benchmarks show that our method achieves state-of-the-art performance in both continuous-time and standard optical flow estimation, demonstrating the effectiveness of the proposed learning paradigm.
- Abstract(参考訳): 連続的な光学的流れを推定することは、動的視覚知覚において基本的な問題であるが挑戦的な問題である。
マイクロ秒レイテンシと高ダイナミックレンジを備えたイベントベースのカメラは、輝度変化を非同期に捉え、時間的精度で動きをモデル化するユニークな機会を提供する。
しかし、時間的に密集した地絡アノテーションの不足は教師あり学習の有効性を制限し、コントラスト最大化(CM)フレームワークは、時間的連続性や構造的一貫性を無視し、複雑な動きの下で歪んだ軌道を無視することが多い。
これらの課題を克服するために,時空間構造整合性(STSC)の原理を基礎として,連続時間光フロー推定のためのハイブリッド制御フレームワークを提案する。
このパラダイムは局所的な構造安定性と軌道の連続性を共同で実施し、時間を通して物理的に一貫性のある運動を確実にする。
表現とロバスト性をさらに高めるため、双方向補完型マルチスケールアーキテクチャを設計し、カリキュラム誘導型ハイブリッドトレーニング戦略を用いて、教師付き点制約から自己教師付き多様体正規化へのスムーズな移行を可能にする。
複数のベンチマークを対象とした総合的な実験により,本手法は連続時間および標準光流推定における最先端性能を実現し,提案手法の有効性を実証した。
関連論文リスト
- Eulerian Motion Guidance: Robust Image Animation via Bidirectional Geometric Consistency [74.90075313101933]
本稿では、より局所的な監視設計により、同じ光フロープリミティブを再考する。
我々は隣接フレームのユーレアン運動場を用いて生成を誘導し、そこでは運動信号が常に短い時間ホップを記述する。
隣接するフレーム生成に共通するドリフトアーティファクトを軽減するために,双方向幾何整合機構を導入する。
論文 参考訳(メタデータ) (2026-05-07T13:53:31Z) - Hypergraph-State Collaborative Reasoning for Multi-Object Tracking [63.32950991964095]
複数の相関オブジェクト間の共同推論による動き推定を向上する協調推論フレームワークを提案する。
類似の運動状態を持つ物体同士を互いに拘束し、互いに洗練させることで、我々のフレームワークはノイズの軌道を安定させ、目標を遮蔽しても可塑性運動の連続性を推測する。
論文 参考訳(メタデータ) (2026-04-14T12:37:39Z) - Can Video Diffusion Models Predict Past Frames? Bidirectional Cycle Consistency for Reversible Interpolation [25.677744104220853]
ビデオフレームは、特定の動作セマンティクスに固執しながら、所定のエンドポイント間で現実的な中間フレームを合成することを目的としている。
本稿では,前向きと後向きの軌跡の対称性を強制する新しい双方向フレームワークを提案する。
本手法は,37フレームと73フレームの両方のタスクにおいて,画像品質,運動の滑らかさ,動的制御における最先端性能を実現する。
論文 参考訳(メタデータ) (2026-04-02T06:58:46Z) - Towards Stable and Structured Time Series Generation with Perturbation-Aware Flow Matching [16.17115009663765]
安定かつ構造的に一貫した時系列生成を保証するために、摂動軌道をモデル化するフレームワークである textbfPAFM を導入する。
このフレームワークは摂動誘導訓練を取り入れ、局所的な乱れをシミュレートし、二経路速度場を利用して摂動下での軌道偏差を捉える。
非条件および条件生成タスクの両方の実験において、PAFMは強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-11-18T13:30:56Z) - E-MoFlow: Learning Egomotion and Optical Flow from Event Data via Implicit Regularization [38.46024197872764]
オプティカルフローと6-DoFエゴモーションの推定は、通常独立して対処されてきた。
ニューロモルフィック・ビジョンでは、ロバストなデータアソシエーションが欠如しているため、この2つの問題を別々に解決することは不十分な課題である。
本研究では,暗黙の空間的時間的・幾何学的正則化を通じて,運動と光の流れを協調的に最適化する,教師なしのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-14T17:33:44Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - Unsupervised Learning Optical Flow in Multi-frame Dynamic Environment
Using Temporal Dynamic Modeling [7.111443975103329]
本稿では,動的シーンの複数フレーム列からの光フロー推定について検討する。
隣接フレームの動作先を用いて、閉鎖領域のより信頼性の高い監視を行う。
KITTI 2012、KITTI 2015、Sintel Clean、Sintel Finalデータセットの実験は、我々の手法の有効性を実証している。
論文 参考訳(メタデータ) (2023-04-14T14:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。