論文の概要: Optical Flow Estimation in the Deep Learning Age
- arxiv url: http://arxiv.org/abs/2004.02853v1
- Date: Mon, 6 Apr 2020 17:45:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:51:45.084883
- Title: Optical Flow Estimation in the Deep Learning Age
- Title(参考訳): 深層学習における光フロー推定
- Authors: Junhwa Hur, Stefan Roth
- Abstract要約: 我々は,光学的フロー推定のための初期の研究からCNNの現況までの発展を概観する。
技術的詳細を議論し、それらを比較して、どの技術的貢献が最も重要な精度改善につながったかを再現する。
本稿では,ディープラーニング時代に導入された様々な光フローのアプローチの概要について述べる。
- 参考スコア(独自算出の注目度): 27.477810324117016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Akin to many subareas of computer vision, the recent advances in deep
learning have also significantly influenced the literature on optical flow.
Previously, the literature had been dominated by classical energy-based models,
which formulate optical flow estimation as an energy minimization problem.
However, as the practical benefits of Convolutional Neural Networks (CNNs) over
conventional methods have become apparent in numerous areas of computer vision
and beyond, they have also seen increased adoption in the context of motion
estimation to the point where the current state of the art in terms of accuracy
is set by CNN approaches. We first review this transition as well as the
developments from early work to the current state of CNNs for optical flow
estimation. Alongside, we discuss some of their technical details and compare
them to recapitulate which technical contribution led to the most significant
accuracy improvements. Then we provide an overview of the various optical flow
approaches introduced in the deep learning age, including those based on
alternative learning paradigms (e.g., unsupervised and semi-supervised methods)
as well as the extension to the multi-frame case, which is able to yield
further accuracy improvements.
- Abstract(参考訳): コンピュータビジョンの多くのサブエリアと同様に、ディープラーニングの最近の進歩も光学フローに関する文献に大きな影響を与えている。
これまでこの文献は、エネルギー最小化問題として光学フロー推定を定式化した古典的エネルギーベースモデルに支配されていた。
しかし,従来のコンピュータビジョンなどにおいて,従来の手法に対する畳み込みニューラルネットワーク(CNN)の実用的メリットが明らかになってきており,動き推定の文脈において,CNNアプローチによって現在の技術状態が設定された時点への採用が増加している。
まず,光フロー推定のための初期研究からcnnの現況への展開とともに,この変遷を概観する。
技術的な詳細についても議論し、どの技術的貢献が最も重要な精度向上につながったかを再定義するために比較します。
そこで,本研究では,学習パラダイム(例えば,教師なし・半教師付き手法)に基づく学習や,さらに精度を向上できる多フレームケースの拡張など,深層学習時代に導入された様々な光学フローアプローチの概要について述べる。
関連論文リスト
- Robust Optical Flow Computation: A Higher-Order Differential Approach [0.0]
本研究は,2次テイラー級数近似の高精度化を利用して,光フロー計算のための革新的なアルゴリズムを提案する。
KITTIやMiddleburyのような光学フローベンチマークのパフォーマンスによって、アルゴリズムの機能を示す印象的な例が現れる。
論文 参考訳(メタデータ) (2024-10-12T15:20:11Z) - Skin the sheep not only once: Reusing Various Depth Datasets to Drive
the Learning of Optical Flow [25.23550076996421]
本稿では,光学的フロー推定とステレオマッチングの幾何学的接続を活用することを提案する。
モノクラー深度データセットを仮想的不均一性によってステレオデータに変換する。
また、ステレオデータに仮想カメラの動きを導入し、垂直方向に沿って追加のフローを生成する。
論文 参考訳(メタデータ) (2023-10-03T06:56:07Z) - Optical Flow for Autonomous Driving: Applications, Challenges and
Improvements [0.9023847175654602]
学習に基づく光フローアルゴリズムを改善するためのトレーニング戦略を提案し,評価する。
合成データを訓練しながら、このモデルは現実世界の魚眼データに一般化する強力な能力を示す。
低光域における既存手法の性能を大幅に向上させる,新しい汎用的な半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-11T12:01:42Z) - Deep 360$^\circ$ Optical Flow Estimation Based on Multi-Projection
Fusion [10.603670927163002]
本稿では,広範に普及しているVRアプリケーションをサポートするために,ディープニューラルネットワークを用いた360ドル周光フロー推定に焦点を当てる。
異なる投射法を用いて訓練されたモデルにより予測される光の流れを融合する新しい多射影融合フレームワークを提案する。
また、ニューラルネットワークのトレーニングとパノラマ光フロー推定手法の評価を支援するために、最初の大規模パノラマ光フローデータセットを構築した。
論文 参考訳(メタデータ) (2022-07-27T16:48:32Z) - Wasserstein Flow Meets Replicator Dynamics: A Mean-Field Analysis of Representation Learning in Actor-Critic [137.04558017227583]
ニューラルネットワークによって強化されたアクター・クリティカル(AC)アルゴリズムは、近年、かなりの成功を収めている。
我々は,特徴量に基づくニューラルACの進化と収束について,平均場の観点から考察する。
神経性交流は,大域的最適政策をサブ線形速度で求める。
論文 参考訳(メタデータ) (2021-12-27T06:09:50Z) - Learning by Distillation: A Self-Supervised Learning Framework for
Optical Flow Estimation [71.76008290101214]
DistillFlowは光の流れを学ぶための知識蒸留手法である。
KITTIとSintelの両方のデータセット上で、最先端の教師なし学習性能を実現する。
我々のモデルは、KITTI 2015ベンチマークにおけるすべての単分子的手法の中で、第1位にランクされ、Sintel Finalベンチマークで発表されたすべてのメソッドよりも優れています。
論文 参考訳(メタデータ) (2021-06-08T09:13:34Z) - PCA Event-Based Otical Flow for Visual Odometry [0.0]
本稿では,イベントベース光流量推定問題に対する主成分分析手法を提案する。
提案手法の最良の変種は,ビジュアルオドメトリーのリアルタイムコンテキストを対象とし,最先端実装と比較して約2倍高速であることを示す。
論文 参考訳(メタデータ) (2021-05-08T18:30:44Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z) - Cascaded Deep Video Deblurring Using Temporal Sharpness Prior [88.98348546566675]
提案アルゴリズムは主に,中間潜水フレームと潜水フレームの復元ステップから光フローを推定する。
まず、中間潜伏フレームから光フローを推定し、推定した光フローに基づいて潜伏フレームを復元する深部CNNモデルを開発する。
ビデオデブロアリングのドメイン知識を探索することで、深層CNNモデルをよりコンパクトで効率的なものにすることができることを示す。
論文 参考訳(メタデータ) (2020-04-06T09:13:49Z) - Joint Unsupervised Learning of Optical Flow and Egomotion with Bi-Level
Optimization [59.9673626329892]
エピポーラ幾何を用いた光学フローとカメラモーションのグローバルな関係を利用する。
我々は暗黙の微分を用いて、その実装とは無関係に低レベルの幾何最適化層を通してバックプロパゲーションを可能にする。
論文 参考訳(メタデータ) (2020-02-26T22:28:00Z) - Large Batch Training Does Not Need Warmup [111.07680619360528]
大きなバッチサイズを使用してディープニューラルネットワークをトレーニングすることは、有望な結果を示し、多くの現実世界のアプリケーションに利益をもたらしている。
本稿では,大規模バッチ学習のための全層適応レートスケーリング(CLARS)アルゴリズムを提案する。
分析に基づいて,このギャップを埋め,3つの一般的な大規模バッチトレーニング手法の理論的洞察を提示する。
論文 参考訳(メタデータ) (2020-02-04T23:03:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。