論文の概要: Unsupervised Optical Flow Using Cost Function Unrolling
- arxiv url: http://arxiv.org/abs/2011.14814v1
- Date: Mon, 30 Nov 2020 14:10:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 14:58:26.020518
- Title: Unsupervised Optical Flow Using Cost Function Unrolling
- Title(参考訳): コスト関数アンロールを用いた教師なし光流
- Authors: Gal Lifshitz and Dan Raviv
- Abstract要約: 本稿では, コスト関数に着目し, ハードL1のスムーズ性制約をソフトな多層反復スキームに伝達するアンローリング反復法を提案する。
我々は MPI Sintel と KITTI 2015 の教師なし光フローベンチマークの両結果について報告する。
- 参考スコア(独自算出の注目度): 4.518012967046983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Analyzing motion between two consecutive images is one of the fundamental
tasks in computer vision. In the lack of labeled data, the loss functions are
split into consistency and smoothness, allowing for self-supervised training.
This paper focuses on the cost function derivation and presents an unrolling
iterative approach, transferring the hard L1 smoothness constraint into a
softer multi-layer iterative scheme. More accurate gradients, especially near
non-differential positions, improve the network's convergence, providing
superior results on tested scenarios. We report state-of-the-art results on
both MPI Sintel and KITTI 2015 unsupervised optical flow benchmarks. The
provided approach can be used to enhance various architectures and not limited
just to the presented pipeline.
- Abstract(参考訳): 2つの連続した画像間の動きを分析することは、コンピュータビジョンの基本的な課題の1つである。
ラベル付きデータの欠如により、損失関数は一貫性と滑らかさに分割され、自己教師付きトレーニングが可能になる。
本稿では, コスト関数の導出に焦点をあて, ハードL1のスムーズ性制約をソフトな多層反復スキームに伝達するアンローリング反復法を提案する。
より正確な勾配、特に非微分位置に近い位置は、ネットワークの収束を改善し、テストシナリオにおいて優れた結果をもたらす。
我々は MPI Sintel と KITTI 2015 の教師なし光フローベンチマークの両結果について報告する。
提供されたアプローチは、提示されたパイプラインに限らず、さまざまなアーキテクチャを強化するために使用できる。
関連論文リスト
- Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to
CT Image Fusion [4.1498463236541605]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Robust Stochastically-Descending Unrolled Networks [85.6993263983062]
Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文 参考訳(メタデータ) (2023-12-25T18:51:23Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Implicit Stochastic Gradient Descent for Training Physics-informed
Neural Networks [51.92362217307946]
物理インフォームドニューラルネットワーク(PINN)は、前方および逆微分方程式問題の解法として効果的に実証されている。
PINNは、近似すべきターゲット関数が高周波またはマルチスケールの特徴を示す場合、トレーニング障害に閉じ込められる。
本稿では,暗黙的勾配降下法(ISGD)を用いてPINNを訓練し,トレーニングプロセスの安定性を向上させることを提案する。
論文 参考訳(メタデータ) (2023-03-03T08:17:47Z) - Counterfactual Intervention Feature Transfer for Visible-Infrared Person
Re-identification [69.45543438974963]
視覚赤外人物再識別タスク(VI-ReID)におけるグラフベースの手法は,2つの問題により,悪い一般化に悩まされている。
十分に訓練された入力特徴は、グラフトポロジーの学習を弱め、推論過程において十分に一般化されない。
本稿では,これらの問題に対処するためのCIFT法を提案する。
論文 参考訳(メタデータ) (2022-08-01T16:15:31Z) - Binarizing by Classification: Is soft function really necessary? [4.329951775163721]
本稿では,二項分類問題としてネットワークバイナライゼーションに取り組むことを提案する。
また、ポーズ推定モデルの軽量化手法としてバイナライゼーションを用いる。
提案手法により,最大60.6ドルのmAPを初めて達成できる。
論文 参考訳(メタデータ) (2022-05-16T02:47:41Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Unsupervised Motion Representation Enhanced Network for Action
Recognition [4.42249337449125]
連続するフレーム間の動きの表現は、ビデオの理解を大いに促進することが証明されている。
効果的な光フロー解決器であるTV-L1法は、抽出した光フローをキャッシュするために時間と費用がかかる。
UF-TSN(UF-TSN)は、軽量な非監視光フロー推定器を組み込んだ、エンドツーエンドのアクション認識手法です。
論文 参考訳(メタデータ) (2021-03-05T04:14:32Z) - What Matters in Unsupervised Optical Flow [51.45112526506455]
教師なし光流における鍵成分の集合を比較し解析する。
教師なしフローモデルに対する新しい改良点を多数構築する。
本稿では,従来の最先端技術よりもはるかに優れた非教師なしフロー技術を提案する。
論文 参考訳(メタデータ) (2020-06-08T19:36:26Z) - Implicit Bias of Gradient Descent for Wide Two-layer Neural Networks
Trained with the Logistic Loss [0.0]
勾配に基づく手法によるロジスティック(クロスエントロピー)損失を最小限に抑えるために訓練されたニューラルネットワークは、多くの教師付き分類タスクでうまく機能する。
我々は、均一な活性化を伴う無限に広い2層ニューラルネットワークのトレーニングと一般化の挙動を解析する。
論文 参考訳(メタデータ) (2020-02-11T15:42:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。