論文の概要: Imposing Consistency for Optical Flow Estimation
- arxiv url: http://arxiv.org/abs/2204.07262v1
- Date: Thu, 14 Apr 2022 22:58:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-19 00:51:18.342228
- Title: Imposing Consistency for Optical Flow Estimation
- Title(参考訳): 光流量推定のための一貫性
- Authors: Jisoo Jeong, Jamie Menjay Lin, Fatih Porikli, Nojun Kwak
- Abstract要約: プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
- 参考スコア(独自算出の注目度): 73.53204596544472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imposing consistency through proxy tasks has been shown to enhance
data-driven learning and enable self-supervision in various tasks. This paper
introduces novel and effective consistency strategies for optical flow
estimation, a problem where labels from real-world data are very challenging to
derive. More specifically, we propose occlusion consistency and zero forcing in
the forms of self-supervised learning and transformation consistency in the
form of semi-supervised learning. We apply these consistency techniques in a
way that the network model learns to describe pixel-level motions better while
requiring no additional annotations. We demonstrate that our consistency
strategies applied to a strong baseline network model using the original
datasets and labels provide further improvements, attaining the
state-of-the-art results on the KITTI-2015 scene flow benchmark in the
non-stereo category. Our method achieves the best foreground accuracy (4.33% in
Fl-all) over both the stereo and non-stereo categories, even though using only
monocular image inputs.
- Abstract(参考訳): プロキシタスクによる一貫性の導入は、データ駆動学習を強化し、さまざまなタスクにおける自己監督を可能にすることが示されている。
本稿では,実世界のデータからラベルを抽出することが極めて困難である光学フロー推定のための新しい,効果的な一貫性戦略を提案する。
具体的には,自己教師型学習の形式における排他的整合性とゼロ強制性,半教師型学習の形式における変換的整合性を提案する。
我々はこれらの一貫性の手法を、追加のアノテーションを必要とせず、ピクセルレベルの動作をよりよく記述するネットワークモデルに応用する。
我々は,従来のデータセットとラベルを用いた強力なベースラインネットワークモデルに適用した一貫性戦略により,非ステレオカテゴリのKITTI-2015シーンフローベンチマークの最先端結果が得られることを実証した。
本手法は, 単分子画像入力のみを用いながら, ステレオと非ステレオの両方のカテゴリに対して, 最良前景精度(Fl-allの4.33%)を達成する。
関連論文リスト
- Adversarial Robustification via Text-to-Image Diffusion Models [56.37291240867549]
アドリラルロバスト性は、ニューラルネットワークをエンコードする難しい性質として伝統的に信じられてきた。
データを使わずに敵の堅牢性を実現するために,スケーラブルでモデルに依存しないソリューションを開発した。
論文 参考訳(メタデータ) (2024-07-26T10:49:14Z) - OCAI: Improving Optical Flow Estimation by Occlusion and Consistency Aware Interpolation [55.676358801492114]
本稿では,中間映像フレームと光フローを同時に生成することで,フレームのあいまいさを頑健に支援するOCAIを提案する。
我々は,Sintel や KITTI などの既存のベンチマークにおいて,優れた品質と光フロー精度を実証した。
論文 参考訳(メタデータ) (2024-03-26T20:23:48Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Consistency Regularization for Domain Adaptation [17.067348505083327]
教師なし領域適応(UDA)は、実際の画像にモデルを訓練し適応するために、よりアクセスしやすいデータをどのように利用できるかを研究することで、この問題を解決しようとする。
近年のUDA法は,学生と教師のネットワークを用いた画素単位の分類損失の学習による自己学習を適用している。
本稿では,ネットワークの出力要素間の画素間関係をモデル化し,半教師付きUDAに整合性正規化項を追加することを提案する。
論文 参考訳(メタデータ) (2022-08-23T17:07:06Z) - Semi-Supervised Learning of Optical Flow by Flow Supervisor [16.406213579356795]
そこで本研究では,事前学習したモデルに対して,地中真実の流れを伴わずに,目標データセットに適応するファインチューニング手法を提案する。
この設計は、従来の自己超越法よりも安定した収束と精度の向上を目的としている。
我々は,Sintel および KITTI ベンチマークにおける最先端光学フローモデルに対する有意義な改善を実現する。
論文 参考訳(メタデータ) (2022-07-21T06:11:52Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Learning by Distillation: A Self-Supervised Learning Framework for
Optical Flow Estimation [71.76008290101214]
DistillFlowは光の流れを学ぶための知識蒸留手法である。
KITTIとSintelの両方のデータセット上で、最先端の教師なし学習性能を実現する。
我々のモデルは、KITTI 2015ベンチマークにおけるすべての単分子的手法の中で、第1位にランクされ、Sintel Finalベンチマークで発表されたすべてのメソッドよりも優れています。
論文 参考訳(メタデータ) (2021-06-08T09:13:34Z) - Federated Self-Supervised Learning of Multi-Sensor Representations for
Embedded Intelligence [8.110949636804772]
スマートフォン、ウェアラブル、IoT(Internet of Things)デバイスは、教師付きモデルを学習するための集中リポジトリに蓄積できない豊富なデータを生成する。
本稿では,ウェーブレット変換に基づくテキストカルグラム・信号対応学習という自己教師付きアプローチを提案し,ラベルなしセンサ入力から有用な表現を学習する。
さまざまなパブリックデータセットのマルチビュー戦略を用いて,学習機能の品質を広範囲に評価し,すべての領域で高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-07-25T21:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。