論文の概要: A Novel Video Salient Object Detection Method via Semi-supervised Motion
Quality Perception
- arxiv url: http://arxiv.org/abs/2008.02966v1
- Date: Fri, 7 Aug 2020 02:58:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 00:43:40.706475
- Title: A Novel Video Salient Object Detection Method via Semi-supervised Motion
Quality Perception
- Title(参考訳): 半教師あり動作品質知覚による新しい映像有向物体検出法
- Authors: Chenglizhao Chen, Jia Song, Chong Peng, Guodong Wang, Yuming Fang
- Abstract要約: 本稿では,すべての最先端(SOTA)手法に対して,さらに3%の性能向上を実現するための普遍的な学習手法を提案する。
我々は、動画フレームのサブグループを元のテストセットから選択し、新しいトレーニングセットを構築するという、新しいコンセプトである「モーションクオリティ」を活用している。
この新しいトレーニングセットで選択されたフレームには、すべて高品質な動きが含まれており、「ターゲットSOTA法」によって正常な物体が検出される確率が大きい。
- 参考スコア(独自算出の注目度): 52.40934043694379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous video salient object detection (VSOD) approaches have mainly focused
on designing fancy networks to achieve their performance improvements. However,
with the slow-down in development of deep learning techniques recently, it may
become more and more difficult to anticipate another breakthrough via fancy
networks solely. To this end, this paper proposes a universal learning scheme
to get a further 3\% performance improvement for all state-of-the-art (SOTA)
methods. The major highlight of our method is that we resort the "motion
quality"---a brand new concept, to select a sub-group of video frames from the
original testing set to construct a new training set. The selected frames in
this new training set should all contain high-quality motions, in which the
salient objects will have large probability to be successfully detected by the
"target SOTA method"---the one we want to improve. Consequently, we can achieve
a significant performance improvement by using this new training set to start a
new round of network training. During this new round training, the VSOD results
of the target SOTA method will be applied as the pseudo training objectives.
Our novel learning scheme is simple yet effective, and its semi-supervised
methodology may have large potential to inspire the VSOD community in the
future.
- Abstract(参考訳): これまでのVSOD(Video Salient Object Detection)アプローチは主に、パフォーマンス改善を実現するために、派手なネットワークの設計に重点を置いてきた。
しかし、近年のディープラーニング技術の発展が鈍化しているため、高級ネットワークのみで新たなブレークスルーを予想することはますます難しくなっている。
そこで本稿では,すべての最先端(sota)手法において,さらに3\%の性能向上を実現するための普遍学習方式を提案する。
提案手法の主な特徴は,従来のテストセットからビデオフレームのサブグループを選択して,新たなトレーニングセットを構築するために,新たなコンセプトである「モーションクオリティ」を活用することである。
この新しいトレーニングセットで選択されたフレームには、すべて高品質な動作が含まれており、「ターゲットSOTA法」によって正常な物体が検出される確率が大きい。
これにより,新たなトレーニングセットを用いて新たなネットワークトレーニングを開始することにより,大幅なパフォーマンス向上を実現することができる。
この新たなラウンドトレーニングでは,対象SOTA法のVSOD結果を擬似訓練対象として適用する。
我々の新しい学習手法は単純だが効果的であり、その半教師あり方法論は将来VSODコミュニティを刺激する大きな可能性を秘めている。
関連論文リスト
- A Simple-but-effective Baseline for Training-free Class-Agnostic
Counting [30.792198686654075]
CAC(Class-Agnostic Counting)は、いくつかの参照例だけで、与えられた画像内のオブジェクトを正確にカウントすることを目指している。
近年の取り組みでは、既存の基礎モデルを利用することで、トレーニングなしでこれを達成できることが示されている。
我々は、このパフォーマンスギャップを効果的に橋渡しし、強力なベースラインとして機能する、トレーニング不要のソリューションを提案する。
論文 参考訳(メタデータ) (2024-03-03T07:19:50Z) - Reinforcement Learning with Action-Free Pre-Training from Videos [95.25074614579646]
本稿では,ビデオにおける生成前学習を通じて動的理解に役立つ表現を学習するフレームワークを提案する。
我々のフレームワークは、視覚に基づく強化学習の最終性能とサンプル効率の両方を著しく改善する。
論文 参考訳(メタデータ) (2022-03-25T19:44:09Z) - Label, Verify, Correct: A Simple Few Shot Object Detection Method [93.84801062680786]
トレーニングセットから高品質な擬似アノテーションを抽出するための簡単な擬似ラベリング手法を提案する。
擬似ラベリングプロセスの精度を向上させるための2つの新しい手法を提案する。
提案手法は,既存手法と比較して,最先端ないし第2の性能を実現する。
論文 参考訳(メタデータ) (2021-12-10T18:59:06Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - A Deeper Look at Salient Object Detection: Bi-stream Network with a
Small Training Dataset [62.26677215668959]
4K画像のみを含む新しい小規模トレーニングセットを構築するための実現可能な方法を提案する。
提案する小型トレーニングセットをフル活用するために,新しい双方向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-07T01:24:33Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z) - Incremental Few-Shot Object Detection for Robotics [15.082365880914896]
クラスインクリメンタルなFew-Shot Object Detection (CI-FSOD) フレームワークにより、ディープオブジェクト検出ネットワークは、少数のサンプルから効果的な連続学習を行うことができる。
我々のフレームワークは単純だが有効であり、AP性能において2.4ポイントの差で以前のSOTAより優れています。
論文 参考訳(メタデータ) (2020-05-06T08:05:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。