論文の概要: Teacher-Student Asynchronous Learning with Multi-Source Consistency for
Facial Landmark Detection
- arxiv url: http://arxiv.org/abs/2012.06711v1
- Date: Sat, 12 Dec 2020 03:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 11:07:08.066569
- Title: Teacher-Student Asynchronous Learning with Multi-Source Consistency for
Facial Landmark Detection
- Title(参考訳): 顔ランドマーク検出のためのマルチソース一貫性を用いた教師学習
- Authors: Rongye Meng, Sanping Zhou, Xingyu Wan, Mengliu Li, Jinjun Wang
- Abstract要約: マルチソース監視信号整合性基準に基づくTSAL(Teacher-student asynchronous learning)フレームワークを提案する。
300W、AFLW、300VWのベンチマークでの実験では、TSALフレームワークが最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 15.796415030063802
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the high annotation cost of large-scale facial landmark detection
tasks in videos, a semi-supervised paradigm that uses self-training for mining
high-quality pseudo-labels to participate in training has been proposed by
researchers. However, self-training based methods often train with a gradually
increasing number of samples, whose performances vary a lot depending on the
number of pseudo-labeled samples added.
In this paper, we propose a teacher-student asynchronous learning~(TSAL)
framework based on the multi-source supervision signal consistency criterion,
which implicitly mines pseudo-labels through consistency constraints.
Specifically, the TSAL framework contains two models with exactly the same
structure. The radical student uses multi-source supervision signals from the
same task to update parameters, while the calm teacher uses a single-source
supervision signal to update parameters. In order to reasonably absorb
student's suggestions, teacher's parameters are updated again through recursive
average filtering. The experimental results prove that asynchronous-learning
framework can effectively filter noise in multi-source supervision signals,
thereby mining the pseudo-labels which are more significant for network
parameter updating. And extensive experiments on 300W, AFLW, and 300VW
benchmarks show that the TSAL framework achieves state-of-the-art performance.
- Abstract(参考訳): ビデオにおける大規模顔ランドマーク検出タスクのアノテーションコストが高いことから,高品質な擬似ラベルをマイニングしてトレーニングに参加するための半教師付きパラダイムが提案されている。
しかし、自己学習ベースの手法は、徐々に多くのサンプルを訓練することが多く、その性能は擬似ラベル付きサンプルの数によって大きく異なる。
本稿では,マルチソース・スーパーバイザリー・シグナル・一貫性基準に基づく教師教育型非同期学習(tsal)フレームワークを提案し,一貫性制約を通じて擬似ラベルを暗黙的にマイニングする。
具体的には、tsalフレームワークは、まったく同じ構造を持つ2つのモデルを含んでいる。
急進的な学生は、同じタスクからのマルチソース監視信号を使用してパラメータを更新し、穏やかな教師はパラメータを更新するためにシングルソース監視信号を使用する。
生徒の提案を合理的に吸収するために,教師のパラメータを再帰的平均フィルタリングにより更新する。
実験の結果,マルチソース監視信号のノイズを効果的にフィルタし,ネットワークパラメータ更新に重要な擬似ラベルをマイニングできることが判明した。
そして、300W、AFLW、300VWベンチマークに関する広範な実験は、TSALフレームワークが最先端のパフォーマンスを達成することを示している。
関連論文リスト
- Collaborative Static-Dynamic Teaching: A Semi-Supervised Framework for Stripe-Like Space Target Detection [2.9133687889451023]
Stripeのような宇宙ターゲット検出は、宇宙の状況認識に不可欠である。
従来の教師なし手法は、低信号対雑音比と可変ストライプのような空間ターゲットシナリオで失敗することが多い。
我々は,静的および動的教師モデルと学生モデルを含む,革新的な協調静的動的教師(CSDT)SSLフレームワークを導入する。
また,マルチスケールデュアルパス畳み込み(MDPC)ブロックと特徴マップ重み付き注目(FMWA)ブロックを備えた新しいSSTDネットワークであるMSSA-Netを提案する。
論文 参考訳(メタデータ) (2024-08-09T12:33:27Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Diverse Teacher-Students for Deep Safe Semi-Supervised Learning under Class Mismatch [35.42630035488178]
海外教師学生(textbfDTS)という新しい枠組みを導入する。
教師-学生モデルと教師-学生モデルの両方をラベルなしのサンプルで訓練することにより、DTSは見知らぬクラスの検出を同時に改善しながら、見知らぬクラスの分類を強化することができる。
論文 参考訳(メタデータ) (2024-05-25T06:54:43Z) - Cyclic-Bootstrap Labeling for Weakly Supervised Object Detection [134.05510658882278]
Cyclic-Bootstrap Labeling (CBL) は、弱制御されたオブジェクト検出パイプラインである。
様々な改良モジュールを活用するために、重み付けされた指数移動平均戦略を使用する。
重み付きアンサンブル型教師ネットワークの出力を活用するために, クラス別ランキング蒸留アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-11T07:57:17Z) - MSVQ: Self-Supervised Learning with Multiple Sample Views and Queues [10.327408694770709]
我々は、新しいシンプルなフレームワーク、すなわちMultiple Sample Views and Queues(MSVQ)を提案する。
2つの相補的および対称的アプローチを利用して3つのソフトラベルをオンザフライで共同構築する。
学生ネットワークは、サンプル間の類似性関係を模倣するので、学生ネットワークはデータセット内の偽陰性サンプルをより柔軟に識別できる。
論文 参考訳(メタデータ) (2023-05-09T12:05:14Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - A Weakly Supervised Learning Framework for Salient Object Detection via
Hybrid Labels [96.56299163691979]
本稿では,ハイブリッドラベル下でのSODタスクに焦点をあてる。
このタスクにおけるラベルノイズと量不均衡の問題に対処するため、我々は3つの洗練されたトレーニング戦略を持つ新しいパイプラインフレームワークを設計する。
5つのSODベンチマーク実験により,本手法は弱教師付き/非教師付き手法と競合する性能を示した。
論文 参考訳(メタデータ) (2022-09-07T06:45:39Z) - Active Learning for Deep Visual Tracking [51.5063680734122]
畳み込みニューラルネットワーク(CNN)は近年,単一目標追跡タスクに成功している。
本稿では,ディープ・ビジュアル・トラッキングのためのアクティブ・ラーニング手法を提案する。
アクティブラーニングの指導のもと、トレーニングされた深層CNNモデルに基づくトラッカーは、ラベリングコストを低減しつつ、競合的なトラッキング性能を達成することができる。
論文 参考訳(メタデータ) (2021-10-17T11:47:56Z) - Graph Consistency based Mean-Teaching for Unsupervised Domain Adaptive
Person Re-Identification [54.58165777717885]
本論文では,教師ネットワークと学生ネットワークの間にGCC(Graph Consistency Constraint)を構築するためのGCMT(Graph Consistency Based Mean-Teaching)手法を提案する。
マーケット-1501、デュークMTMCreID、MSMT17の3つのデータセットの実験により、提案されたGCMTは最先端の手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2021-05-11T04:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。