論文の概要: VideoSSL: Semi-Supervised Learning for Video Classification
- arxiv url: http://arxiv.org/abs/2003.00197v1
- Date: Sat, 29 Feb 2020 07:13:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 20:42:15.305143
- Title: VideoSSL: Semi-Supervised Learning for Video Classification
- Title(参考訳): VideoSSL: ビデオ分類のための半教師付き学習
- Authors: Longlong Jing, Toufiq Parag, Zhe Wu, Yingli Tian, Hongcheng Wang
- Abstract要約: 畳み込みニューラルネットワーク(CNN)を用いたビデオ分類ビデオSSLのための半教師付き学習手法を提案する。
大規模な注釈付きデータセットへの依存を最小限に抑えるため,提案手法は少数のラベル付きサンプルから学習する。
ラベルのない例からの案内信号の監督の下,CNNは印象的な性能を達成できることを示す。
- 参考スコア(独自算出の注目度): 30.348819309923098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a semi-supervised learning approach for video classification,
VideoSSL, using convolutional neural networks (CNN). Like other computer vision
tasks, existing supervised video classification methods demand a large amount
of labeled data to attain good performance. However, annotation of a large
dataset is expensive and time consuming. To minimize the dependence on a large
annotated dataset, our proposed semi-supervised method trains from a small
number of labeled examples and exploits two regulatory signals from unlabeled
data. The first signal is the pseudo-labels of unlabeled examples computed from
the confidences of the CNN being trained. The other is the normalized
probabilities, as predicted by an image classifier CNN, that captures the
information about appearances of the interesting objects in the video. We show
that, under the supervision of these guiding signals from unlabeled examples, a
video classification CNN can achieve impressive performances utilizing a small
fraction of annotated examples on three publicly available datasets: UCF101,
HMDB51 and Kinetics.
- Abstract(参考訳): 本稿では,畳み込みニューラルネットワーク(CNN)を用いたビデオ分類のための半教師付き学習手法を提案する。
他のコンピュータビジョンタスクと同様に、既存の教師付きビデオ分類手法は、優れたパフォーマンスを得るために大量のラベル付きデータを要求する。
しかし、大きなデータセットのアノテーションは高価で時間がかかります。
大量の注釈付きデータセットへの依存を最小限に抑えるため,提案手法は少数のラベル付きサンプルから訓練し,ラベルなしデータから2つの規制信号を利用する。
最初の信号は、訓練中のCNNの信頼性から計算されたラベルなし例の擬似ラベルである。
もうひとつは、画像分類器CNNが予測した正規化確率で、ビデオ内の興味深いオブジェクトの外観に関する情報をキャプチャする。
ビデオ分類CNNは, 未ラベル例からの案内信号の監督の下で, UCF101, HMDB51, Kineticsの3つの公開データセットに対して, 注釈付きサンプルのごく一部を用いて, 印象的な性能を達成できることが示されている。
関連論文リスト
- Granular-ball Representation Learning for Deep CNN on Learning with Label Noise [14.082510085545582]
本稿では,CNNモデルに組み込むことが可能な一般粒界計算(GBC)モジュールを提案する。
本研究では,入力サンプルを機能レベルで$gb$のサンプルとして分割し,各サンプルは異なる数を持つ複数のサンプルに対応して1つのラベルを共有できることを示した。
実験により,提案手法は追加データや最適化を伴わずにCNNモデルのロバスト性を向上させることができることが示された。
論文 参考訳(メタデータ) (2024-09-05T05:18:31Z) - Efficient labeling of solar flux evolution videos by a deep learning
model [0.0]
畳み込みニューラルネットワーク(CNN)は,データラベリングの品質向上に有効であることを示す。
我々は、粗末なラベルを使用してCNNを訓練し、手動で検証し、CNNとCNNの不一致を正し、収束するまでこのプロセスを繰り返す。
この反復的プロセスによって導出された高品質なラベル付きデータセットは、必要な手作業による検証を50%削減する。
論文 参考訳(メタデータ) (2023-08-29T02:05:40Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - NoisyActions2M: A Multimedia Dataset for Video Understanding from Noisy
Labels [33.659146748289444]
約200万のビデオと関連するユーザ生成アノテーションやその他のメタ情報からなるベンチマークデータセットを作成します。
提案したデータセット上で事前トレーニングされたネットワークは、下流データセットにおけるビデオの破損やラベルノイズに対してどのように役立つかを示す。
論文 参考訳(メタデータ) (2021-10-13T16:12:18Z) - Few-Shot Video Object Detection [70.43402912344327]
本稿では,Few-Shot Video Object Detection (FSVOD) を紹介する。
fsvod-500は500のクラスからなり、各カテゴリーにクラスバランスのビデオがある。
私達のTPNおよびTMN+は共同およびエンドツーエンドの訓練されます。
論文 参考訳(メタデータ) (2021-04-30T07:38:04Z) - Weakly Supervised Instance Segmentation for Videos with Temporal Mask
Consistency [28.352140544936198]
弱い教師付きインスタンスセグメンテーションは、モデルのトレーニングに必要なアノテーションのコストを削減します。
画像ではなく弱いラベル付きビデオでトレーニングすることで,これらの問題に対処できることを示す。
私たちは、弱い教師付きインスタンスセグメンテーションに取り組むために、これらのビデオ信号の使用を初めて調査しました。
論文 参考訳(メタデータ) (2021-03-23T23:20:46Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Semi-supervised deep learning based on label propagation in a 2D
embedded space [117.9296191012968]
提案されたソリューションは、少数の教師なしイメージから多数の教師なしイメージにラベルを伝達し、ディープニューラルネットワークモデルをトレーニングする。
本稿では、より正確なラベル付きサンプルを反復してセットから深層ニューラルネットワーク(VGG-16)をトレーニングするループを提案する。
ラベル付きセットがイテレーションに沿って改善されるにつれて、ニューラルネットワークの機能が改善される。
論文 参考訳(メタデータ) (2020-08-02T20:08:54Z) - Labelling unlabelled videos from scratch with multi-modal
self-supervision [82.60652426371936]
ビデオデータセットの教師なしラベリングは、強力な機能エンコーダから解放されない。
人間のアノテーションを使わずにビデオデータセットの擬似ラベリングを可能にする新しいクラスタリング手法を提案する。
広範囲な分析により、結果として得られたクラスタは、真理の人間ラベルと高いセマンティックオーバーラップがあることが示されている。
論文 参考訳(メタデータ) (2020-06-24T12:28:17Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。