論文の概要: TAEN: Temporal Aware Embedding Network for Few-Shot Action Recognition
- arxiv url: http://arxiv.org/abs/2004.10141v2
- Date: Sat, 17 Jul 2021 10:54:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 07:15:35.444199
- Title: TAEN: Temporal Aware Embedding Network for Few-Shot Action Recognition
- Title(参考訳): TAEN:Few-Shot行動認識のための一時意識埋め込みネットワーク
- Authors: Rami Ben-Ari, Mor Shpigel, Ophir Azulai, Udi Barzelay and Daniel
Rotman
- Abstract要約: 短時間の動作認識のためのTAEN(Aware Temporal Embedding Network)を提案する。
映像分類と時間的行動検出の2つの課題に対するTAENの有効性を実証した。
ほんの数枚の完全に接続されたレイヤのトレーニングでは、いくつかのショットビデオ分類と時間的検出タスクの両方で、先行技術に匹敵する結果に到達します。
- 参考スコア(独自算出の注目度): 10.07962673311661
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Classification of new class entities requires collecting and annotating
hundreds or thousands of samples that is often prohibitively costly. Few-shot
learning suggests learning to classify new classes using just a few examples.
Only a small number of studies address the challenge of few-shot learning on
spatio-temporal patterns such as videos. In this paper, we present the Temporal
Aware Embedding Network (TAEN) for few-shot action recognition, that learns to
represent actions, in a metric space as a trajectory, conveying both short term
semantics and longer term connectivity between action parts. We demonstrate the
effectiveness of TAEN on two few shot tasks, video classification and temporal
action detection and evaluate our method on the Kinetics-400 and on ActivityNet
1.2 few-shot benchmarks. With training of just a few fully connected layers we
reach comparable results to prior art on both few shot video classification and
temporal detection tasks, while reaching state-of-the-art in certain scenarios.
- Abstract(参考訳): 新しいクラスエンティティの分類には数百から数千のサンプルを収集して注釈付けする必要がある。
ほんの少しの例を使って新しいクラスを分類することを学習は提案する。
ビデオのような時空間パターンにおける数ショット学習の課題に対処する研究はごく少数である。
本稿では,距離空間において動作を軌道として表現することを学び,短期意味論と動作部分間の長期接続の両方を伝達する,行動認識のための時間的認識埋め込みネットワーク(taen)を提案する。
ビデオ分類と時間的動作検出の2つの課題に対するTAENの有効性を実証し,Kinetics-400およびActivityNet 1.2の撮影ベンチマークで評価した。
ほんの数枚の完全に接続されたレイヤのトレーニングでは、いくつかのショットビデオ分類と時間検出タスクの両方において、先行技術に匹敵する結果に達します。
関連論文リスト
- A Comprehensive Review of Few-shot Action Recognition [64.47305887411275]
アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。
ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文 参考訳(メタデータ) (2024-07-20T03:53:32Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Few-Shot Action Localization without Knowing Boundaries [9.959844922120523]
対象のアクションの1/2のトリミング例がテスト時にのみ利用可能である場合,未トリミングビデオ中のアクションのローカライズを学習可能であることを示す。
ビデオのペア間の微細な類似パターンをモデル化した時間的類似度行列(TSM)を推定するネットワークを提案する。
提案手法は,最先端の完全教師付き,少数ショットの学習手法に匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2021-06-08T07:32:43Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Few-Shot Image Classification via Contrastive Self-Supervised Learning [5.878021051195956]
本稿では,欠陥を修復するための教師なし数発学習の新たなパラダイムを提案する。
我々は2つのフェーズでいくつかの課題を解決した: 対照的な自己教師付き学習を通して、伝達可能な特徴抽出器をメタトレーニングする。
本手法は,標準的な数ショットの視覚的分類データセット上で,多数の確立された数ショットタスクにおいて,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-08-23T02:24:31Z) - Generalized Few-Shot Video Classification with Video Retrieval and
Feature Generation [132.82884193921535]
従来の手法は,映像特徴学習の重要性を過小評価し,二段階的アプローチを提案する。
この単純なベースラインアプローチは、既存のベンチマークで20ポイント以上の精度で、以前の数ショットビデオ分類方法よりも優れていることを示す。
さらなる改善をもたらす2つの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-09T13:05:32Z) - Revisiting Few-shot Activity Detection with Class Similarity Control [107.79338380065286]
本稿では,提案回帰に基づく数ショットの時間的活動検出のためのフレームワークを提案する。
我々のモデルはエンドツーエンドのトレーニングが可能で、数ショットのアクティビティと未トリミングなテストビデオのフレームレートの違いを考慮しており、さらに数ショットのサンプルの恩恵を受けることができる。
論文 参考訳(メタデータ) (2020-03-31T22:02:38Z) - Any-Shot Object Detection [81.88153407655334]
「アニーショット検出」とは、全く見えず、数発のカテゴリが推論中に同時に共起できる場所である。
我々は、ゼロショットと少数ショットの両方のオブジェクトクラスを同時に検出できる、統合された任意のショット検出モデルを提案する。
我々のフレームワークは、ゼロショット検出とFewショット検出タスクにのみ使用できる。
論文 参考訳(メタデータ) (2020-03-16T03:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。