論文の概要: Weakly-Supervised Dense Action Anticipation
- arxiv url: http://arxiv.org/abs/2111.07593v1
- Date: Mon, 15 Nov 2021 08:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-16 16:14:10.389670
- Title: Weakly-Supervised Dense Action Anticipation
- Title(参考訳): 弱めに監督されたDense Action Precipation
- Authors: Haotong Zhang, Fuhai Chen, Angela Yao
- Abstract要約: 本研究では,将来の行動とその持続時間に擬似ラベルを生成するフレームワークを提案する。
今後のアクションラベルのみを入力として、これらの擬似ラベルは将来のアクション/デュレーション予測を導く。
さらに、コンテキスト認識期間を予測するための注意機構を設計する。
- 参考スコア(独自算出の注目度): 26.44509009548384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense anticipation aims to forecast future actions and their durations for
long horizons. Existing approaches rely on fully-labelled data, i.e. sequences
labelled with all future actions and their durations. We present a (semi-)
weakly supervised method using only a small number of fully-labelled sequences
and predominantly sequences in which only the (one) upcoming action is
labelled. To this end, we propose a framework that generates pseudo-labels for
future actions and their durations and adaptively refines them through a
refinement module. Given only the upcoming action label as input, these
pseudo-labels guide action/duration prediction for the future. We further
design an attention mechanism to predict context-aware durations. Experiments
on the Breakfast and 50Salads benchmarks verify our method's effectiveness; we
are competitive even when compared to fully supervised state-of-the-art models.
We will make our code available at:
https://github.com/zhanghaotong1/WSLVideoDenseAnticipation.
- Abstract(参考訳): デンス予測は、将来の行動とその期間を長い地平線のために予測することを目的としている。
既存のアプローチは、完全なラベル付きデータ、すなわち全ての将来の行動とその期間をラベル付けしたシーケンスに依存している。
本稿では,少数の完全ラベル付きシーケンスのみを用いて (半) 弱教師付き手法を提案し, (1) 来るアクションのみをラベル付けする。
そこで本研究では,将来の動作とその継続時間に対して擬似ラベルを生成し,改良モジュールを通じて適応的に改良するフレームワークを提案する。
今後のアクションラベルのみを入力として、これらの擬似ラベルは将来のアクション/デュレーション予測を導く。
さらに、コンテキスト認識期間を予測するための注意機構を設計する。
朝食と50saladsベンチマークによる実験により,本手法の有効性が検証された。
コードはhttps://github.com/zhanghaotong1/wslvideodenseanticipationで利用可能になります。
関連論文リスト
- FinePseudo: Improving Pseudo-Labelling through Temporal-Alignablity for Semi-Supervised Fine-Grained Action Recognition [57.17966905865054]
実生活における行動認識の応用は、しばしば微妙な動きのきめ細かい理解を必要とする。
既存の半教師ありアクション認識は主に粗いアクション認識に焦点を当てている。
そこで我々は,微粒なアクションペアの識別を効果的に行うための,アライナビリティ検証に基づくメトリック学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T20:08:06Z) - DiffAnt: Diffusion Models for Action Anticipation [12.022815981853071]
将来の行動を予測することは本質的に不確実である。現在進行中の行動を含む観察ビデオセグメントを考えると、複数の行動が確実に続く可能性がある。
本研究では, 予測行動の予測を生成的視点から再考し, 拡散モデルを用いて, 様々な将来的行動の予測を行う。
コードとトレーニングされたモデルはGitHubで公開される予定です。
論文 参考訳(メタデータ) (2023-11-27T16:40:09Z) - Improving Weakly Supervised Temporal Action Localization by Bridging
Train-Test Gap in Pseudo Labels [38.35756338815097]
効果的な解法として機能する擬似ラベル法は近年広く研究されている。
既存の方法は、トレーニング中に擬似ラベルを生成し、異なるパイプラインや設定下でのテスト中に予測する。
予測動作境界から高品質な擬似ラベルを生成することを提案する。
論文 参考訳(メタデータ) (2023-04-17T03:47:41Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Learning from Future: A Novel Self-Training Framework for Semantic
Segmentation [33.66516999361252]
自己学習は半教師あり学習において大きな可能性を秘めている。
本稿では,モデルが未来から学べる,新たな自己学習戦略を提案する。
我々は,幅広い環境下でのアプローチの有効性と優位性を実験的に実証した。
論文 参考訳(メタデータ) (2022-09-15T01:39:46Z) - A Generalized & Robust Framework For Timestamp Supervision in Temporal
Action Segmentation [79.436224998992]
時間的アクションセグメンテーションでは、Timestampの監督はビデオシーケンスごとにわずかにラベル付きフレームを必要とする。
本稿では,未ラベルフレームのラベルの不確実性を利用した期待最大化に基づく新しい手法を提案する。
提案手法はSOTA結果を生成し,複数のメトリクスやデータセットの完全教師付き設定を超えている。
論文 参考訳(メタデータ) (2022-07-20T18:30:48Z) - Future Transformer for Long-term Action Anticipation [33.771374384674836]
我々はFuture Transformer(FUTR)と呼ばれる行動予測のためのエンドツーエンドの注意モデルを提案する。
従来の自己回帰モデルとは異なり、提案手法は並列復号法において将来の動作のシーケンス全体を予測することを学習する。
本手法は,Breakfastと50 Saladsの2つの標準ベンチマークで評価し,最先端の結果を得た。
論文 参考訳(メタデータ) (2022-05-27T14:47:43Z) - The Wisdom of Crowds: Temporal Progressive Attention for Early Action
Prediction [104.628661890361]
初期のアクション予測は、部分的に観察されたビデオから進行中のアクションを推測する。
本稿では,細粒度から粗粒度へのプログレッシブサンプリングにより,行動の進化を捉えたボトルネックに基づくアテンションモデルを提案する。
論文 参考訳(メタデータ) (2022-04-28T08:21:09Z) - Accelerating BERT Inference for Sequence Labeling via Early-Exit [65.7292767360083]
我々は最近成功した早期退避機構を拡張し、シークエンスラベリングタスクに対するPTMの推論を高速化する。
また、異なる層で部分トークンを早期に退避させるトークンレベルの早期退避機構も提案する。
当社のアプローチでは,パフォーマンスの低下を最小限に抑えながら,最大66%~75%の推論コストを削減できる。
論文 参考訳(メタデータ) (2021-05-28T14:39:26Z) - Learning to Anticipate Egocentric Actions by Imagination [60.21323541219304]
我々は,エゴセントリックなアクション予測タスクについて検討し,エゴセントリックなビデオの再生に先立って,将来のアクション秒を予測する。
本手法は, EPIC Kitchens Action Precipation Challenge の既視テストセットと未確認テストセットの両方において, 従来手法を有意に上回った。
論文 参考訳(メタデータ) (2021-01-13T08:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。