論文の概要: Weakly Supervised Temporal Action Localization with Segment-Level Labels
- arxiv url: http://arxiv.org/abs/2007.01598v1
- Date: Fri, 3 Jul 2020 10:32:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 05:37:19.392576
- Title: Weakly Supervised Temporal Action Localization with Segment-Level Labels
- Title(参考訳): セグメンションレベルラベルを用いた時間的行動位置推定の弱化
- Authors: Xinpeng Ding, Nannan Wang, Xinbo Gao, Jie Li, Xiaoyu Wang and
Tongliang Liu
- Abstract要約: 時間的アクションローカライゼーションは、テストパフォーマンスとアノテーション時間コストのトレードオフを示す。
ここでは、アノテーションがアクションを観察するときにセグメントがラベル付けされる。
我々は、ラベル付きセグメントから積分的な動作部分を学ぶために、損失サンプリングと見なされる部分的なセグメント損失を考案する。
- 参考スコア(独自算出の注目度): 140.68096218667162
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporal action localization presents a trade-off between test performance
and annotation-time cost. Fully supervised methods achieve good performance
with time-consuming boundary annotations. Weakly supervised methods with
cheaper video-level category label annotations result in worse performance. In
this paper, we introduce a new segment-level supervision setting: segments are
labeled when annotators observe actions happening here. We incorporate this
segment-level supervision along with a novel localization module in the
training. Specifically, we devise a partial segment loss regarded as a loss
sampling to learn integral action parts from labeled segments. Since the
labeled segments are only parts of actions, the model tends to overfit along
with the training process. To tackle this problem, we first obtain a similarity
matrix from discriminative features guided by a sphere loss. Then, a
propagation loss is devised based on the matrix to act as a regularization
term, allowing implicit unlabeled segments propagation during training.
Experiments validate that our method can outperform the video-level supervision
methods with almost same the annotation time.
- Abstract(参考訳): テンポラリアクションのローカライゼーションは、テストパフォーマンスとアノテーション時間コストのトレードオフを示す。
完全な教師付きメソッドは、時間を要する境界アノテーションで優れたパフォーマンスを達成する。
安価なビデオレベルのカテゴリラベルアノテーションを持つ弱い教師付きメソッドは、パフォーマンスを低下させる。
本稿では,アノテータがここで発生する動作を観察する際,セグメントをラベル付けする,新しいセグメントレベルの監視設定を提案する。
トレーニングには,このセグメントレベルの監視と,新たなローカライゼーションモジュールが組み込まれている。
具体的には,損失サンプリングと見なされる部分セグメント損失を考案し,ラベル付きセグメントから統合的な動作部分を学ぶ。
ラベル付きセグメントはアクションの一部なので、モデルはトレーニングプロセスに合わせて過剰に適合しがちです。
この問題に取り組むため,まず球面損失に導かれた識別的特徴から類似度行列を得る。
そして、行列に基づいて伝播損失を考案し、正規化項として働き、訓練中に暗黙的なラベルなしセグメントの伝播を可能にする。
実験により,提案手法がアノテーション時間とほぼ同じビデオレベルの監督手法を上回ることを検証した。
関連論文リスト
- Efficient and Effective Weakly-Supervised Action Segmentation via Action-Transition-Aware Boundary Alignment [33.74853437611066]
弱教師付きアクションセグメンテーションは、長いビデオを複数のアクションセグメンテーションに分割する学習である。
既存の手法の多くは、すべてのフレームと転写文間のシリアルアライメントによるトレーニングのために擬似セグメンテーションを推論する必要がある。
本稿では,雑音境界を効果的かつ効果的にフィルタリングし,遷移を検出する新しい行動遷移対応境界アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-28T08:39:44Z) - Proposal-based Temporal Action Localization with Point-level Supervision [29.98225940694062]
ポイントレベルの時間的行動ローカライゼーション(PTAL)は、未トリミングビデオにおけるアクションの認識とローカライズを目的としている。
そこで本研究では,フレキシブル期間のアクション提案を生成し,評価することで,アクションをローカライズする手法を提案する。
実験の結果,提案手法は最先端手法の競争力や性能に優れることがわかった。
論文 参考訳(メタデータ) (2023-10-09T08:27:05Z) - Weakly-Supervised Temporal Action Localization with Bidirectional
Semantic Consistency Constraint [83.36913240873236]
WTAL(Weakly Supervised Temporal Action Localization)は、ビデオの時間的境界を分類し、ローカライズすることを目的としている。
本研究では,双方向意味整合性制約 (Bi-SCC) という単純な手法を提案する。
実験結果から,THUMOS14とActivityNetの最先端手法よりも優れた結果が得られた。
論文 参考訳(メタデータ) (2023-04-25T07:20:33Z) - Temporal Segment Transformer for Action Segmentation [54.25103250496069]
本稿では,テキスト・セグメント・トランスフォーマ (textittemporal segment transformer) と呼ぶアテンション・ベース・アプローチを提案する。
主な考え方は、セグメントとフレームの間の注意を用いてセグメント表現を識別することであり、またセグメント間の時間的相関を捉えるためにセグメント間注意を用いる。
このアーキテクチャは,50Salads,GTEA,Breakfastのベンチマークにおいて,最先端の精度を実現していることを示す。
論文 参考訳(メタデータ) (2023-02-25T13:05:57Z) - Turning to a Teacher for Timestamp Supervised Temporal Action
Segmentation [27.735478880660164]
本稿では,時間スタンプによる時間的動作分割のための新しいフレームワークを提案する。
本稿では,モデル最適化のプロセスの安定化を支援するために,セグメンテーションモデルに平行な教師モデルを提案する。
提案手法は最先端の手法より優れており,アノテーションコストがはるかに低い完全教師付き手法に対してコンパロブルに機能する。
論文 参考訳(メタデータ) (2022-07-02T02:00:55Z) - Video Activity Localisation with Uncertainties in Temporal Boundary [74.7263952414899]
時間とともにビデオ活動のローカライゼーションを行う方法は、時間的境界が決定され正確であると暗黙的に仮定する。
無記述の自然ビデオでは、異なるアクティビティがスムーズに移動するため、アクティビティの開始と終了が時間とともに正確にラベル付けされることは本質的に曖昧である。
フレキシブルかつ適応的な活動時間境界に対応するための弾性モーメントバウンディング(EMB)を導入する。
論文 参考訳(メタデータ) (2022-06-26T16:45:56Z) - Unsupervised Action Segmentation with Self-supervised Feature Learning
and Co-occurrence Parsing [32.66011849112014]
時間的アクションセグメンテーションは、ビデオの各フレームをアクションラベルで分類するタスクである。
本研究では,ラベル付けされていないビデオのコーパスで動作する自己教師型手法を探索し,ビデオ全体にわたる時間的セグメントのセットを予測する。
我々は,行動の構造に基づくサブアクション間の相関を捉えるだけでなく,そのサブアクションの時間的軌跡を正確かつ一般的な方法で推定する,新しい共起動作解析アルゴリズムであるCAPを開発した。
論文 参考訳(メタデータ) (2021-05-29T00:29:40Z) - SegGroup: Seg-Level Supervision for 3D Instance and Semantic
Segmentation [88.22349093672975]
アノテーションの場所を示すためにインスタンス毎に1つのポイントをクリックするだけでよい、弱い教師付きポイントクラウドセグメンテーションアルゴリズムを設計します。
事前処理のオーバーセグメンテーションにより、これらの位置アノテーションをセグレベルのラベルとしてセグメントに拡張する。
seg-level supervised method (SegGroup) は、完全注釈付きポイントレベルのsupervised method で比較結果が得られることを示した。
論文 参考訳(メタデータ) (2020-12-18T13:23:34Z) - On Evaluating Weakly Supervised Action Segmentation Methods [79.42955857919497]
本研究は、弱い教師付き行動セグメント化アプローチの使用と評価の2つの側面に焦点を当てる。
それぞれの手法をBreakfastデータセット上で5回トレーニングし、平均および標準偏差を提供する。
実験の結果,これらの反復に対する標準偏差は1~2.5%であり,異なるアプローチの比較に大きく影響していることがわかった。
論文 参考訳(メタデータ) (2020-05-19T20:30:31Z) - Weakly Supervised Temporal Action Localization Using Deep Metric
Learning [12.49814373580862]
本稿では,トレーニング中の映像レベルのアクションインスタンスのみを統括する時間的行動ローカライズ手法を提案する。
標準バックプロパゲーションアルゴリズムを用いて,バランスの取れた2進クロスエントロピー損失とメートル法損失を共同で最適化する。
IoU閾値0.5でTHUMOS14を6.5%mAP改善し,ActivityNet1.2の競合性能を実現した。
論文 参考訳(メタデータ) (2020-01-21T22:01:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。