論文の概要: Masked Autoencoders for Generic Event Boundary Detection CVPR'2022
Kinetics-GEBD Challenge
- arxiv url: http://arxiv.org/abs/2206.08610v1
- Date: Fri, 17 Jun 2022 08:10:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-20 13:55:15.735196
- Title: Masked Autoencoders for Generic Event Boundary Detection CVPR'2022
Kinetics-GEBD Challenge
- Title(参考訳): 汎用イベント境界検出CVPR'2022Kineetics-GEBDチャレンジのためのマスク付きオートエンコーダ
- Authors: Rui He, Yuanxi Sun, Youzeng Li, Zuwei Huang, Feng Hu, Xu Cheng, Jie
Tang
- Abstract要約: ジェネリックイベント境界検出(GEBD)タスクは、ビデオ全体をチャンクに分割する、ジェネリックで分類のないイベント境界を検出することを目的としている。
本稿では,GABDタスクにおけるアルゴリズム性能向上のためにMasked Autoencodersを適用した。
我々のアプローチでは、2021年のキネティクス-GEBDチャレンジの勝者と比較してF1スコアを2.31%改善したKinetics-GEBDテストセットのF1スコアで85.94%を達成した。
- 参考スコア(独自算出の注目度): 11.823891739821443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generic Event Boundary Detection (GEBD) tasks aim at detecting generic,
taxonomy-free event boundaries that segment a whole video into chunks. In this
paper, we apply Masked Autoencoders to improve algorithm performance on the
GEBD tasks. Our approach mainly adopted the ensemble of Masked Autoencoders
fine-tuned on the GEBD task as a self-supervised learner with other base
models. Moreover, we also use a semi-supervised pseudo-label method to take
full advantage of the abundant unlabeled Kinetics-400 data while training. In
addition, we propose a soft-label method to partially balance the positive and
negative samples and alleviate the problem of ambiguous labeling in this task.
Lastly, a tricky segmentation alignment policy is implemented to refine
boundaries predicted by our models to more accurate locations. With our
approach, we achieved 85.94% on the F1-score on the Kinetics-GEBD test set,
which improved the F1-score by 2.31% compared to the winner of the 2021
Kinetics-GEBD Challenge. Our code is available at
https://github.com/ContentAndMaterialPortrait/MAE-GEBD.
- Abstract(参考訳): ジェネリックイベント境界検出(GEBD)タスクは、ビデオ全体をチャンクに分割する、ジェネリックで分類のないイベント境界を検出することを目的としている。
本稿では,GABDタスクにおけるアルゴリズム性能向上のためにMasked Autoencodersを適用した。
提案手法は,他のベースモデルを用いた自己教師型学習者として,GABDタスクを微調整したMasked Autoencoderのアンサンブルを主に採用した。
さらに,半教師付き擬似ラベル法を用いて,トレーニング中に大量の未ラベルの Kinetics-400 データをフル活用する。
さらに,正と負のサンプルを部分的にバランスさせ,不明瞭なラベル付けの問題を緩和するソフトラベル手法を提案する。
最後に、モデルによって予測される境界をより正確な場所に洗練するために、トリッキーなセグメンテーションアライメントポリシーが実装されている。
我々のアプローチでは、2021年のキネティクス-GEBDチャレンジの勝者と比較してF1スコアを2.31%改善したKinetics-GEBDテストセットのF1スコアで85.94%を達成した。
私たちのコードはhttps://github.com/ContentAndMaterialPortrait/MAE-GEBDで利用可能です。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - What's in the Flow? Exploiting Temporal Motion Cues for Unsupervised Generic Event Boundary Detection [1.3695134621603882]
ジェネリックイベント境界検出(GEBD)タスクは、ビデオを意味のあるイベントに分割する、ジェネリックで分類のない境界を認識することを目的としている。
現在の手法は通常、大量のデータに基づいてトレーニングされたニューラルモデルを含み、かなりの計算能力とストレージスペースを必要とする。
GEBDのための非パラメトリック非教師技術であるFlowGEBDを提案する。
論文 参考訳(メタデータ) (2024-02-15T14:49:15Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - MAE-GEBD:Winning the CVPR'2023 LOVEU-GEBD Challenge [11.823891739821443]
様々なクラスに適用可能な一般的なイベント境界を検出することによって,ビデオセグメントをセグメントに分割するモデルを構築した。
去年のMAE-GEBD法に基づいて,データ処理戦略と損失関数を調整することにより,GEBDタスクにおけるモデル性能を改善した。
本研究では,2022年のKineetics-GEBD法と比較してF1スコアが0.09%向上したKineetics-GEBDテストセットにおいて,F1スコアの86.03%を達成した。
論文 参考訳(メタデータ) (2023-06-27T02:35:19Z) - The Second-place Solution for CVPR VISION 23 Challenge Track 1 -- Data
Effificient Defect Detection [3.4853769431047907]
データ有効欠陥検出のためのビジョンチャレンジトラック1は、競合相手がデータ不足の環境で14の産業検査データセットを例示する必要がある。
この課題に対して、Aoi-overfiting-Teamチームの技術詳細を紹介します。
論文 参考訳(メタデータ) (2023-06-25T03:37:02Z) - The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation
via Point-Guided Mask Representation [61.027468209465354]
本稿では,ポイントラベル付き弱半教師付きインスタンスセグメンテーション(WSSIS)という新しい学習手法を提案する。
本稿では、予算に優しいポイントラベルを強力な弱監督源として効果的に活用できるWSSISの手法を提案する。
我々はCOCOとBDD100Kデータセットの広範な実験を行い、提案手法は完全な教師付きモデルのデータセットに匹敵する有望な結果を得る。
論文 参考訳(メタデータ) (2023-03-27T10:11:22Z) - Robust Target Training for Multi-Source Domain Adaptation [110.77704026569499]
両レベル最適化に基づく新しいMSDAのためのロバスト目標訓練法(BORT$2$)を提案する。
提案手法は,大規模なDomainNetデータセットを含む3つのMSDAベンチマークにおいて,アートパフォーマンスの状態を達成している。
論文 参考訳(メタデータ) (2022-10-04T15:20:01Z) - Submission to Generic Event Boundary Detection Challenge@CVPR 2022:
Local Context Modeling and Global Boundary Decoding Approach [46.97359231258202]
ジェネリックイベント境界検出(GEBD)はビデオ理解において重要な課題である。
GEBDタスクに対する局所コンテキストモデリングと大域境界復号化手法を提案する。
論文 参考訳(メタデータ) (2022-06-30T13:19:53Z) - Winning the CVPR'2021 Kinetics-GEBD Challenge: Contrastive Learning
Approach [27.904987752334314]
本稿では,ジェネリックイベント境界検出タスクに対処するための,新しいコントラスト学習に基づくアプローチを提案する。
本モデルでは,時間的自己相似行列(TSM)を中間表現として利用し,情報ボトルネックとしての役割を担っている。
論文 参考訳(メタデータ) (2021-06-22T05:21:59Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。