論文の概要: 1st place solution for AVA-Kinetics Crossover in AcitivityNet Challenge
2020
- arxiv url: http://arxiv.org/abs/2006.09116v1
- Date: Tue, 16 Jun 2020 12:52:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 21:05:38.135364
- Title: 1st place solution for AVA-Kinetics Crossover in AcitivityNet Challenge
2020
- Title(参考訳): acitivitynet challenge 2020におけるava-kineticsクロスオーバーの1位解
- Authors: Siyu Chen, Junting Pan, Guanglu Song, Manyuan Zhang, Hao Shao, Ziyi
Lin, Jing Shao, Hongsheng Li, Yu Liu
- Abstract要約: 本報告では,ActivityNet Challenge 2020において,行動時間的ローカライゼーショントラックであるAVA-Kineticsの勝利について紹介する。
新しいAVA-Kineticsデータセットの技術詳細と実験結果について述べる。
AVA-キネティクスの試験セットで39.62 mAPを達成したが、これは他の項目よりも大きなマージンで優れていた。
- 参考スコア(独自算出の注目度): 43.81722332148899
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This technical report introduces our winning solution to the spatio-temporal
action localization track, AVA-Kinetics Crossover, in ActivityNet Challenge
2020. Our entry is mainly based on Actor-Context-Actor Relation Network. We
describe technical details for the new AVA-Kinetics dataset, together with some
experimental results. Without any bells and whistles, we achieved 39.62 mAP on
the test set of AVA-Kinetics, which outperforms other entries by a large
margin. Code will be available at: https://github.com/Siyu-C/ACAR-Net.
- Abstract(参考訳): 本報告では, activitynet challenge 2020 における時空間的行動定位トラック ava-kinetics crossover の勝利ソリューションを紹介する。
本稿では主にアクター・コンテキスト・アクター関係ネットワークに基づく。
新しいava-kineticsデータセットの技術的な詳細と実験結果について述べる。
AVA-キネティクスの試験セットで39.62 mAPを達成したが、これは他の項目よりも大きなマージンで優れていた。
コードはhttps://github.com/siyu-c/acar-net。
関連論文リスト
- 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.50620771207329]
ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文 参考訳(メタデータ) (2024-06-11T08:05:26Z) - 1st Place Solution of The Robust Vision Challenge (RVC) 2022 Semantic
Segmentation Track [67.56316745239629]
本報告では,ECCV 2022におけるロバストビジョンチャレンジのセマンティックセグメンテーション課題に対する勝利解について述べる。
本手法では,エンコーダとしてFAN-B-Hybridモデルを採用し,セグメンテーションフレームワークとしてSegformerを使用している。
提案手法は,マルチドメインセグメンテーションタスクの強力なベースラインとして機能し,今後の作業に役立てることができる。
論文 参考訳(メタデータ) (2022-10-23T20:52:22Z) - UniCon+: ICTCAS-UCAS Submission to the AVA-ActiveSpeaker Task at
ActivityNet Challenge 2022 [69.67841335302576]
本稿では,アクティベーションネットチャレンジ2022におけるAVAアクティブ話者検出(ASD)課題に対する,我々の勝利ソリューションの簡潔な説明を行う。
基盤となるモデルであるUniCon+は、以前の作業であるUnified Context Network(UniCon)とExtended UniConの上に構築され続けています。
アーキテクチャをシンプルなGRUベースのモジュールで拡張し、繰り返し発生するアイデンティティの情報がシーンを流れるようにします。
論文 参考訳(メタデータ) (2022-06-22T06:11:07Z) - "Knights": First Place Submission for VIPriors21 Action Recognition
Challenge at ICCV 2021 [39.990872080183884]
本稿では,Kineetics400ViPriorsの小さなサブセット上での動作認識タスクを解決するために,「夜」を提示する。
提案手法は,最先端の時間的コントラスト型自己教師型事前学習,ビデオトランスフォーマーモデル,光学フローのモダリティの3つの構成要素を有する。
論文 参考訳(メタデータ) (2021-10-14T22:47:31Z) - NTIRE 2021 Multi-modal Aerial View Object Classification Challenge [88.89190054948325]
CVPR の NTIRE 2021 ワークショップと共同で,MAVOC (Multi-modal Aerial View Object Classification) の最初の挑戦を紹介した。
この課題は、EOとSAR画像を用いた2つの異なるトラックで構成されている。
本コンペティションで提案した最上位の手法について検討し,その成果を目視テストセットで評価する。
論文 参考訳(メタデータ) (2021-07-02T16:55:08Z) - An Empirical Study of Vehicle Re-Identification on the AI City Challenge [19.13038665501964]
Track2は、現実世界のデータと合成データの両方を扱う車両再識別(ReID)タスクである。
主に、この課題におけるトレーニングデータ、教師なしドメイン適応(UDA)トレーニング、後処理、モデルアンサンブルの4点に注目します。
以上の手法により, 最終的に0.7445mAPのスコアが得られた。
論文 参考訳(メタデータ) (2021-05-20T12:20:52Z) - The AVA-Kinetics Localized Human Actions Video Dataset [124.41706958756049]
本稿では,AVA-Kineticsによる人行動ビデオデータセットについて述べる。
データセットは、AVAアノテーションプロトコルを使用して、Kinetics-700データセットのビデオをアノテートすることで収集される。
データセットには、キーフレーム内の各人間のための80のAVAアクションクラスに注釈付けされた230万以上のクリップが含まれている。
論文 参考訳(メタデータ) (2020-05-01T04:17:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。