論文の概要: 1st Place Solutions for the UVO Challenge 2022
- arxiv url: http://arxiv.org/abs/2210.09629v1
- Date: Tue, 18 Oct 2022 06:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 14:57:04.051732
- Title: 1st Place Solutions for the UVO Challenge 2022
- Title(参考訳): uvo challenge 2022の1位ソリューション
- Authors: Jiajun Zhang and Boyu Chen and Zhilong Ji and Jinfeng Bai and Zonghai
Hu
- Abstract要約: この手法は、2nd Unidentified Video Objects (UVO) チャレンジで第1位となり、制限されたデータフレームトラックでそれぞれ46.8、64.7、32.2のAR@100、無制限のデータフレームトラックとビデオトラックを達成した。
- 参考スコア(独自算出の注目度): 26.625850534861414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes the approach we have taken in the challenge. We still
adopted the two-stage scheme same as the last champion, that is, detection
first and segmentation followed. We trained more powerful detector and
segmentor separately. Besides, we also perform pseudo-label training on the
test set, based on student-teacher framework and end-to-end transformer based
object detection. The method ranks first on the 2nd Unidentified Video Objects
(UVO) challenge, achieving AR@100 of 46.8, 64.7 and 32.2 in the limited data
frame track, unlimited data frame track and video track respectively.
- Abstract(参考訳): 本稿では,この課題に対するアプローチについて述べる。
最後のチャンピオンと同じ2段階のスキーム、すなわち、最初に検出し、その後にセグメンテーションを採用しました。
より強力な検出器とセグメンタを別々に訓練しました。
また,学生教師フレームワークとエンドツーエンドトランスフォーマーに基づくオブジェクト検出に基づいて,テストセット上で擬似ラベルトレーニングを行う。
この手法は、2nd Unidentified Video Objects (UVO) チャレンジで第1位となり、制限されたデータフレームトラックでそれぞれ46.8、64.7、32.2のAR@100を達成する。
関連論文リスト
- PVUW 2024 Challenge on Complex Video Understanding: Methods and Results [199.5593316907284]
我々は、MOSEデータセットに基づく複合ビデオオブジェクトトラックと、MeViSデータセットに基づくモーション表現ガイドビデオトラックの2つの新しいトラックを追加した。
2つの新しいトラックでは、挑戦的な要素を特徴とする追加のビデオとアノテーションを提供しています。
これらの新しいビデオ、文、アノテーションにより、より包括的で堅牢なビデオシーン理解の開発を促進することができる。
論文 参考訳(メタデータ) (2024-06-24T17:38:58Z) - 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.50620771207329]
ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文 参考訳(メタデータ) (2024-06-11T08:05:26Z) - Solution for Point Tracking Task of ICCV 1st Perception Test Challenge 2023 [50.910598799408326]
Tracking Any Point (TAP) タスクは、ビデオを通じて任意の物理的表面を追跡する。
既存のいくつかのアプローチは、スムーズな運動軌跡を得るための時間的関係を考慮し、TAPを探索してきた。
我々は,静的カメラが撮影したビデオの静的点追跡の修正に焦点を当てた,信頼度の高い静的点付きTAP(TAPIR+)を提案する。
論文 参考訳(メタデータ) (2024-03-26T13:50:39Z) - Perception Test 2023: A Summary of the First Challenge And Outcome [67.0525378209708]
最初のパーセプションテストは、IEEE/CVF International Conference on Computer Vision (ICCV) 2023と共に半日間のワークショップとして開催された。
目標は、最近提案されたPerception Testベンチマークで最先端のビデオモデルをベンチマークすることであった。
このレポートでは、タスク記述、メトリクス、ベースライン、結果について要約しています。
論文 参考訳(メタデータ) (2023-12-20T15:12:27Z) - SoccerNet 2023 Tracking Challenge -- 3rd place MOT4MOT Team Technical
Report [0.552480439325792]
SoccerNet 2023の追跡課題は、サッカー選手とボールの検出と追跡を必要とする。
我々は、現在最先端のオンラインマルチオブジェクトトラッカーと、現代のオブジェクト検出装置をプレイヤー追跡に使用しています。
提案手法は, HOTAスコア66.27で, SoccerNet 2023の3位を獲得した。
論文 参考訳(メタデータ) (2023-08-31T11:51:16Z) - The Runner-up Solution for YouTube-VIS Long Video Challenge 2022 [72.13080661144761]
この課題に対して,提案したオンラインビデオインスタンス分割方式IDOLを採用した。
擬似ラベルを使用して、コントラスト学習をさらに支援し、時間的に一貫したインスタンスの埋め込みを得る。
提案手法は、YouTube-VIS 2022長ビデオデータセット上で40.2 APを取得し、この課題において第2位にランクされた。
論文 参考訳(メタデータ) (2022-11-18T01:40:59Z) - The 1st-place Solution for ECCV 2022 Multiple People Tracking in Group
Dance Challenge [28.79662033029203]
グループダンス多人数追跡チャレンジの1位となるソリューションを提示する。
MOTR: End-to-End Multiple-Object Tracking with Transformerをベースとして、1)クエリをアンカーとして検出し、2)クエリをデノイングとして追跡し、3)CrowdHumanデータセットから生成された擬似ビデオクリップを共同でトレーニングする。
本研究では,DanceTrackテストセット上で73.4%のHOTAを達成し,第2位のソリューションを+6.8%のHOTAで上回った。
論文 参考訳(メタデータ) (2022-10-27T09:28:44Z) - Weakly Supervised Two-Stage Training Scheme for Deep Video Fight
Detection Model [0.0]
ビデオにおけるファイト検出は、今日の監視システムとストリーミングメディアの普及にともなう、新たなディープラーニングアプリケーションである。
これまでの研究は、この問題に対処するための行動認識技術に大きく依存していた。
本研究では,動作認識特徴抽出器と異常スコア生成器の合成として,戦闘検出モデルを設計する。
論文 参考訳(メタデータ) (2022-09-23T08:29:16Z) - NTIRE 2021 Challenge on Quality Enhancement of Compressed Video: Dataset
and Study [95.36629866768999]
本稿では, NTIRE 2021チャレンジの最先端手法について, 映像強調のための新しいデータセットを提案する。
この課題は、3つのコンペティション、数百の参加者、数十のソリューションで、この方向の最初のNTIREチャレンジです。
NTIRE 2021の課題は圧縮ビデオの品質向上の最先端技術であることがわかった。
論文 参考訳(メタデータ) (2021-04-21T22:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。