論文の概要: PVUW 2024 Challenge on Complex Video Understanding: Methods and Results
- arxiv url: http://arxiv.org/abs/2406.17005v1
- Date: Mon, 24 Jun 2024 17:38:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 18:50:40.671683
- Title: PVUW 2024 Challenge on Complex Video Understanding: Methods and Results
- Title(参考訳): PVUW 2024 複雑ビデオ理解への挑戦:方法と結果
- Authors: Henghui Ding, Chang Liu, Yunchao Wei, Nikhila Ravi, Shuting He, Song Bai, Philip Torr, Deshui Miao, Xin Li, Zhenyu He, Yaowei Wang, Ming-Hsuan Yang, Zhensong Xu, Jiangtao Yao, Chengjing Wu, Ting Liu, Luoqi Liu, Xinyu Liu, Jing Zhang, Kexin Zhang, Yuting Yang, Licheng Jiao, Shuyuan Yang, Mingqi Gao, Jingnan Luo, Jinyu Yang, Jungong Han, Feng Zheng, Bin Cao, Yisi Zhang, Xuanxu Lin, Xingjian He, Bo Zhao, Jing Liu, Feiyu Pan, Hao Fang, Xiankai Lu,
- Abstract要約: 我々は、MOSEデータセットに基づく複合ビデオオブジェクトトラックと、MeViSデータセットに基づくモーション表現ガイドビデオトラックの2つの新しいトラックを追加した。
2つの新しいトラックでは、挑戦的な要素を特徴とする追加のビデオとアノテーションを提供しています。
これらの新しいビデオ、文、アノテーションにより、より包括的で堅牢なビデオシーン理解の開発を促進することができる。
- 参考スコア(独自算出の注目度): 199.5593316907284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pixel-level Video Understanding in the Wild Challenge (PVUW) focus on complex video understanding. In this CVPR 2024 workshop, we add two new tracks, Complex Video Object Segmentation Track based on MOSE dataset and Motion Expression guided Video Segmentation track based on MeViS dataset. In the two new tracks, we provide additional videos and annotations that feature challenging elements, such as the disappearance and reappearance of objects, inconspicuous small objects, heavy occlusions, and crowded environments in MOSE. Moreover, we provide a new motion expression guided video segmentation dataset MeViS to study the natural language-guided video understanding in complex environments. These new videos, sentences, and annotations enable us to foster the development of a more comprehensive and robust pixel-level understanding of video scenes in complex environments and realistic scenarios. The MOSE challenge had 140 registered teams in total, 65 teams participated the validation phase and 12 teams made valid submissions in the final challenge phase. The MeViS challenge had 225 registered teams in total, 50 teams participated the validation phase and 5 teams made valid submissions in the final challenge phase.
- Abstract(参考訳): PVUW ( Pixel-level Video Understanding in the Wild Challenge) は、複雑なビデオ理解に焦点を当てている。
このCVPR 2024ワークショップでは、MOSEデータセットに基づく複雑なビデオオブジェクトセグメンテーショントラックと、MeViSデータセットに基づくモーション表現ガイド付きビデオセグメンテーショントラックという、2つの新しいトラックを追加します。
2つの新しいトラックでは、オブジェクトの消失と再出現、目立たない小さなオブジェクト、重い閉塞、MOSEの混み合った環境など、困難な要素を特徴とする追加のビデオとアノテーションを提供する。
さらに,複雑な環境下での自然言語誘導映像理解の研究のために,動画セグメンテーションデータセットMeViSを提案する。
これらの新しいビデオ、文、アノテーションにより、複雑な環境や現実的なシナリオにおいて、より包括的で堅牢なビデオシーンの理解を促進することができる。
MOSEチャレンジには合計140の登録チームが参加し、65チームがバリデーションフェーズに参加し、12チームが最終チャレンジフェーズで有効な応募を行った。
MeViSチャレンジには合計225の登録チームが参加し、50チームが検証フェーズに参加し、5チームが最終チャレンジフェーズで有効な応募を行った。
関連論文リスト
- LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation [124.50550604020684]
本稿では,ECCV 2024ワークショップと連携して,第6回大規模ビデオオブジェクト(LSVOS)チャレンジを紹介する。
今年の課題には、ビデオオブジェクト(VOS)とビデオオブジェクト(RVOS)の2つのタスクが含まれる。
今年の挑戦は、8か国以上の20以上の機関から129の登録チームを引き寄せた。
論文 参考訳(メタデータ) (2024-09-09T17:45:45Z) - 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.50620771207329]
ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文 参考訳(メタデータ) (2024-06-11T08:05:26Z) - NTIRE 2023 Quality Assessment of Video Enhancement Challenge [97.809937484099]
NTIRE 2023 Quality Assessment of Video Enhancement Challengeについて報告する。
課題は、ビデオ処理分野における大きな課題、すなわち、強化されたビデオに対するビデオ品質評価(VQA)に対処することである。
参加者数は167名。
論文 参考訳(メタデータ) (2023-07-19T02:33:42Z) - ICDAR 2021 Competition on Scene Video Text Spotting [28.439390836950025]
シーンビデオテキストスポッティング(SVTS)は,多くの実環境応用のために非常に重要な研究課題である。
本稿では,SVTS コンペティションにおける ICDAR 2021 のデータセット記述,タスク定義,評価プロトコル,結果要約について述べる。
論文 参考訳(メタデータ) (2021-07-26T01:25:57Z) - AIM 2020 Challenge on Video Temporal Super-Resolution [118.46127362093135]
Video Temporal Super-Resolution (VTSR) の第2回AIMチャレンジ
本稿では,ビデオ・テンポラル・スーパー・リゾリューション(VTSR)における第2回AIM課題について報告する。
論文 参考訳(メタデータ) (2020-09-28T00:10:29Z) - AIM 2019 Challenge on Video Temporal Super-Resolution: Methods and
Results [129.15554076593762]
本稿では,ビデオ時空間超解像(フレーム)におけるAIMの最初の課題についてレビューする。
低フレームレート(15fps)のビデオシーケンスから、チャレンジ参加者はより高いフレームレート(60fps)のビデオシーケンスを提出するよう求められる。
ハンドヘルドカメラで撮影した多様なビデオから得られたREDS VTSRデータセットをトレーニングおよび評価目的で使用した。
論文 参考訳(メタデータ) (2020-05-04T01:51:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。