論文の概要: The Runner-up Solution for YouTube-VIS Long Video Challenge 2022
- arxiv url: http://arxiv.org/abs/2211.09973v1
- Date: Fri, 18 Nov 2022 01:40:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 15:01:50.237309
- Title: The Runner-up Solution for YouTube-VIS Long Video Challenge 2022
- Title(参考訳): youtube-vis long video challenge 2022の次点ソリューション
- Authors: Junfeng Wu, Yi Jiang, Qihao Liu, Xiang Bai, Song Bai
- Abstract要約: この課題に対して,提案したオンラインビデオインスタンス分割方式IDOLを採用した。
擬似ラベルを使用して、コントラスト学習をさらに支援し、時間的に一貫したインスタンスの埋め込みを得る。
提案手法は、YouTube-VIS 2022長ビデオデータセット上で40.2 APを取得し、この課題において第2位にランクされた。
- 参考スコア(独自算出の注目度): 72.13080661144761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This technical report describes our 2nd-place solution for the ECCV 2022
YouTube-VIS Long Video Challenge. We adopt the previously proposed online video
instance segmentation method IDOL for this challenge. In addition, we use
pseudo labels to further help contrastive learning, so as to obtain more
temporally consistent instance embedding to improve tracking performance
between frames. The proposed method obtains 40.2 AP on the YouTube-VIS 2022
long video dataset and was ranked second place in this challenge. We hope our
simple and effective method could benefit further research.
- Abstract(参考訳): この技術レポートでは、ECCV 2022 YouTube-VIS Long Video Challengeの2位となるソリューションを説明します。
この課題には,先述したオンラインビデオインスタンスセグメンテーション手法idolを採用する。
さらに,疑似ラベルを用いてコントラスト学習をさらに支援し,フレーム間のトラッキング性能を向上させるために,より時間的に一貫性のあるインスタンス埋め込みを実現する。
提案手法は,YouTube-VIS 2022 長ビデオデータセット上で 40.2 AP を取得し,この課題において第2位となった。
我々のシンプルで効果的な方法がさらなる研究に役立つことを期待している。
関連論文リスト
- CSS-Segment: 2nd Place Report of LSVOS Challenge VOS Track [35.70400178294299]
第6回 LSVOS Challenge VOS Track at ECCV 2024 において,ビデオオブジェクトセグメンテーションのためのチーム "yuanjie" のソリューションを紹介した。
提案したCSS-Segmentは、複雑なオブジェクトの動きや長期的なプレゼンテーションのビデオにおいて、より優れたパフォーマンスが期待できる。
第6回 LSVOS Challenge VOS Track at ECCV 2024 で第2位にランクインした。
論文 参考訳(メタデータ) (2024-08-24T13:47:56Z) - 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.50620771207329]
ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文 参考訳(メタデータ) (2024-06-11T08:05:26Z) - A Solution to CVPR'2023 AQTC Challenge: Video Alignment for Multi-Step
Inference [51.26551806938455]
Egocentric AssistantのためのAQTC(Affordance-centric Question-driven Task Completion)は、画期的なシナリオを導入している。
マルチステップ推論を改善するために,映像アライメント向上のためのソリューションを提案する。
CVPR'2023 AQTCでは2位であった。
論文 参考訳(メタデータ) (2023-06-26T04:19:33Z) - 1st Place Solution for PVUW Challenge 2023: Video Panoptic Segmentation [25.235404527487784]
ビデオパノプティクスのセグメンテーションは、多くのダウンストリームアプリケーションの基礎となる難しいタスクである。
DVISが提案するデカップリング戦略は,時間情報をより効果的に活用できると考えている。
第2回PVUWチャレンジのVPSトラックでは,それぞれ51.4と53.7のVPQスコアを達成し,第2回PVUWチャレンジのVPSトラックで第1位となった。
論文 参考訳(メタデータ) (2023-06-07T01:24:48Z) - 1st Place Solutions for the UVO Challenge 2022 [26.625850534861414]
この手法は、2nd Unidentified Video Objects (UVO) チャレンジで第1位となり、制限されたデータフレームトラックでそれぞれ46.8、64.7、32.2のAR@100、無制限のデータフレームトラックとビデオトラックを達成した。
論文 参考訳(メタデータ) (2022-10-18T06:54:37Z) - AIM 2022 Challenge on Super-Resolution of Compressed Image and Video:
Dataset, Methods and Results [110.91485363392167]
本稿では,AIM 2022における圧縮画像・映像の超解像に関する課題について概説する。
提案手法と解法は,圧縮画像およびビデオ上での超解像の最先端性を評価する。
論文 参考訳(メタデータ) (2022-08-23T20:32:38Z) - ReLER@ZJU-Alibaba Submission to the Ego4D Natural Language Queries
Challenge 2022 [61.81899056005645]
ビデオクリップとテキストクエリが与えられた場合、この課題のゴールは、クエリに対する回答が得られるビデオクリップの時間的モーメントを見つけることである。
本稿では,言語クエリとビデオクリップの相関関係を明らかにするために,マルチスケールのクロスモーダル変換器とビデオフレームレベルのコントラスト損失を提案する。
実験の結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-07-01T12:48:35Z) - NTIRE 2021 Challenge on Quality Enhancement of Compressed Video: Dataset
and Study [95.36629866768999]
本稿では, NTIRE 2021チャレンジの最先端手法について, 映像強調のための新しいデータセットを提案する。
この課題は、3つのコンペティション、数百の参加者、数十のソリューションで、この方向の最初のNTIREチャレンジです。
NTIRE 2021の課題は圧縮ビデオの品質向上の最先端技術であることがわかった。
論文 参考訳(メタデータ) (2021-04-21T22:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。