Fugu-MT 論文翻訳(概要): 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation

論文の概要: 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation

arxiv url: http://arxiv.org/abs/2406.07043v1
Date: Tue, 11 Jun 2024 08:05:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-12 16:54:22.871257
Title: 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation
Title（参考訳）: CVPR 2024 PVUW Workshop: Motion Expression Guided Video Segmentation
Authors: Mingqi Gao, Jingnan Luo, Jinyu Yang, Jungong Han, Feng Zheng,
Abstract要約: ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
参考スコア（独自算出の注目度）: 81.50620771207329
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Motion Expression guided Video Segmentation (MeViS), as an emerging task, poses many new challenges to the field of referring video object segmentation (RVOS). In this technical report, we investigated and validated the effectiveness of static-dominant data and frame sampling on this challenging setting. Our solution achieves a J&F score of 0.5447 in the competition phase and ranks 1st in the MeViS track of the PVUW Challenge. The code is available at: https://github.com/Tapall-AI/MeViS_Track_Solution_2024.
Abstract（参考訳）: Motion Expression Guided Video Segmentation (MeViS)は、新しいタスクとして、ビデオオブジェクトセグメンテーション(RVOS)の分野に多くの新しい課題をもたらす。本稿では,この課題に対して,静的支配データとフレームサンプリングの有効性について検討し,検証した。本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。コードは以下の通り。 https://github.com/Tapall-AI/MeViS_Track_Solution_2024。

関連論文リスト

PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild [164.8093566483583]
本報告では,CVPR 2025と共同で開催されている第4回PVUWチャレンジについて概観する。課題は、複雑なシーンビデオオブジェクトセグメンテーションに焦点を当てたMOSEと、モーションガイドによる言語ベースのビデオセグメンテーションをターゲットとするMeViSの2つのトラックである。
論文参考訳（メタデータ） (2025-04-15T16:02:47Z)
AIM 2024 Sparse Neural Rendering Challenge: Methods and Results [64.19942455360068]
本稿では,ECCV 2024と共同で開催されるAIM(Advanceds in Image Manipulation)ワークショップの一部であるスパースニューラルレンダリングの課題についてレビューする。この課題は、スパース画像から多様なシーンを合成する新しいカメラビューを作ることである。参加者は、Pak Signal-to-Noise Ratio (PSNR) 測定によって測定された地中真実像に対する客観的忠実度を最適化するよう依頼される。
論文参考訳（メタデータ） (2024-09-23T14:17:40Z)
LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation [124.50550604020684]
本稿では,ECCV 2024ワークショップと連携して,第6回大規模ビデオオブジェクト(LSVOS)チャレンジを紹介する。今年の課題には、ビデオオブジェクト(VOS)とビデオオブジェクト(RVOS)の2つのタスクが含まれる。今年の挑戦は、8か国以上の20以上の機関から129の登録チームを引き寄せた。
論文参考訳（メタデータ） (2024-09-09T17:45:45Z)
CSS-Segment: 2nd Place Report of LSVOS Challenge VOS Track [35.70400178294299]
第6回 LSVOS Challenge VOS Track at ECCV 2024 において,ビデオオブジェクトセグメンテーションのためのチーム "yuanjie" のソリューションを紹介した。提案したCSS-Segmentは、複雑なオブジェクトの動きや長期的なプレゼンテーションのビデオにおいて、より優れたパフォーマンスが期待できる。第6回 LSVOS Challenge VOS Track at ECCV 2024 で第2位にランクインした。
論文参考訳（メタデータ） (2024-08-24T13:47:56Z)
PVUW 2024 Challenge on Complex Video Understanding: Methods and Results [199.5593316907284]
我々は、MOSEデータセットに基づく複合ビデオオブジェクトトラックと、MeViSデータセットに基づくモーション表現ガイドビデオトラックの2つの新しいトラックを追加した。 2つの新しいトラックでは、挑戦的な要素を特徴とする追加のビデオとアノテーションを提供しています。これらの新しいビデオ、文、アノテーションにより、より包括的で堅牢なビデオシーン理解の開発を促進することができる。
論文参考訳（メタデータ） (2024-06-24T17:38:58Z)
2nd Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [8.20168024462357]
Motion Expression Guided Videoは、モーション記述付き自然言語表現に基づくビデオ内のオブジェクトのセグメンテーションを目的とした、挑戦的なタスクである。本稿では、時間的拡張のための予備情報としてビデオインスタンス分割モデルから得られたマスク情報を紹介し、空間的洗練のためにSAMを用いる。 CVPR 2024 PVUW Challengeでは,試験段階では49.92 J &F,試験段階では54.20 J &F,MeViS Trackでは2位となった。
論文参考訳（メタデータ） (2024-06-20T02:16:23Z)
2nd Place Solution for PVUW Challenge 2024: Video Panoptic Segmentation [12.274092278786966]
ビデオパノプティクス(VPS)は、ビデオ内のすべてのオブジェクトを同時に分類、追跡、セグメンテーションすることを目的としている。本稿では,ロバストな統合ビデオパノプティクスセグメンテーションソリューションを提案する。本稿では,VPQ スコア56.36 と 57.12 の最先端性能を開発・試験段階で達成する。
論文参考訳（メタデータ） (2024-06-01T17:03:16Z)
1st Place Solution for the 5th LSVOS Challenge: Video Instance Segmentation [25.587080499097425]
我々は,SOTA VIS法,DVISのさらなる改良について述べる。トレーニング可能なトラッカーに対して,より安定かつ正確なオブジェクト追跡を,複雑なビデオや長時間の動画で実現できるように,デノベーショントレーニング戦略を導入する。本手法は,開発段階で57.9 APと56.0 APをそれぞれ達成し,第5回LSVOSチャレンジのVISトラックで第1位となった。
論文参考訳（メタデータ） (2023-08-28T08:15:43Z)
1st Place Solution for PVUW Challenge 2023: Video Panoptic Segmentation [25.235404527487784]
ビデオパノプティクスのセグメンテーションは、多くのダウンストリームアプリケーションの基礎となる難しいタスクである。 DVISが提案するデカップリング戦略は,時間情報をより効果的に活用できると考えている。第2回PVUWチャレンジのVPSトラックでは,それぞれ51.4と53.7のVPQスコアを達成し,第2回PVUWチャレンジのVPSトラックで第1位となった。
論文参考訳（メタデータ） (2023-06-07T01:24:48Z)
The Runner-up Solution for YouTube-VIS Long Video Challenge 2022 [72.13080661144761]
この課題に対して,提案したオンラインビデオインスタンス分割方式IDOLを採用した。擬似ラベルを使用して、コントラスト学習をさらに支援し、時間的に一貫したインスタンスの埋め込みを得る。提案手法は、YouTube-VIS 2022長ビデオデータセット上で40.2 APを取得し、この課題において第2位にランクされた。
論文参考訳（メタデータ） (2022-11-18T01:40:59Z)
AIM 2020 Challenge on Video Temporal Super-Resolution [118.46127362093135]
Video Temporal Super-Resolution (VTSR) の第2回AIMチャレンジ本稿では,ビデオ・テンポラル・スーパー・リゾリューション(VTSR)における第2回AIM課題について報告する。
論文参考訳（メタデータ） (2020-09-28T00:10:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。