論文の概要: LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation
- arxiv url: http://arxiv.org/abs/2409.05847v1
- Date: Mon, 9 Sep 2024 17:45:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 13:36:22.894515
- Title: LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation
- Title(参考訳): LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation
- Authors: Henghui Ding, Lingyi Hong, Chang Liu, Ning Xu, Linjie Yang, Yuchen Fan, Deshui Miao, Yameng Gu, Xin Li, Zhenyu He, Yaowei Wang, Ming-Hsuan Yang, Jinming Chai, Qin Ma, Junpei Zhang, Licheng Jiao, Fang Liu, Xinyu Liu, Jing Zhang, Kexin Zhang, Xu Liu, LingLing Li, Hao Fang, Feiyu Pan, Xiankai Lu, Wei Zhang, Runmin Cong, Tuyen Tran, Bin Cao, Yisi Zhang, Hanyi Wang, Xingjian He, Jing Liu,
- Abstract要約: 本稿では,ECCV 2024ワークショップと連携して,第6回大規模ビデオオブジェクト(LSVOS)チャレンジを紹介する。
今年の課題には、ビデオオブジェクト(VOS)とビデオオブジェクト(RVOS)の2つのタスクが含まれる。
今年の挑戦は、8か国以上の20以上の機関から129の登録チームを引き寄せた。
- 参考スコア(独自算出の注目度): 124.50550604020684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the promising performance of current video segmentation models on existing benchmarks, these models still struggle with complex scenes. In this paper, we introduce the 6th Large-scale Video Object Segmentation (LSVOS) challenge in conjunction with ECCV 2024 workshop. This year's challenge includes two tasks: Video Object Segmentation (VOS) and Referring Video Object Segmentation (RVOS). In this year, we replace the classic YouTube-VOS and YouTube-RVOS benchmark with latest datasets MOSE, LVOS, and MeViS to assess VOS under more challenging complex environments. This year's challenge attracted 129 registered teams from more than 20 institutes across over 8 countries. This report include the challenge and dataset introduction, and the methods used by top 7 teams in two tracks. More details can be found in our homepage https://lsvos.github.io/.
- Abstract(参考訳): 既存のベンチマークで現在のビデオセグメンテーションモデルの性能が期待できるにもかかわらず、これらのモデルは複雑なシーンに苦戦している。
本稿では,第6回大規模ビデオオブジェクトセグメンテーション(LSVOS)チャレンジとECCV 2024ワークショップについて紹介する。
今年の課題には、ビデオオブジェクトセグメンテーション(VOS)とビデオオブジェクトセグメンテーション(RVOS)という2つのタスクが含まれている。
今年は、従来のYouTube-VOSとYouTube-RVOSベンチマークを、最新のデータセットMOSE、LVOS、MeViSに置き換えて、より困難な複雑な環境下でVOSを評価する。
今年の挑戦は、8か国以上の20以上の機関から129の登録チームが集まった。
このレポートには、チャレンジとデータセットの導入、トップ7チームが使用する方法の2つのトラックが含まれている。
詳細はホームページ https://lsvos.github.io/ で確認できます。
関連論文リスト
- E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding [57.630136434038384]
E.T. Bench (Event-Level & Time-Sensitive Video Understanding Benchmark)は、イベントレベルのオープンな理解のための大規模ベンチマークである。
ベンチマークでは,8つの画像-LLMと12個のビデオ-LLMを広範囲に評価し,その結果から,粗い(ビデオレベル)理解のための最先端モデルが,きめ細かなタスクの解決に苦慮していることが判明した。
私たちのシンプルだが効果的なソリューションは、複数のシナリオで優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2024-09-26T17:53:04Z) - CSS-Segment: 2nd Place Report of LSVOS Challenge VOS Track [35.70400178294299]
第6回 LSVOS Challenge VOS Track at ECCV 2024 において,ビデオオブジェクトセグメンテーションのためのチーム "yuanjie" のソリューションを紹介した。
提案したCSS-Segmentは、複雑なオブジェクトの動きや長期的なプレゼンテーションのビデオにおいて、より優れたパフォーマンスが期待できる。
第6回 LSVOS Challenge VOS Track at ECCV 2024 で第2位にランクインした。
論文 参考訳(メタデータ) (2024-08-24T13:47:56Z) - PVUW 2024 Challenge on Complex Video Understanding: Methods and Results [199.5593316907284]
我々は、MOSEデータセットに基づく複合ビデオオブジェクトトラックと、MeViSデータセットに基づくモーション表現ガイドビデオトラックの2つの新しいトラックを追加した。
2つの新しいトラックでは、挑戦的な要素を特徴とする追加のビデオとアノテーションを提供しています。
これらの新しいビデオ、文、アノテーションにより、より包括的で堅牢なビデオシーン理解の開発を促進することができる。
論文 参考訳(メタデータ) (2024-06-24T17:38:58Z) - 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.50620771207329]
ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文 参考訳(メタデータ) (2024-06-11T08:05:26Z) - MOSE: A New Dataset for Video Object Segmentation in Complex Scenes [106.64327718262764]
ビデオオブジェクトセグメンテーション(VOS)は、ビデオクリップシーケンス全体を通して特定のオブジェクトをセグメンテーションすることを目的としている。
最先端のVOSメソッドは、既存のデータセット上で優れたパフォーマンス(例えば、90%以上のJ&F)を達成した。
我々は、複雑な環境でのトラッキングとセグメンテーションを研究するために、coMplex video Object SEgmentation (MOSE)と呼ばれる新しいVOSデータセットを収集する。
論文 参考訳(メタデータ) (2023-02-03T17:20:03Z) - 5th Place Solution for YouTube-VOS Challenge 2022: Video Object
Segmentation [4.004851693068654]
ビデオオブジェクトセグメンテーション(VOS)は、ディープラーニングの台頭とともに大きな進歩を遂げた。
類似の物体は容易に混同され、小さな物体を見つけるのが困難である。
本稿では,この課題に対する単純かつ効果的な解決法を提案する。
論文 参考訳(メタデータ) (2022-06-20T06:14:27Z) - Occluded Video Instance Segmentation: Dataset and ICCV 2021 Challenge [133.80567761430584]
我々はOVISと呼ばれる大規模データセットを収集し、隠されたシナリオでビデオインスタンスのセグメンテーションを行う。
OVISは296kの高品質のインスタンスマスクと901の隠蔽シーンで構成されている。
全てのベースライン法は、強吸収対象群で約80%の性能低下に遭遇する。
論文 参考訳(メタデータ) (2021-11-15T17:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。