論文の概要: LSVOS 2025 Challenge Report: Recent Advances in Complex Video Object Segmentation
- arxiv url: http://arxiv.org/abs/2510.11063v1
- Date: Mon, 13 Oct 2025 07:02:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.231481
- Title: LSVOS 2025 Challenge Report: Recent Advances in Complex Video Object Segmentation
- Title(参考訳): LSVOS 2025 Challenge Report: recent Advances in Complex Video Object Segmentation
- Authors: Chang Liu, Henghui Ding, Kaining Ying, Lingyi Hong, Ning Xu, Linjie Yang, Yuchen Fan, Mingqi Gao, Jingkun Chen, Yunqi Miao, Gengshen Wu, Zhijin Qin, Jungong Han, Zhixiong Zhang, Shuangrui Ding, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Jiaqi Wang, Chang Soo Lim, Joonyoung Moon, Donghyeon Cho, Tingmin Li, Yixuan Li, Yang Yang, An Yan, Leilei Cao, Feng Lu, Ran Hong, Youhai Jiang, Fengjie Zhu, Yujie Xie, Hongyang Zhang, Zhihui Liu, Shihai Ruan, Quanzhu Niu, Dengxian Gong, Shihao Chen, Tao Zhang, Yikang Zhou, Haobo Yuan, Lu Qi, Xiangtai Li, Shunping Ji, Ran Hong, Feng Lu, Leilei Cao, An Yan, Alexey Nekrasov, Ali Athar, Daan de Geus, Alexander Hermans, Bastian Leibe,
- Abstract要約: 本報告では,ICCV 2025とともに開催された第7回大規模ビデオオブジェクト(LSVOS)チャレンジの概要について述べる。
2025年版は新たに導入されたコンプレックスVOS (MOSEv2) が特徴である。
データセットとプロトコルを要約し、トップパフォーマンスのソリューションを強調し、新興トレンドを抽出します。
- 参考スコア(独自算出の注目度): 186.14566815158506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This report presents an overview of the 7th Large-scale Video Object Segmentation (LSVOS) Challenge held in conjunction with ICCV 2025. Besides the two traditional tracks of LSVOS that jointly target robustness in realistic video scenarios: Classic VOS (VOS), and Referring VOS (RVOS), the 2025 edition features a newly introduced track, Complex VOS (MOSEv2). Building upon prior insights, MOSEv2 substantially increases difficulty, introducing more challenging but realistic scenarios including denser small objects, frequent disappear/reappear events, severe occlusions, adverse weather and lighting, etc., pushing long-term consistency and generalization beyond curated benchmarks. The challenge retains standard ${J}$, $F$, and ${J\&F}$ metrics for VOS and RVOS, while MOSEv2 adopts ${J\&\dot{F}}$ as the primary ranking metric to better evaluate objects across scales and disappearance cases. We summarize datasets and protocols, highlight top-performing solutions, and distill emerging trends, such as the growing role of LLM/MLLM components and memory-aware propagation, aiming to chart future directions for resilient, language-aware video segmentation in the wild.
- Abstract(参考訳): 本報告では,ICCV 2025とともに開催された第7回大規模ビデオオブジェクトセグメンテーション(LSVOS)チャレンジの概要について述べる。
クラシックVOS(VOS)とリリファレンスVOS(RVOS)の2つの伝統的なトラックに加えて、2025エディションは新しく導入されたコンプレックスVOS(MOSEv2)が特徴である。
事前の洞察に基づいて、MOSEv2は、より困難だが現実的なシナリオを導入し、より密集した小さなオブジェクト、頻繁な消失/再来イベント、厳しい閉塞、悪天候と照明などを導入し、長期的な一貫性と、キュレートされたベンチマークを超えて一般化を推進した。
この課題は、標準の${J}$、$F$、${J\&F}$をVOSとRVOSのメトリクスとして保持し、MOSEv2は${J\&\dot{F}}$を、スケールや消失ケースのオブジェクトをよりよく評価するための主要なランキング指標として採用している。
我々は、データセットとプロトコルを要約し、トップパフォーマンスのソリューションを強調し、LLM/MLLMコンポーネントの役割の増大やメモリ対応の伝播といった新興トレンドを抽出し、野生における弾力性のある言語対応ビデオセグメンテーションの今後の方向性をグラフ化することを目的としている。
関連論文リスト
- The 1st Solution for MOSEv1 Challenge on LSVOS 2025: CGFSeg [19.13013862040698]
Video Object(VOS)は、ビデオシーケンス全体にわたって特定のオブジェクトを追跡し、セグメンテーションすることを目的としている。
本稿では,MOSEv1チャレンジにおけるVOSタスクに対する信頼性誘導核融合抽出法(CGFSeg)を提案する。
LSVOS 2025のMOSEv1チャレンジでは,テストセットで86.37%のJ&Fスコアを達成した。
論文 参考訳(メタデータ) (2025-09-30T03:50:56Z) - 2nd Place Report of MOSEv2 Challenge 2025: Concept Guided Video Object Segmentation via SeC [46.76209037655681]
セミ教師付きビデオオブジェクトは、指定されたターゲットを1フレームのマスクでビデオシーケンスを通してセグメントすることを目的としている。
SeCフレームワークはより永続的なセグメンテーションのためにオブジェクトの深いセマンティック理解を確立した。
SeCはテストセットで39.7 JFnを獲得し、第7回大規模ビデオオブジェクトチャレンジの複合VOSトラックで2位にランクインした。
論文 参考訳(メタデータ) (2025-09-28T12:26:03Z) - The 1st Solution for MOSEv2 Challenge 2025: Long-term and Concept-aware Video Segmentation via SeC [59.53390730730018]
ソリューションはテストセットで39.89%のJFスコアを獲得し、LSVOSチャレンジのMOSEv2トラックで1位となった。
論文 参考訳(メタデータ) (2025-09-23T15:58:13Z) - SAMSON: 3rd Place Solution of LSVOS 2025 VOS Challenge [9.131199997701282]
大規模なビデオオブジェクトモジュール(LSVOS)は、長いビデオシーケンスにおけるオブジェクトの正確な追跡とセグメンテーションという課題に対処する。
テストセットリーダーボードにおけるJ&Fの最終的な性能は0.8427であった。
論文 参考訳(メタデータ) (2025-09-22T08:30:34Z) - MOSEv2: A More Challenging Dataset for Video Object Segmentation in Complex Scenes [131.45528437023643]
ビデオオブジェクトセグメンテーション(VOS)は、ビデオ全体を通して特定のターゲットオブジェクトをセグメンテーションすることを目的としている。
このギャップを埋めるために、複雑なシーンでのVOS研究を促進するために、coMplex video Object SEgmentationデータセットが導入された。
このMOSEv2は,実環境下でのVOS手法をさらに発展させるために設計された,はるかに難しいデータセットである。
論文 参考訳(メタデータ) (2025-08-07T17:59:27Z) - Discriminative Spatial-Semantic VOS Solution: 1st Place Solution for 6th LSVOS [68.47681139026666]
ビデオオブジェクトセグメンテーション(VOS)はコンピュータビジョンにおいて重要な課題である。
現在のVOS法は複雑なシーンと長い物体の動きに苦しむ。
本報告では,空間時空間VOSモデルについて述べる。
論文 参考訳(メタデータ) (2024-08-29T10:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。