論文の概要: The 1st Solution for MOSEv2 Challenge 2025: Long-term and Concept-aware Video Segmentation via SeC
- arxiv url: http://arxiv.org/abs/2509.19183v1
- Date: Tue, 23 Sep 2025 15:58:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.937895
- Title: The 1st Solution for MOSEv2 Challenge 2025: Long-term and Concept-aware Video Segmentation via SeC
- Title(参考訳): 第1回MOSEv2 Challenge 2025:SeCによる長期・概念対応ビデオセグメンテーション
- Authors: Mingqi Gao, Jingkun Chen, Yunqi Miao, Gengshen Wu, Zhijin Qin, Jungong Han,
- Abstract要約: ソリューションはテストセットで39.89%のJFスコアを獲得し、LSVOSチャレンジのMOSEv2トラックで1位となった。
- 参考スコア(独自算出の注目度): 59.53390730730018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This technical report explores the MOSEv2 track of the LSVOS Challenge, which targets complex semi-supervised video object segmentation. By analysing and adapting SeC, an enhanced SAM-2 framework, we conduct a detailed study of its long-term memory and concept-aware memory, showing that long-term memory preserves temporal continuity under occlusion and reappearance, while concept-aware memory supplies semantic priors that suppress distractors; together, these traits directly benefit several MOSEv2's core challenges. Our solution achieves a JF score of 39.89% on the test set, ranking 1st in the MOSEv2 track of the LSVOS Challenge.
- Abstract(参考訳): この技術報告では、複雑な半教師付きビデオオブジェクトセグメンテーションをターゲットとしたLSVOS ChallengeのMOSEv2トラックを探索する。
SAM-2フレームワークであるSeCの分析と適応により、その長期記憶と概念認識メモリの詳細な研究を行い、長期記憶が隠蔽と再出現の下で時間的連続性を保ち、概念認識メモリは障害を抑えるセマンティックな先行情報を提供し、これらの特徴はMOSEv2の中核的課題に直結する。
LSVOS ChallengeのMOSEv2トラック1位で、テストセットで39.89%のJFスコアを達成した。
関連論文リスト
- SAMSON: 3rd Place Solution of LSVOS 2025 VOS Challenge [9.131199997701282]
大規模なビデオオブジェクトモジュール(LSVOS)は、長いビデオシーケンスにおけるオブジェクトの正確な追跡とセグメンテーションという課題に対処する。
テストセットリーダーボードにおけるJ&Fの最終的な性能は0.8427であった。
論文 参考訳(メタデータ) (2025-09-22T08:30:34Z) - Pseudo-Label Enhanced Cascaded Framework: 2nd Technical Report for LSVOS 2025 VOS Track [11.068687286561177]
複雑なビデオオブジェクト(VOS)は、フレーム間でオブジェクトを正確にセグメンテーションする上で重要な課題である。
SAM2 フレームワークに基づく LSVOS 2025 VOS Track のソリューションを提案する。
私たちはMOSEテストセットで0.8616のJ&Fスコア(SAM2Longベースラインで+1.4ポイント)を獲得し、LSVOS 2025 VOSトラックで2位を確保しました。
論文 参考訳(メタデータ) (2025-09-18T12:23:51Z) - MOSEv2: A More Challenging Dataset for Video Object Segmentation in Complex Scenes [131.45528437023643]
ビデオオブジェクトセグメンテーション(VOS)は、ビデオ全体を通して特定のターゲットオブジェクトをセグメンテーションすることを目的としている。
このギャップを埋めるために、複雑なシーンでのVOS研究を促進するために、coMplex video Object SEgmentationデータセットが導入された。
このMOSEv2は,実環境下でのVOS手法をさらに発展させるために設計された,はるかに難しいデータセットである。
論文 参考訳(メタデータ) (2025-08-07T17:59:27Z) - THU-Warwick Submission for EPIC-KITCHEN Challenge 2025: Semi-Supervised Video Object Segmentation [49.54727231738117]
本手法は,SAM2からの大規模視覚前訓練と深度に基づく幾何学的手法を組み合わせて,複雑なシーンと長期追跡を扱う。
VISORテストセットでは、J&Fスコアが90.1%に達する。
論文 参考訳(メタデータ) (2025-06-07T10:33:16Z) - The 2nd Solution for LSVOS Challenge RVOS Track: Spatial-temporal Refinement for Consistent Semantic Segmentation [0.0]
本稿では,参照対象セグメンテーションモデルの時間的一貫性を高める手法を提案する。
提案手法は,ECCV 2024 LSVOS ChallengeにおいてRVOSトラックの最終ランキングで2位となった。
論文 参考訳(メタデータ) (2024-08-22T14:43:02Z) - LSVOS Challenge 3rd Place Report: SAM2 and Cutie based VOS [25.894649323139987]
我々は、これらの課題に対処するために、最先端(SOTA)モデルSAM2とCutieの長所を組み合わせる。
LSVOS チャレンジ VOS トラックの試験段階での J&F スコアは 0.7952 に達し, 総合3位となった。
論文 参考訳(メタデータ) (2024-08-20T00:45:13Z) - 3rd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation [63.199793919573295]
ビデオオブジェクト(VOS)はコンピュータビジョンにおいて重要なタスクであり、ビデオフレーム間の背景から前景オブジェクトを区別することに焦点を当てている。
我々の研究はCutieモデルからインスピレーションを得ており、オブジェクトメモリ、メモリフレームの総数、および入力解像度がセグメンテーション性能に与える影響について検討する。
論文 参考訳(メタデータ) (2024-06-06T00:56:25Z) - Full-Duplex Strategy for Video Object Segmentation [141.43983376262815]
Full- Strategy Network (FSNet)はビデオオブジェクトセグメンテーション(VOS)のための新しいフレームワークである
我々のFSNetは、融合復号ステージの前に、クロスモーダルな機能パス(すなわち、送信と受信)を同時に実行します。
我々のFSNetは、VOSとビデオの有能なオブジェクト検出タスクの両方において、他の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-06T14:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。