論文の概要: Delving into the Cyclic Mechanism in Semi-supervised Video Object
Segmentation
- arxiv url: http://arxiv.org/abs/2010.12176v1
- Date: Fri, 23 Oct 2020 05:40:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:11:14.689869
- Title: Delving into the Cyclic Mechanism in Semi-supervised Video Object
Segmentation
- Title(参考訳): 半教師付きビデオオブジェクトセグメンテーションにおける循環機構の解明
- Authors: Yuxi Li, Ning Xu, Jinlong Peng, John See, Weiyao Lin
- Abstract要約: 循環機構は、より堅牢な表現を生成するために、標準的な半教師付きプロセスに組み込まれる。
オフラインパイプラインをオンライン手法に拡張する単純な勾配補正モジュールを導入する。
最後に、勾配補正に基づくサイクル有効受容場(サイクルERF)を開発し、対象分野の関心領域を解析するための新たな視点を提供する。
- 参考スコア(独自算出の注目度): 37.3336313567187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address several inadequacies of current video object
segmentation pipelines. Firstly, a cyclic mechanism is incorporated to the
standard semi-supervised process to produce more robust representations. By
relying on the accurate reference mask in the starting frame, we show that the
error propagation problem can be mitigated. Next, we introduce a simple
gradient correction module, which extends the offline pipeline to an online
method while maintaining the efficiency of the former. Finally we develop cycle
effective receptive field (cycle-ERF) based on gradient correction to provide a
new perspective into analyzing object-specific regions of interests. We conduct
comprehensive experiments on challenging benchmarks of DAVIS17 and Youtube-VOS,
demonstrating that the cyclic mechanism is beneficial to segmentation quality.
- Abstract(参考訳): 本稿では,現在のビデオオブジェクトセグメンテーションパイプラインの不確かさに対処する。
まず、循環機構を標準的な半教師付きプロセスに組み込んでより堅牢な表現を生成する。
開始フレームの正確な参照マスクを頼りにすることで,誤差伝播問題を緩和できることを示す。
次に、オフラインパイプラインをオンラインメソッドに拡張し、前者の効率性を維持しながら、簡単な勾配補正モジュールを導入する。
最後に,傾斜補正に基づくサイクル有効受容場(cycle-erf)を開発し,対象特定対象領域の分析における新たな視点を提供する。
DAVIS17とYoutube-VOSのベンチマークの総合的な実験を行い、循環機構がセグメンテーション品質に有用であることを実証した。
関連論文リスト
- Improving Weakly-supervised Video Instance Segmentation by Leveraging Spatio-temporal Consistency [9.115508086522887]
我々はEigen VISと呼ばれる弱い教師付き手法を導入し、他のVIS手法と比較して競争精度を向上する。
この方法は、時間固有値損失(TEL)とクリップレベルの品質コ効率(QCC)の2つの重要なイノベーションに基づいている。
コードはhttps://github.com/farnooshar/EigenVIS.comで公開されている。
論文 参考訳(メタデータ) (2024-08-29T16:05:05Z) - Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Betrayed by Attention: A Simple yet Effective Approach for Self-supervised Video Object Segmentation [76.68301884987348]
自己教師型ビデオオブジェクトセグメンテーション(VOS)のための簡易かつ効果的なアプローチを提案する。
我々の重要な洞察は、DINO-pretrained Transformerに存在する構造的依存関係を利用して、ビデオ内の堅牢な時間分割対応を確立することである。
提案手法は,複数の教師なしVOSベンチマークにまたがる最先端性能を実証し,複雑な実世界のマルチオブジェクトビデオセグメンテーションタスクに優れることを示す。
論文 参考訳(メタデータ) (2023-11-29T18:47:17Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - FODVid: Flow-guided Object Discovery in Videos [12.792602427704395]
我々は、個々の複雑さに過度に適合しないように、一般化可能なソリューションを構築することに注力する。
教師なしの環境でビデオオブジェクト(VOS)を解決するために,セグメント出力の導出に基づく新しいパイプライン(FODVid)を提案する。
論文 参考訳(メタデータ) (2023-07-10T07:55:42Z) - Exploring the Semi-supervised Video Object Segmentation Problem from a
Cyclic Perspective [36.4057004419079]
本稿では,半教師付きビデオオブジェクトセグメンテーション問題を循環ワークフローに配置する。
標準的な逐次フローに組み込まれた循環機構は、ピクセルワイド対応のより一貫性のある表現を実現できることを示す。
また、勾配補正プロセスに基づくサイクル有効受容場(サイクルERF)を開発し、対象分野の関心領域を解析するための新たな視点を提供する。
論文 参考訳(メタデータ) (2021-11-02T01:50:23Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z) - Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation [93.83369981759996]
本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,完全教師付きセマンティックセグメンテーションにおいて,同値が暗黙の制約であることを示す。
本稿では,ネットワーク学習のための自己スーパービジョンを提供するために,様々な変換画像から予測されたCAMの整合性正則化を提案する。
論文 参考訳(メタデータ) (2020-04-09T14:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。