論文の概要: Efficient Regional Memory Network for Video Object Segmentation
- arxiv url: http://arxiv.org/abs/2103.12934v1
- Date: Wed, 24 Mar 2021 02:08:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 14:04:46.337617
- Title: Efficient Regional Memory Network for Video Object Segmentation
- Title(参考訳): ビデオオブジェクトセグメンテーションのための効率的な地域メモリネットワーク
- Authors: Haozhe Xie, Hongxun Yao, Shangchen Zhou, Shengping Zhang, Wenxiu Sun
- Abstract要約: 半教師付きVOS(Regional Memory Network, RMNet)のための新しいローカル-ローカルマッチングソリューションを提案する。
提案するrmnetは、メモリとクエリフレームの両方における類似オブジェクトのあいまいさを効果的に緩和する。
実験結果から,提案したRMNetは,DAVISおよびYouTube-VOSデータセットの最先端手法に対して良好に動作することが示された。
- 参考スコア(独自算出の注目度): 56.587541750729045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, several Space-Time Memory based networks have shown that the object
cues (e.g. video frames as well as the segmented object masks) from the past
frames are useful for segmenting objects in the current frame. However, these
methods exploit the information from the memory by global-to-global matching
between the current and past frames, which lead to mismatching to similar
objects and high computational complexity. To address these problems, we
propose a novel local-to-local matching solution for semi-supervised VOS,
namely Regional Memory Network (RMNet). In RMNet, the precise regional memory
is constructed by memorizing local regions where the target objects appear in
the past frames. For the current query frame, the query regions are tracked and
predicted based on the optical flow estimated from the previous frame. The
proposed local-to-local matching effectively alleviates the ambiguity of
similar objects in both memory and query frames, which allows the information
to be passed from the regional memory to the query region efficiently and
effectively. Experimental results indicate that the proposed RMNet performs
favorably against state-of-the-art methods on the DAVIS and YouTube-VOS
datasets.
- Abstract(参考訳): 最近、いくつかの時空メモリベースのネットワークが、オブジェクトのキュー(例)を示している。
従来のフレームからのビデオフレームとセグメンテーションされたオブジェクトマスクは、現在のフレーム内のオブジェクトをセグメンテーションするのに役立ちます。
しかし、これらの手法は、現在のフレームと過去のフレーム間のグローバル・グローバルマッチングによってメモリからの情報を利用するため、類似したオブジェクトとミスマッチし、計算の複雑さが高い。
このような問題に対処するため,我々は,半教師付きVOS(Regional Memory Network (RMNet))のための新しいローカル-ローカルマッチングソリューションを提案する。
rmnetでは、ターゲットオブジェクトが過去のフレームに現れるローカル領域を記憶することにより、正確な地域記憶を構築する。
現在のクエリフレームでは、前フレームから推定した光フローに基づいてクエリ領域を追跡予測する。
提案したローカル-ローカルマッチングは、メモリとクエリフレームの両方において類似したオブジェクトのあいまいさを効果的に軽減し、ローカルメモリからクエリ領域に効率的に情報を渡すことができる。
実験結果から,提案したRMNetは,DAVISおよびYouTube-VOSデータセットの最先端手法に対して良好に動作することが示された。
関連論文リスト
- Local Compressed Video Stream Learning for Generic Event Boundary
Detection [25.37983456118522]
イベント境界検出は、ビデオをチャンクに分割する一般的な分類なしのイベント境界をローカライズすることを目的としている。
既存の方法は、通常、ネットワークに入力する前にビデオフレームをデコードする必要がある。
本稿では,圧縮領域におけるリッチな情報を活用する完全エンドツーエンドのイベント境界検出手法を提案する。
論文 参考訳(メタデータ) (2023-09-27T06:49:40Z) - Region Aware Video Object Segmentation with Deep Motion Modeling [56.95836951559529]
Region Aware Video Object (RAVOS) は、効率的なオブジェクトセグメンテーションとメモリストレージのための関心領域を予測する手法である。
効率的なセグメンテーションのために、ROIに応じてオブジェクトの特徴を抽出し、オブジェクトレベルのセグメンテーションのためにオブジェクトデコーダを設計する。
効率的なメモリ記憶のために,2つのフレーム間のオブジェクトの移動経路内の特徴を記憶することで,冗長なコンテキストをフィルタリングする動作パスメモリを提案する。
論文 参考訳(メタデータ) (2022-07-21T01:44:40Z) - Rethinking Space-Time Networks with Improved Memory Coverage for
Efficient Video Object Segmentation [68.45737688496654]
各オブジェクトのマスク特徴を再エンコードすることなく,フレーム間の直接対応性を確立する。
対応によって、現在のクエリフレーム内の全てのノードは、過去の特徴を連想的に集約することによって推測される。
すべてのメモリノードにコントリビュートする機会があることを検証し、そのような多彩な投票がメモリ効率と推論精度の両方に有益であることを示した。
論文 参考訳(メタデータ) (2021-06-09T16:50:57Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z) - Spatiotemporal Graph Neural Network based Mask Reconstruction for Video
Object Segmentation [70.97625552643493]
本稿では,クラス非依存オブジェクトを半教師あり設定でセグメント化するタスクについて述べる。
提案手法のすべてを利用して局所的なコンテキストを捕捉する新しいグラフニューラルネットワーク(TG-Net)を提案する。
論文 参考訳(メタデータ) (2020-12-10T07:57:44Z) - Video Object Segmentation with Episodic Graph Memory Networks [198.74780033475724]
セグメント化モデルを更新する学習」という新しいアイデアに対処するために,グラフメモリネットワークが開発された。
我々は、完全に連結されたグラフとして構成されたエピソードメモリネットワークを利用して、フレームをノードとして保存し、エッジによってフレーム間の相関をキャプチャする。
提案したグラフメモリネットワークは、一発とゼロショットの両方のビデオオブジェクトセグメンテーションタスクをうまく一般化できる、巧妙だが原則化されたフレームワークを提供する。
論文 参考訳(メタデータ) (2020-07-14T13:19:19Z) - Dual Temporal Memory Network for Efficient Video Object Segmentation [42.05305410986511]
ビデオオブジェクト(VOS)の基本的な課題の1つは、時間情報を最大限活用してパフォーマンスを向上する方法である。
本稿では,現在のフレームに先行する短・長期のビデオシーケンス情報を時間記憶として格納するエンド・ツー・エンド・ネットワークを提案する。
我々のネットワークは、短期記憶サブネットワークと長期記憶サブネットワークを含む2つの時間的サブネットワークで構成されている。
論文 参考訳(メタデータ) (2020-03-13T06:07:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。