論文の概要: SiamPolar: Semi-supervised Realtime Video Object Segmentation with Polar
Representation
- arxiv url: http://arxiv.org/abs/2110.14773v1
- Date: Wed, 27 Oct 2021 21:10:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 15:28:09.597258
- Title: SiamPolar: Semi-supervised Realtime Video Object Segmentation with Polar
Representation
- Title(参考訳): SiamPolar:極性表現による半教師付きリアルタイムビデオオブジェクトセグメンテーション
- Authors: Yaochen Li, Yuhui Hong, Yonghong Song, Chao Zhu, Ying Zhang, Ruihao
Wang
- Abstract要約: そこで我々は,新しい極性表現を用いたシームズネットワークに基づく半教師付きリアルタイム手法を提案する。
極性表現は、微妙な精度の損失でマスクを符号化するためのパラメータを減らすことができる。
また、異なる空間スケールから特徴を抽出するために、非対称シャイムネットワークも開発されている。
- 参考スコア(独自算出の注目度): 6.108508667949229
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Video object segmentation (VOS) is an essential part of autonomous vehicle
navigation. The real-time speed is very important for the autonomous vehicle
algorithms along with the accuracy metric. In this paper, we propose a
semi-supervised real-time method based on the Siamese network using a new polar
representation. The input of bounding boxes is initialized rather than the
object masks, which are applied to the video object detection tasks. The polar
representation could reduce the parameters for encoding masks with subtle
accuracy loss so that the algorithm speed can be improved significantly. An
asymmetric siamese network is also developed to extract the features from
different spatial scales. Moreover, the peeling convolution is proposed to
reduce the antagonism among the branches of the polar head. The repeated
cross-correlation and semi-FPN are designed based on this idea. The
experimental results on the DAVIS-2016 dataset and other public datasets
demonstrate the effectiveness of the proposed method.
- Abstract(参考訳): ビデオオブジェクトセグメンテーション(vos)は自動運転車のナビゲーションの重要な部分である。
リアルタイムの速度は、自動運転車のアルゴリズムと精度指標にとって非常に重要である。
本稿では,新たな極性表現を用いたsiameseネットワークに基づく半教師付きリアルタイム手法を提案する。
境界ボックスの入力はオブジェクトマスクではなく初期化され、ビデオオブジェクト検出タスクに適用される。
極性表現はマスクの符号化パラメータを微妙な精度の損失で減少させ、アルゴリズムの速度を大幅に向上させることができる。
異なる空間スケールから特徴を抽出するために、非対称なシャムネットワークも開発されている。
さらに, 極性頭部の枝間の対角性を低減するために, 剥離畳み込みを提案する。
相互相関と半FPNは、この考えに基づいて設計されている。
DAVIS-2016データセットや他の公開データセットに対する実験結果から,提案手法の有効性が示された。
関連論文リスト
- SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - Adaptive occlusion sensitivity analysis for visually explaining video
recognition networks [12.75077781554099]
咬合感度分析は、単一画像分類の分析に一般的に用いられる。
本稿では,映像認識ネットワークの意思決定過程を視覚的に説明するための手法を提案する。
論文 参考訳(メタデータ) (2022-07-26T12:42:51Z) - Cross-Camera Trajectories Help Person Retrieval in a Camera Network [124.65912458467643]
既存の手法では、純粋な視覚的マッチングや時間的制約を考慮することが多いが、カメラネットワークの空間情報は無視する。
本稿では,時間的情報と空間的情報を統合したクロスカメラ生成に基づく歩行者検索フレームワークを提案する。
本手法の有効性を検証するため,最初のカメラ横断歩行者軌跡データセットを構築した。
論文 参考訳(メタデータ) (2022-04-27T13:10:48Z) - RealNet: Combining Optimized Object Detection with Information Fusion
Depth Estimation Co-Design Method on IoT [2.9275056713717285]
本稿では,モデル流線形認識アルゴリズム,深度推定アルゴリズム,情報融合を組み合わせた共同設計手法を提案する。
本稿では,リアルタイム要求の高いモバイルプラットフォームに適した手法を提案する。
論文 参考訳(メタデータ) (2022-04-24T08:35:55Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - VideoPose: Estimating 6D object pose from videos [14.210010379733017]
我々は、畳み込みニューラルネットワークを用いて、ビデオから直接オブジェクトのポーズを推定する、単純だが効果的なアルゴリズムを導入する。
提案するネットワークは、トレーニング済みの2Dオブジェクト検出器を入力として、リカレントニューラルネットワークを介して視覚的特徴を集約し、各フレームで予測を行う。
YCB-Videoデータセットの実験的評価から,本手法は最先端のアルゴリズムと同等であることがわかった。
論文 参考訳(メタデータ) (2021-11-20T20:57:45Z) - Single Object Tracking through a Fast and Effective Single-Multiple
Model Convolutional Neural Network [0.0]
最近の最先端の(SOTA)アプローチは、エリア内の他のオブジェクトとターゲットを区別するために重い構造を持つマッチングネットワークを取ることに基づいて提案されています。
本稿では,これまでのアプローチとは対照的に,一つのショットで物体の位置を識別できる特殊なアーキテクチャを提案する。
提示されたトラッカーは、1080tiで最大120 fps$の超高速で、挑戦的な状況でsomaと比較してパフォーマンスする。
論文 参考訳(メタデータ) (2021-03-28T11:02:14Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Fast Single-shot Ship Instance Segmentation Based on Polar Template Mask
in Remote Sensing Images [7.45725819658858]
本稿では,概念的にシンプルで簡単な単一ショット畳み込みニューラルネットワーク構造を提案する。
SSS-Netと呼ばれる本手法は,対象物の中心の位置に基づいて対象物を検出する。
Airbus Ship Detection ChallengeデータセットとISAIDshipsデータセットの両方の実験によると、SSS-Netは、船のインスタンスセグメンテーションの精度と速度において、強力な競争力を持っている。
論文 参考訳(メタデータ) (2020-08-28T02:38:04Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。