論文の概要: MPASNET: Motion Prior-Aware Siamese Network for Unsupervised Deep Crowd
Segmentation in Video Scenes
- arxiv url: http://arxiv.org/abs/2101.08609v1
- Date: Thu, 21 Jan 2021 13:55:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 08:02:30.882077
- Title: MPASNET: Motion Prior-Aware Siamese Network for Unsupervised Deep Crowd
Segmentation in Video Scenes
- Title(参考訳): MPASNET:ビデオシーンにおける非教師なしディープ・クラウド・セグメンテーションのためのモーション・プレア・アウェア・シームズ・ネットワーク
- Authors: Jinhai Yang, Hua Yang
- Abstract要約: クラウドセマンティックセグメンテーションのためのMotion Prior-Aware Siamese Network (MPASNET)を提案する。
まず,フレーム間のコヒーレントな動きパターンを分析し,集合粒子に円形領域マージ戦略を適用し,擬似ラベルを生成する。
私達のモデルはmIoUの点では先端を12%以上上回ります。
- 参考スコア(独自算出の注目度): 4.320516092029466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd segmentation is a fundamental task serving as the basis of crowded
scene analysis, and it is highly desirable to obtain refined pixel-level
segmentation maps. However, it remains a challenging problem, as existing
approaches either require dense pixel-level annotations to train deep learning
models or merely produce rough segmentation maps from optical or particle flows
with physical models. In this paper, we propose the Motion Prior-Aware Siamese
Network (MPASNET) for unsupervised crowd semantic segmentation. This model not
only eliminates the need for annotation but also yields high-quality
segmentation maps. Specially, we first analyze the coherent motion patterns
across the frames and then apply a circular region merging strategy on the
collective particles to generate pseudo-labels. Moreover, we equip MPASNET with
siamese branches for augmentation-invariant regularization and siamese feature
aggregation. Experiments over benchmark datasets indicate that our model
outperforms the state-of-the-arts by more than 12% in terms of mIoU.
- Abstract(参考訳): 群集のセグメンテーションは,混雑したシーン解析の基礎となる基本課題であり,精巧なピクセルレベルのセグメンテーションマップを得るのが望ましい。
しかし、既存のアプローチでは、深層学習モデルのトレーニングに高密度なピクセルレベルのアノテーションを必要とするか、光学系や粒子流から物理的モデルで粗いセグメンテーションマップを作成するだけでよいため、依然として難しい問題である。
本稿では,クラウドセマンティックセマンティックセグメンテーションのためのMotion Prior-Aware Siamese Network (MPASNET)を提案する。
このモデルはアノテーションの必要性をなくすだけでなく、高品質のセグメンテーションマップをもたらす。
特に,まずフレーム間のコヒーレント運動パターンを解析し,その後,集合粒子に円形領域マージ戦略を適用して擬似ラベルを生成する。
さらに, mpasnet と siamese branch を組み合わせることで, 拡張不変正規化と siamese feature aggregate を実現する。
ベンチマークデータセットによる実験から、我々のモデルはmIoUで12%以上性能が向上していることが示された。
関連論文リスト
- Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Instance Segmentation of Unlabeled Modalities via Cyclic Segmentation
GAN [27.936725483892076]
本稿では,画像翻訳とインスタンスセグメンテーションを共同で行うCysic Generative Adrial Network(CySGAN)を提案する。
注記電子顕微鏡(en:Annotated electron microscopy, EM)画像とラベルなし拡張顕微鏡(en:Unlabeled expansion microscopy, ExM)データを用いて, ニューロンの3次元セグメンテーションの課題についてベンチマークを行った。
論文 参考訳(メタデータ) (2022-04-06T20:46:39Z) - Weakly Supervised Instance Segmentation using Motion Information via
Optical Flow [3.0763099528432263]
画像と光の流れから抽出した外観と運動の特徴を利用する2ストリームエンコーダを提案する。
提案手法は,最先端手法の平均精度を3.1倍に向上することを示した。
論文 参考訳(メタデータ) (2022-02-25T22:41:54Z) - The Emergence of Objectness: Learning Zero-Shot Segmentation from Videos [59.12750806239545]
動画は移動成分によって同じシーンを異なる視点で見ることができ、適切な領域分割と領域フローは相互のビュー合成を可能にする。
モデルでは,1枚の画像に対して特徴に基づく領域分割を出力する出現経路と,1枚の画像に対して動作特徴を出力する動き経路の2つの経路から開始する。
セグメントフローに基づく視線合成誤差を最小限に抑えるためにモデルを訓練することにより、我々の外観経路と運動経路は、それぞれ低レベルのエッジや光フローから構築することなく、領域のセグメンテーションとフロー推定を自動的に学習する。
論文 参考訳(メタデータ) (2021-11-11T18:59:11Z) - Grasp-Oriented Fine-grained Cloth Segmentation without Real Supervision [66.56535902642085]
本稿では, 深度画像のみを用いて, 変形した衣服のきめ細かい領域検出の問題に取り組む。
最大で6つの意味領域を定義し, 首の縁, スリーブカフ, ヘム, 上と下をつかむ点を含む。
これらの部品のセグメント化とラベル付けを行うために,U-net ベースのネットワークを導入する。
合成データのみを用いてネットワークをトレーニングし、提案したDAが実データでトレーニングしたモデルと競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:31:20Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Learning to Associate Every Segment for Video Panoptic Segmentation [123.03617367709303]
粗いセグメントレベルのマッチングと細かなピクセルレベルのマッチングを同時に学習する。
本研究では,Cityscapes-VPSおよびVIPERデータセット上で,フレーム単位の計算モデルにより,最先端の計算結果が得られることを示す。
論文 参考訳(メタデータ) (2021-06-17T13:06:24Z) - Dynamic Dual Sampling Module for Fine-Grained Semantic Segmentation [27.624291416260185]
動的親和性モデリングを行い,意味的コンテキストを局所的な詳細に伝達する動的デュアルサンプリングモジュール(DDSM)を提案する。
City と Camvid のデータセットによる実験結果から,提案手法の有効性と有効性について検証した。
論文 参考訳(メタデータ) (2021-05-25T04:25:47Z) - Spectral Analysis for Semantic Segmentation with Applications on Feature
Truncation and Weak Annotation [18.041862613338544]
クロスエントロピーは主に、CNNの機能と同様に、セグメンテーションマップの低周波成分によって貢献されます。
本研究では,cnnの機能サイズを制限し,関連する高周波成分を除去できる簡易かつ効果的な特徴切り換え手法を提案する。
論文 参考訳(メタデータ) (2020-12-28T07:18:25Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。