Fugu-MT 論文翻訳(概要): Amodal Segmentation Based on Visible Region Segmentation and Shape Prior

論文の概要: Amodal Segmentation Based on Visible Region Segmentation and Shape Prior

arxiv url: http://arxiv.org/abs/2012.05598v2
Date: Sat, 19 Dec 2020 13:24:36 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-15 06:22:56.239633
Title: Amodal Segmentation Based on Visible Region Segmentation and Shape Prior
Title（参考訳）: 可視領域のセグメンテーションと形状を考慮したアモーダルセグメンテーション
Authors: Yuting Xiao, Yanyu Xu, Ziming Zhong, Weixin Luo, Jiawei Li, Shenghua Gao
Abstract要約: 本稿では,人間の行動を模倣し,学習の曖昧さを解決する枠組みを提案する。本モデルでは,可視領域に集中し,記憶に先立つ形状を利用してアモーダルマスクを推定する。実験の結果,提案モデルが既存の最新手法を上回っていることが示された。
参考スコア（独自算出の注目度）: 43.40655235118393
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Almost all existing amodal segmentation methods make the inferences of occluded regions by using features corresponding to the whole image. This is against the human's amodal perception, where human uses the visible part and the shape prior knowledge of the target to infer the occluded region. To mimic the behavior of human and solve the ambiguity in the learning, we propose a framework, it firstly estimates a coarse visible mask and a coarse amodal mask. Then based on the coarse prediction, our model infers the amodal mask by concentrating on the visible region and utilizing the shape prior in the memory. In this way, features corresponding to background and occlusion can be suppressed for amodal mask estimation. Consequently, the amodal mask would not be affected by what the occlusion is given the same visible regions. The leverage of shape prior makes the amodal mask estimation more robust and reasonable. Our proposed model is evaluated on three datasets. Experiments show that our proposed model outperforms existing state-of-the-art methods. The visualization of shape prior indicates that the category-specific feature in the codebook has certain interpretability.
Abstract（参考訳）: 既存のアモダルセグメンテーション手法のほとんど全ては、画像全体に対応する特徴を用いてオクルード領域の推論を行う。これは人間のアモーダル知覚に反し、人間の目に見える部分と、対象の事前の知識を使って、隠された領域を推測する。人間の振る舞いを模倣し,学習の曖昧さを解決するために,まず,粗い目に見えるマスクと粗いアモーダルマスクを推定する枠組みを提案する。そして、粗い予測に基づいて、我々のモデルは、可視領域に集中し、メモリに先行する形状を利用してアモーダルマスクを推定する。これにより、アモーダルマスク推定において、背景と閉塞に対応する特徴を抑えることができる。その結果、アモダルマスクは、オクルージョンが同じ可視領域に与えられるものの影響を受けない。以前の形状の活用により、アモーダルマスクの推定はより堅牢で合理的になる。提案モデルは3つのデータセットで評価される。実験の結果,提案手法は既存手法よりも優れていた。形状の可視化は、コードブックのカテゴリ固有の特徴がある程度解釈可能であることを示している。

関連論文リスト

Amodal Instance Segmentation with Diffusion Shape Prior Estimation [10.064183379778388]
アモーダルインスタンス(AIS)は、画像内のオブジェクトの可視部分と隠蔽部分の両方のセグメンテーション予測を含む興味深い課題を提示する。従来は、アモーダルセグメンテーションを強化するために、トレーニングデータから収集した形状の事前情報に頼っていた。最近の進歩は、潜在空間から画像を生成するために、広範囲なデータセットで事前訓練された条件付き拡散モデルの可能性を強調している。
論文参考訳（メタデータ） (2024-09-26T19:59:12Z)
MaskInversion: Localized Embeddings via Optimization of Explainability Maps [49.50785637749757]
MaskInversionは、テスト時にマスクによって指定されたクエリ画像領域に対するコンテキスト認識の埋め込みを生成する。オープン語彙のクラス検索、表現理解の参照、局所的なキャプションや画像生成など、幅広いタスクに使用することができる。
論文参考訳（メタデータ） (2024-07-29T14:21:07Z)
Sequential Amodal Segmentation via Cumulative Occlusion Learning [15.729212571002906]
視覚系は、物体の可視領域と隠蔽領域の両方を分割できなければならない。本研究では,不確実なカテゴリを持つオブジェクトの逐次アモーダルセグメンテーションを目的とした累積オクルージョン学習を用いた拡散モデルを提案する。このモデルは拡散中の累積マスク戦略を用いて予測を反復的に洗練し、目に見えない領域の不確かさを効果的に捉える。これは、物体間の空間的秩序を解読し、密集した視覚的な場面で隠蔽された物体の完全な輪郭を正確に予測する、アモーダル知覚の人間の能力に類似している。
論文参考訳（メタデータ） (2024-05-09T14:17:26Z)
ShapeFormer: Shape Prior Visible-to-Amodal Transformer-based Amodal Instance Segmentation [11.51684042494713]
ShapeFormerは、可視的からアモーダルな遷移を持つTransformerベースのモデルである。これは出力セグメンテーション間の明示的な関係を促進し、アモーダル-可視遷移の必要性を回避する。 ShapeFormerは3つの主要なモジュールから構成される: 可視性オクルージョンマスクヘッド(Visible-Occluding Mask Head) 隠蔽認識による視認性セグメンテーション(Visible-Occluding Mask Head) および (ii) アモーダルマスクと隠蔽マスク(Occluded masks) および (iii) 形状事前知識を提供するためのカテゴリー特定形状マスクマスクヘッド(Caegory-Specific Shape Pretriever) である。
論文参考訳（メタデータ） (2024-03-18T00:03:48Z)
BLADE: Box-Level Supervised Amodal Segmentation through Directed Expansion [10.57956193654977]
Boxレベルの教師付きアモーダルセグメンテーションは、この課題に対処する。可視マスクから対応するアモーダルマスクへの指向性拡張アプローチを導入することで,新しい解を提案する。このアプローチでは、オーバーラップする領域 – 異なるインスタンスが交わる領域 – に基づいた、ハイブリッドなエンドツーエンドネットワークが関係しています。
論文参考訳（メタデータ） (2024-01-03T09:37:03Z)
Amodal Ground Truth and Completion in the Wild [84.54972153436466]
我々は3Dデータを用いて、実画像中の部分的に隠蔽された物体に対して、真偽のアモーダルマスクを決定するための自動パイプラインを確立する。このパイプラインは、様々なオブジェクトカテゴリとラベルからなるアモーダル完了評価ベンチマークMP3D-Amodalを構築するために使用される。
論文参考訳（メタデータ） (2023-12-28T18:59:41Z)
Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文参考訳（メタデータ） (2023-06-02T17:47:01Z)
Towards Improved Input Masking for Convolutional Neural Networks [66.99060157800403]
層マスキングと呼ぶCNNのための新しいマスキング手法を提案する。本手法は,マスク形状や色がモデル出力に与える影響を排除あるいは最小化することができることを示す。また,マスクの形状がクラスに関する情報を漏洩させる可能性を示し,クラス関連特徴に対するモデル依存度の推定に影響を及ぼすことを示した。
論文参考訳（メタデータ） (2022-11-26T19:31:49Z)
What You See is What You Classify: Black Box Attributions [61.998683569022006]
我々は、トレーニング済みのブラックボックス分類器であるExpplanandumの属性を予測するために、ディープネットワークであるExplainerを訓練する。既存のほとんどのアプローチとは異なり、我々の手法はクラス固有のマスクを直接生成することができる。我々の属性は、視覚的および定量的に確立された方法よりも優れていることを示す。
論文参考訳（メタデータ） (2022-05-23T12:30:04Z)
A Weakly Supervised Amodal Segmenter with Boundary Uncertainty Estimation [35.103437828235826]
本稿では,弱教師付きアモーダルインスタンスセグメンテーションについて述べる。目標は、可視部分と隠蔽部分の両方をセグメント化することであり、トレーニングは、地平線可視部分(モダル部分)のみを提供する。
論文参考訳（メタデータ） (2021-08-23T02:27:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。