論文の概要: A Weakly Supervised Amodal Segmenter with Boundary Uncertainty
Estimation
- arxiv url: http://arxiv.org/abs/2108.09897v1
- Date: Mon, 23 Aug 2021 02:27:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 23:38:25.724523
- Title: A Weakly Supervised Amodal Segmenter with Boundary Uncertainty
Estimation
- Title(参考訳): 境界不確かさ推定を用いた弱教師付アモーダルセグメンタ
- Authors: Khoi Nguyen, Sinisa Todorovic
- Abstract要約: 本稿では,弱教師付きアモーダルインスタンスセグメンテーションについて述べる。
目標は、可視部分と隠蔽部分の両方をセグメント化することであり、トレーニングは、地平線可視部分(モダル部分)のみを提供する。
- 参考スコア(独自算出の注目度): 35.103437828235826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses weakly supervised amodal instance segmentation, where
the goal is to segment both visible and occluded (amodal) object parts, while
training provides only ground-truth visible (modal) segmentations. Following
prior work, we use data manipulation to generate occlusions in training images
and thus train a segmenter to predict amodal segmentations of the manipulated
data. The resulting predictions on training images are taken as the
pseudo-ground truth for the standard training of Mask-RCNN, which we use for
amodal instance segmentation of test images. For generating the pseudo-ground
truth, we specify a new Amodal Segmenter based on Boundary Uncertainty
estimation (ASBU) and make two contributions. First, while prior work uses the
occluder's mask, our ASBU uses the occlusion boundary as input. Second, ASBU
estimates an uncertainty map of the prediction. The estimated uncertainty
regularizes learning such that lower segmentation loss is incurred on regions
with high uncertainty. ASBU achieves significant performance improvement
relative to the state of the art on the COCOA and KINS datasets in three tasks:
amodal instance segmentation, amodal completion, and ordering recovery.
- Abstract(参考訳): 本稿では,弱教師付きアモーダルインスタンスセグメンテーション(amodal instance segmentation)に対処し,可視および遮蔽(amodal)オブジェクトのセグメンテーションと,地対可視(modal)セグメンテーションのみを提供するトレーニングを目標とする。
先行研究の後,訓練画像におけるオクルージョン生成にデータ操作を用い,セグメンタを訓練し,操作されたデータのアモーダルセグメンテーションを予測する。
トレーニング画像の予測結果は,テスト画像のアモーダルなインスタンスセグメンテーションに使用するMask-RCNNの標準トレーニングにおいて,擬似地下真実として捉えられている。
疑似地下真実を生成するために,境界不確実性推定(ASBU)に基づく新しいアモーダルセグメンタを定義し,2つのコントリビューションを行う。
まず、先行作業ではオクルーダーマスクを使用しますが、ASBUではオクルージョン境界を入力として使用しています。
次に、ASBUは予測の不確実性マップを推定する。
推定不確実性は、不確実性の高い領域において低いセグメンテーション損失が発生するように学習を規則化する。
ASBUは,COCOAデータセットとKINSデータセットの3つのタスク – アモーダルインスタンスセグメンテーション,アモーダル補完,オーダリングリカバリ – に関する技術状況に対して,大幅なパフォーマンス向上を実現している。
関連論文リスト
- Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - From Generalization to Precision: Exploring SAM for Tool Segmentation in
Surgical Environments [7.01085327371458]
セグメンテーションモデルでは, 汚損レベルの高い画像が大幅に過大評価され, 性能が低下する。
我々は,最高の単一マスクを予測として選択した場合のSAMの結果を分析するために,接地型ツールマスクを用いている。
本研究では,様々な強みの合成汚損データを用いて,Endovis18とEndovis17の計器セグメンテーションデータセットを解析した。
論文 参考訳(メタデータ) (2024-02-28T01:33:49Z) - Amodal Ground Truth and Completion in the Wild [84.54972153436466]
我々は3Dデータを用いて、実画像中の部分的に隠蔽された物体に対して、真偽のアモーダルマスクを決定するための自動パイプラインを確立する。
このパイプラインは、様々なオブジェクトカテゴリとラベルからなるアモーダル完了評価ベンチマークMP3D-Amodalを構築するために使用される。
論文 参考訳(メタデータ) (2023-12-28T18:59:41Z) - Coarse-to-Fine Amodal Segmentation with Shape Prior [52.38348188589834]
アモーダルオブジェクトセグメンテーション(Amodal object segmentation)は、オブジェクトの可視部分と隠蔽部分の両方をセグメンテーションする、難しいタスクである。
本稿では、アモーダルセグメンテーションを段階的にモデル化することで、この問題に対処する、Coarse-to-Fine: C2F-Segという新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-31T15:56:29Z) - Amodal Intra-class Instance Segmentation: Synthetic Datasets and
Benchmark [17.6780586288079]
本稿では、画像アモーダル完了タスクのための2つの新しいアモーダルデータセットを提案する。
また,アモーダル・インスタンス・セグメンテーションのための事前レイヤを持つ点教師付きスキームを提案する。
実験により、我々の弱教師付きアプローチはSOTAの完全教師付き手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-12T07:28:36Z) - Modeling Multimodal Aleatoric Uncertainty in Segmentation with Mixture
of Stochastic Expert [24.216869988183092]
入力画像にあいまいさが存在する場合、セグメンテーションにおけるデータ独立不確実性(いわゆるアレタリック不確実性)を捉えることに重点を置いている。
本稿では,各専門家ネットワークがアレータティック不確実性の異なるモードを推定する,新しい専門家モデル(MoSE)を提案する。
We developed a Wasserstein-like loss that makes direct minimizes the distribution distance between the MoSE and ground truth annotations。
論文 参考訳(メタデータ) (2022-12-14T16:48:21Z) - Amodal Segmentation Based on Visible Region Segmentation and Shape Prior [43.40655235118393]
本稿では,人間の行動を模倣し,学習の曖昧さを解決する枠組みを提案する。
本モデルでは,可視領域に集中し,記憶に先立つ形状を利用してアモーダルマスクを推定する。
実験の結果,提案モデルが既存の最新手法を上回っていることが示された。
論文 参考訳(メタデータ) (2020-12-10T11:39:09Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z) - Amodal Segmentation through Out-of-Task and Out-of-Distribution
Generalization with a Bayesian Model [19.235173141731885]
アモーダル補完は人間が容易に実行できる視覚的タスクであるが、コンピュータビジョンアルゴリズムでは難しい。
我々は、アモーダルセグメンテーションをout-of-taskおよびout-of-distribution generalization問題として定式化する。
我々のアルゴリズムは、同じ監督方法を使用する代替手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2020-10-25T18:01:26Z) - An Information Bottleneck Approach for Controlling Conciseness in
Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。
我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文 参考訳(メタデータ) (2020-05-01T23:26:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。