論文の概要: Boosting Box-supervised Instance Segmentation with Pseudo Depth
- arxiv url: http://arxiv.org/abs/2403.01214v1
- Date: Sat, 2 Mar 2024 14:05:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:37:13.889336
- Title: Boosting Box-supervised Instance Segmentation with Pseudo Depth
- Title(参考訳): Pseudo Depthによるボックス管理インスタンスセグメンテーションの強化
- Authors: Xinyi Yu, Ling Yan, Pengtao Jiang, Hao Chen, Bo Li, Lin Yuanbo Wu,
Linlin Ou
- Abstract要約: インスタンスセグメンテーションネットワークのトレーニングプロセスに擬似深度マップを導入する。
これらの擬似深度マップは、容易に利用可能な深度予測器を用いて生成される。
マスク予測時にネットワークが深度特徴を識別できるようにするため,奥行き予測層をマスク予測ヘッドに統合する。
- 参考スコア(独自算出の注目度): 12.223399760453585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The realm of Weakly Supervised Instance Segmentation (WSIS) under box
supervision has garnered substantial attention, showcasing remarkable
advancements in recent years. However, the limitations of box supervision
become apparent in its inability to furnish effective information for
distinguishing foreground from background within the specified target box. This
research addresses this challenge by introducing pseudo-depth maps into the
training process of the instance segmentation network, thereby boosting its
performance by capturing depth differences between instances. These
pseudo-depth maps are generated using a readily available depth predictor and
are not necessary during the inference stage. To enable the network to discern
depth features when predicting masks, we integrate a depth prediction layer
into the mask prediction head. This innovative approach empowers the network to
simultaneously predict masks and depth, enhancing its ability to capture
nuanced depth-related information during the instance segmentation process. We
further utilize the mask generated in the training process as supervision to
distinguish the foreground from the background. When selecting the best mask
for each box through the Hungarian algorithm, we use depth consistency as one
calculation cost item. The proposed method achieves significant improvements on
Cityscapes and COCO dataset.
- Abstract(参考訳): ボックス管理下のWSIS(Weakly Supervised Instance Segmentation)の領域は、近年顕著な進歩を見せている。
しかし,ボックス管理の限界は,特定のターゲットボックス内の背景から前景を識別する効果的な情報を提供することができないことにある。
本研究では,インスタンスセグメンテーションネットワークのトレーニングプロセスに擬似深層マップを導入することで,インスタンス間の深層差を捉えることにより,その性能向上を図る。
これらの擬似深度マップは、容易に利用可能な深度予測器を用いて生成され、推論段階では不要である。
マスク予測時にネットワークが深度特徴を識別できるようにするため,奥行き予測層をマスク予測ヘッドに統合する。
この革新的なアプローチにより、ネットワークはマスクと深さを同時に予測し、インスタンスセグメンテーションプロセス中にニュアンスドの深さ関連情報をキャプチャする能力を高めることができる。
さらに,前景と背景を区別するために,トレーニングプロセスで生成したマスクを監督として活用する。
ハンガリーのアルゴリズムで各箱のベストマスクを選択する際、深さ一貫性を1つの計算コスト項目として用いる。
提案手法はCityscapesとCOCOデータセットを大幅に改善する。
関連論文リスト
- GAM-Depth: Self-Supervised Indoor Depth Estimation Leveraging a
Gradient-Aware Mask and Semantic Constraints [12.426365333096264]
本稿では,勾配認識マスクと意味制約という,2つの新しいコンポーネントをベースとしたGAM-Depthを提案する。
グラデーション対応マスクは、キー領域とテクスチャレス領域の両方の適応的かつ堅牢な監視を可能にする。
室内における自己監督深度推定のセマンティック制約の導入は、物体の境界における深度差を改善する。
論文 参考訳(メタデータ) (2024-02-22T07:53:34Z) - VA-DepthNet: A Variational Approach to Single Image Depth Prediction [163.14849753700682]
VA-DepthNetは、単一画像深度予測問題に対する単純で効果的で正確なディープニューラルネットワークアプローチである。
本論文は,複数のベンチマークデータセットに対する広範囲な評価とアブレーション解析により提案手法の有用性を実証する。
論文 参考訳(メタデータ) (2023-02-13T17:55:58Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmentation [41.85216306978024]
深度認識型パノプティックセグメンテーション(DPS)のための統合フレームワークを提案する。
インスタンス固有のカーネルを生成し、各インスタンスの深さとセグメンテーションマスクを予測する。
我々は,新たな深度損失による深度学習の監視を支援するために,インスタンスレベルの深度手がかりを追加する。
論文 参考訳(メタデータ) (2022-06-01T13:00:49Z) - What You See is What You Classify: Black Box Attributions [61.998683569022006]
我々は、トレーニング済みのブラックボックス分類器であるExpplanandumの属性を予測するために、ディープネットワークであるExplainerを訓練する。
既存のほとんどのアプローチとは異なり、我々の手法はクラス固有のマスクを直接生成することができる。
我々の属性は、視覚的および定量的に確立された方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-23T12:30:04Z) - X-Distill: Improving Self-Supervised Monocular Depth via Cross-Task
Distillation [69.9604394044652]
そこで本研究では,クロスタスク知識蒸留による単眼深度の自己指導的訓練を改善する手法を提案する。
トレーニングでは,事前訓練されたセマンティックセグメンテーション教師ネットワークを使用し,そのセマンティック知識を深度ネットワークに転送する。
提案手法の有効性をKITTIベンチマークで評価し,最新技術と比較した。
論文 参考訳(メタデータ) (2021-10-24T19:47:14Z) - DVMN: Dense Validity Mask Network for Depth Completion [0.0]
スパース深度マップから高密度かつ有効な情報を集めることに焦点を当てたガイド付き畳み込みニューラルネットワークを開発した。
我々は,KITTI深度補完ベンチマークを用いてDense Validity Mask Network (DVMN) を評価し,その結果を報告する。
論文 参考訳(メタデータ) (2021-07-14T13:57:44Z) - Domain Adaptive Semantic Segmentation with Self-Supervised Depth
Estimation [84.34227665232281]
セマンティックセグメンテーションのためのドメイン適応は、ソースとターゲットドメイン間の分散シフトの存在下でモデルのパフォーマンスを向上させることを目的とする。
ドメイン間のギャップを埋めるために、両ドメインで利用可能な自己教師付き深さ推定からのガイダンスを活用します。
提案手法のベンチマークタスクSYNTHIA-to-CityscapesとGTA-to-Cityscapesの有効性を実証する。
論文 参考訳(メタデータ) (2021-04-28T07:47:36Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - Semantic-Guided Representation Enhancement for Self-supervised Monocular
Trained Depth Estimation [39.845944724079814]
自己教師付き深度推定は,画像列のみを入力として,高品質の深度マップを作成する上で大きな効果を示した。
しかし、その性能は通常、限界深度表現能力のために境界領域や細い構造を持つ物体を推定する際に低下する。
局所的および大域的な深度特徴表現を促進する意味誘導深度表現拡張法を提案する。
論文 参考訳(メタデータ) (2020-12-15T02:24:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。