論文の概要: Deep Metric Learning for Open World Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2108.04562v1
- Date: Tue, 10 Aug 2021 10:15:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 14:20:36.559738
- Title: Deep Metric Learning for Open World Semantic Segmentation
- Title(参考訳): オープンワールドセマンティックセグメンテーションのためのDeep Metric Learning
- Authors: Jun Cen, Peng Yun, Junhao Cai, Michael Yu Wang, Ming Liu
- Abstract要約: クローズセットセマンティックセグメンテーションネットワークは、オフ・オブ・ディストリビューション(OOD)オブジェクトを検出する能力に制限がある。
2つのモジュールを含むオープンワールドセマンティックセマンティックセマンティクスシステムを提案する。
我々は、オープンセットセマンティックセグメンテーションを実装するために、コントラストクラスタリングを備えたDeep Metric Learning Network(DMLNet)を採用する。
- 参考スコア(独自算出の注目度): 12.617115020561789
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Classical close-set semantic segmentation networks have limited ability to
detect out-of-distribution (OOD) objects, which is important for
safety-critical applications such as autonomous driving. Incrementally learning
these OOD objects with few annotations is an ideal way to enlarge the knowledge
base of the deep learning models. In this paper, we propose an open world
semantic segmentation system that includes two modules: (1) an open-set
semantic segmentation module to detect both in-distribution and OOD objects.
(2) an incremental few-shot learning module to gradually incorporate those OOD
objects into its existing knowledge base. This open world semantic segmentation
system behaves like a human being, which is able to identify OOD objects and
gradually learn them with corresponding supervision. We adopt the Deep Metric
Learning Network (DMLNet) with contrastive clustering to implement open-set
semantic segmentation. Compared to other open-set semantic segmentation
methods, our DMLNet achieves state-of-the-art performance on three challenging
open-set semantic segmentation datasets without using additional data or
generative models. On this basis, two incremental few-shot learning methods are
further proposed to progressively improve the DMLNet with the annotations of
OOD objects.
- Abstract(参考訳): 古典的クローズセットセマンティックセグメンテーションネットワークは、自律運転のような安全クリティカルなアプリケーションにとって重要なOOD(out-of-distriion)オブジェクトを検出する能力に制限がある。
アノテーションの少ないOODオブジェクトを漸進的に学習することは、ディープラーニングモデルの知識ベースを拡大する理想的な方法である。
本稿では,(1)内分布とoodオブジェクトの両方を検出するオープンセットセマンティクスセグメンテーションモジュールという2つのモジュールを含むオープンワールドセマンティクスセグメンテーションシステムを提案する。
2) OODオブジェクトを既存の知識ベースに徐々に組み込むための,段階的な数ショット学習モジュール。
このオープンワールドセマンティクスセグメンテーションシステムは、oodオブジェクトを識別し、それに対応する監督によって徐々に学習することができる人間のように振る舞う。
我々は,オープンセットセマンティクスセグメンテーションを実装するために,対照クラスタリングを用いたディープメトリック学習ネットワーク(dmlnet)を採用する。
他のオープンセットセマンティックセグメンテーション手法と比較して、我々のDMLNetは、追加のデータや生成モデルを用いることなく、3つの挑戦的なオープンセットセマンティックセグメンテーションデータセットに対して最先端のパフォーマンスを達成する。
そこで本研究では,OODオブジェクトのアノテーションを用いて,DMLNetを段階的に改善する2つの段階的な数ショット学習手法を提案する。
関連論文リスト
- LiSD: An Efficient Multi-Task Learning Framework for LiDAR Segmentation and Detection [6.813145466843275]
LiSDはボクセルベースのエンコーダデコーダフレームワークで、セグメンテーションと検出の両方のタスクに対処する。
これは、ライダーのみの手法のnuScenesセグメンテーションベンチマークにおいて、83.3% mIoUの最先端性能を達成する。
論文 参考訳(メタデータ) (2024-06-11T07:26:54Z) - Neural Slot Interpreters: Grounding Object Semantics in Emergent Slot Representations [4.807052027638089]
本稿では,NSI(Neural Slot Interpreter)を提案する。
NSIはXMLに似たプログラミング言語で、単純な構文規則を使ってシーンのオブジェクトの意味をオブジェクト中心のプログラムプリミティブに整理する。
論文 参考訳(メタデータ) (2024-02-02T12:37:23Z) - Semantic-SAM: Segment and Recognize Anything at Any Granularity [83.64686655044765]
本稿では,任意の粒度でセグメンテーションと認識を可能にする汎用画像セグメンテーションモデルであるSemantic-SAMを紹介する。
複数のデータセットを3つの粒度に集約し、オブジェクトとパーツの分離した分類を導入する。
マルチグラニュラリティ機能を実現するために,各クリックで複数のレベルのマスクを生成できるマルチ選択学習方式を提案する。
論文 参考訳(メタデータ) (2023-07-10T17:59:40Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4319652364256]
本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。
提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。
我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文 参考訳(メタデータ) (2023-07-03T13:21:58Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Open-world Semantic Segmentation for LIDAR Point Clouds [18.45831801175225]
LIDAR点雲に対するオープンワールドセマンティックセマンティックセマンティクスタスクを提案する。
オープンセットセマンティックセグメンテーションを使って、古いクラスと新しいクラスの両方を識別することを目的としている。
また、漸進的な学習を用いて、新しいオブジェクトを既存の知識ベースに徐々に組み込む。
論文 参考訳(メタデータ) (2022-07-04T14:40:35Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Triggering Failures: Out-Of-Distribution detection by learning from
local adversarial attacks in Semantic Segmentation [76.2621758731288]
セグメンテーションにおけるアウト・オブ・ディストリビューション(OOD)オブジェクトの検出に取り組む。
私たちの主な貢献は、ObsNetと呼ばれる新しいOOD検出アーキテクチャであり、ローカル・アタック(LAA)に基づく専用トレーニングスキームと関連付けられています。
3つの異なるデータセットの文献の最近の10つの手法と比較して,速度と精度の両面で最高の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-08-03T17:09:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。