論文の概要: Learning Universal Shape Dictionary for Realtime Instance Segmentation
- arxiv url: http://arxiv.org/abs/2012.01050v1
- Date: Wed, 2 Dec 2020 09:44:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:59:30.800804
- Title: Learning Universal Shape Dictionary for Realtime Instance Segmentation
- Title(参考訳): 実時間インスタンスセグメンテーションのためのユニバーサルシェイプ辞書の学習
- Authors: Tutian Tang, Wenqiang Xu, Ruolin Ye, Lixin Yang, Cewu Lu
- Abstract要約: 事例分割のための新しい明示的な形状表現を提案する。
オブジェクトの形状をモデル化する方法に基づいて、現在のインスタンスセグメンテーションシステムは暗黙のモデルと明示的なモデルという2つのカテゴリに分けられる。
提案したUSD-Segは、オブジェクト形状に対して、辞書を用いたスパース符号化という線形モデルを採用する。
- 参考スコア(独自算出の注目度): 40.27913339054021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel explicit shape representation for instance segmentation.
Based on how to model the object shape, current instance segmentation systems
can be divided into two categories, implicit and explicit models. The implicit
methods, which represent the object mask/contour by intractable network
parameters, and produce it through pixel-wise classification, are predominant.
However, the explicit methods, which parameterize the shape with simple and
explainable models, are less explored. Since the operations to generate the
final shape are light-weighted, the explicit methods have a clear speed
advantage over implicit methods, which is crucial for real-world applications.
The proposed USD-Seg adopts a linear model, sparse coding with dictionary, for
object shapes.
First, it learns a dictionary from a large collection of shape datasets,
making any shape being able to be decomposed into a linear combination through
the dictionary.
Hence the name "Universal Shape Dictionary".
Then it adds a simple shape vector regression head to ordinary object
detector, giving the detector segmentation ability with minimal overhead.
For quantitative evaluation, we use both average precision (AP) and the
proposed Efficiency of AP (AP$_E$) metric, which intends to also measure the
computational consumption of the framework to cater to the requirements of
real-world applications. We report experimental results on the challenging COCO
dataset, in which our single model on a single Titan Xp GPU achieves 35.8 AP
and 27.8 AP$_E$ at 65 fps with YOLOv4 as base detector, 34.1 AP and 28.6 AP$_E$
at 12 fps with FCOS as base detector.
- Abstract(参考訳): 事例分割のための新しい明示的な形状表現を提案する。
オブジェクトの形状をモデル化する方法に基づいて、現在のインスタンスセグメンテーションシステムは暗黙のモデルと明示的なモデルという2つのカテゴリに分けられる。
対象のマスク/輪郭を抽出可能なネットワークパラメータで表現し,画素単位の分類によって生成する暗黙的手法が主流である。
しかし、単純で説明可能なモデルで形状をパラメータ化する明示的な手法は、あまり研究されていない。
最終的な形状を生成する操作は軽量であるため、明示的なメソッドは暗黙的なメソッドよりも明らかに速度上の利点がある。
提案するusd-segは,オブジェクト形状の線形モデルであるsparse coding with dictionaryを採用する。
まず、多数の形状データセットから辞書を学習し、辞書を通じて任意の形状を線形結合に分解することができる。
英語名は「Universal Shape Dictionary」。
そして、通常の物体検出器に単純な形状ベクトル回帰ヘッドを加え、最小限のオーバーヘッドで検出器のセグメンテーション能力を与える。
定量的評価には、平均精度(ap)とap(ap$_e$)メトリックの効率(実世界のアプリケーションの要求を満たすフレームワークの計算消費を測定することを目的としています。
我々は,単一のTitan Xp GPU上の単一モデルで35.8 APと27.8 AP$_E$をベース検出器としてYOLOv4をベース検出器として,34.1 APと28.6 AP$_E$をベース検出器として達成したCOCOデータセットの実験結果を報告する。
関連論文リスト
- Instance-aware 3D Semantic Segmentation powered by Shape Generators and
Classifiers [28.817905887080293]
本稿では,3次元セマンティックセグメンテーションのための新しいインスタンス認識手法を提案する。
本手法は,学習した特徴表現の一貫性を促進するために,インスタンスレベルでの幾何処理タスクを組み合わせる。
論文 参考訳(メタデータ) (2023-11-21T02:14:16Z) - PDiscoNet: Semantically consistent part discovery for fine-grained
recognition [62.12602920807109]
画像レベルのクラスラベルのみを用いて,対象部品の発見を推奨する先行情報とともにPDiscoNetを提案する。
CUB,CelebA,PartImageNet で得られた結果から,提案手法は従来手法よりもかなり優れた部分発見性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-09-06T17:19:29Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Number-Adaptive Prototype Learning for 3D Point Cloud Semantic
Segmentation [46.610620464184926]
セマンティッククラス内の異なる点パターンを動的に記述するために,適応的なプロトタイプ数を提案する。
本手法は,ポイントワイド分類パラダイムに基づくベースラインモデルよりも2.3%mIoUの改善を実現する。
論文 参考訳(メタデータ) (2022-10-18T15:57:20Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Learn to Learn Metric Space for Few-Shot Segmentation of 3D Shapes [17.217954254022573]
メタラーニングに基づく3次元形状分割手法を提案する。
本稿では,ShapeNet部データセットにおける提案手法の優れた性能を,既存のベースラインや最先端の半教師手法と比較し,いくつかのシナリオで示す。
論文 参考訳(メタデータ) (2021-07-07T01:47:00Z) - Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.48110331544885]
既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。
我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。
論文 参考訳(メタデータ) (2020-12-14T13:12:38Z) - EOLO: Embedded Object Segmentation only Look Once [0.0]
3つの独立したブランチで概念的にシンプルであり、完全に畳み込み可能で、モバイルや組み込みデバイスに簡単に組み込むことができるアンカーフリーでシングルショットのインスタンスセグメンテーション手法を導入する。
EOLOと呼ばれる本手法では,各画素のインスタンス中心分類と4次元距離回帰により,意味的セグメンテーションを予測し,重なり合うオブジェクト問題を区別するものとして,インスタンス分割問題を再構成する。
ベルとホイッスルがなければ、EOLOはIoU50の下で27.7$%のマスクmAPを獲得し、1080Ti GPU上で30FPSに達し、シングルモデルとシングルスケールのトレーニング/テストが可能である。
論文 参考訳(メタデータ) (2020-03-31T21:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。