論文の概要: E2EC: An End-to-End Contour-based Method for High-Quality High-Speed
Instance Segmentation
- arxiv url: http://arxiv.org/abs/2203.04074v1
- Date: Tue, 8 Mar 2022 13:36:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 19:08:54.445088
- Title: E2EC: An End-to-End Contour-based Method for High-Quality High-Speed
Instance Segmentation
- Title(参考訳): e2ec:高品質な高速インスタンスセグメンテーションのためのエンドツーエンドの輪郭ベース手法
- Authors: Tao Zhang, Shiqing Wei, Shunping Ji
- Abstract要約: 高品質なインスタンスセグメンテーションのための新しい輪郭法であるE2ECを導入する。
E2ECは、NVIDIA A6000 GPU上の512*512イメージに対して、36fpsの推論速度を持つリアルタイムアプリケーションでの使用に効率的である。
- 参考スコア(独自算出の注目度): 4.74225248496056
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contour-based instance segmentation methods have developed rapidly recently
but feature rough and hand-crafted front-end contour initialization, which
restricts the model performance, and an empirical and fixed backend
predicted-label vertex pairing, which contributes to the learning difficulty.
In this paper, we introduce a novel contour-based method, named E2EC, for
high-quality instance segmentation. Firstly, E2EC applies a novel learnable
contour initialization architecture instead of hand-crafted contour
initialization. This consists of a contour initialization module for
constructing more explicit learning goals and a global contour deformation
module for taking advantage of all of the vertices' features better. Secondly,
we propose a novel label sampling scheme, named multi-direction alignment, to
reduce the learning difficulty. Thirdly, to improve the quality of the boundary
details, we dynamically match the most appropriate predicted-ground truth
vertex pairs and propose the corresponding loss function named dynamic matching
loss. The experiments showed that E2EC can achieve a state-of-the-art
performance on the KITTI INStance (KINS) dataset, the Semantic Boundaries
Dataset (SBD), the Cityscapes and the COCO dataset. E2EC is also efficient for
use in real-time applications, with an inference speed of 36 fps for 512*512
images on an NVIDIA A6000 GPU. Code will be released at
https://github.com/zhang-tao-whu/e2ec.
- Abstract(参考訳): 輪郭ベースのインスタンスセグメンテーション手法は近年急速に発展しているが, モデル性能を制限した粗面および手作りのフロントエンドの輪郭初期化と, 学習難易度に寄与する実証的, 固定されたバックエンドとラベルの頂点ペアリングが特徴である。
本稿では,高品質なインスタンスセグメンテーションのための新しい輪郭法であるE2ECを紹介する。
まず、E2ECは手作りの輪郭初期化ではなく、学習可能な輪郭初期化アーキテクチャを適用している。
これは、より明示的な学習目標を構築するための輪郭初期化モジュールと、すべての頂点の特徴をうまく活用するためのグローバル輪郭変形モジュールで構成される。
次に,学習難度を低減するために,多方向アライメントと呼ばれる新しいラベルサンプリング手法を提案する。
第三に,境界の細部の品質を向上させるために,予測される最も適切な真理頂点対を動的にマッチングし,動的マッチング損失と呼ばれる対応する損失関数を提案する。
実験の結果、E2ECはKITTI InStance(KINS)データセット、セマンティック境界データセット(SBD)、Cityscapes、COCOデータセットで最先端のパフォーマンスを達成することができた。
E2ECはまた、NVIDIA A6000 GPU上の512*512イメージに対して36fpsの推論速度を持つリアルタイムアプリケーションでの使用にも効率的である。
コードはhttps://github.com/zhang-tao-whu/e2ecでリリースされる。
関連論文リスト
- SGIFormer: Semantic-guided and Geometric-enhanced Interleaving Transformer for 3D Instance Segmentation [14.214197948110115]
本稿では,SGIFormerという3次元インスタンスセグメンテーションのための新しい手法を提案する。
Semantic-Guided Mix Query (SMQ)とGeometric-enhanced Interleaving Transformer (GIT)デコーダで構成されている。
ScanNet V2、ScanNet200、そして挑戦的な高忠実度ScanNet++ベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-07-16T10:17:28Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - Edge-aware Plug-and-play Scheme for Semantic Segmentation [4.297988192695948]
提案手法は, 改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できる。
実験結果から,提案手法は改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できることが示唆された。
論文 参考訳(メタデータ) (2023-03-18T02:17:37Z) - Parallel Vertex Diffusion for Unified Visual Grounding [38.94276071029081]
統一ビジュアルグラウンドティングは、タスク固有の設計の少ないマルチタスクデータを活用するためのシンプルで汎用的な技術経路を追求する。
ほとんどの先進的な手法は、通常、検出とセグメンテーションをモデル化するためのシーケンスとしてボックスとマスクを提示する。
論文 参考訳(メタデータ) (2023-03-13T15:51:38Z) - Deep Manifold Learning with Graph Mining [80.84145791017968]
グラフマイニングのための非段階的決定層を持つ新しいグラフ深層モデルを提案する。
提案モデルでは,現行モデルと比較して最先端性能を実現している。
論文 参考訳(メタデータ) (2022-07-18T04:34:08Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - EV-VGCNN: A Voxel Graph CNN for Event-based Object Classification [18.154951807178943]
イベントカメラは、少ない強度変化を報告し、ポータブルデバイス上での視覚知覚と理解のための低消費電力、高ダイナミックレンジ、高応答速度の顕著な利点を目立たせる。
イベントベースの学習手法は、従来の2次元学習アルゴリズムを適用するために、イベントを密度の高いフレームベースの表現に統合することで、オブジェクト認識において大きな成功を収めている。
これらのアプローチは、スパース・トゥ・ディエンス変換の期間中に多くの冗長な情報を導入し、重量と大容量のモデルを必要とするため、リアルタイムアプリケーションにおけるイベントカメラの可能性を制限する。
論文 参考訳(メタデータ) (2021-06-01T04:07:03Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Heuristic Semi-Supervised Learning for Graph Generation Inspired by
Electoral College [80.67842220664231]
本稿では,新たなノードやエッジを自動的に拡張して,高密度サブグラフ内のラベル類似性を向上する,新しい前処理手法であるElectoral College(ELCO)を提案する。
テストされたすべての設定において、我々の手法はベースモデルの平均スコアを4.7ポイントの広いマージンで引き上げるとともに、常に最先端のモデルよりも優れています。
論文 参考訳(メタデータ) (2020-06-10T14:48:48Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。