論文の概要: PanoNet: Real-time Panoptic Segmentation through Position-Sensitive
Feature Embedding
- arxiv url: http://arxiv.org/abs/2008.00192v1
- Date: Sat, 1 Aug 2020 06:58:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 00:46:12.512626
- Title: PanoNet: Real-time Panoptic Segmentation through Position-Sensitive
Feature Embedding
- Title(参考訳): PanoNet: 位置感性機能埋め込みによるリアルタイムパノプティクスセグメンテーション
- Authors: Xia Chen, Jianren Wang, Martial Hebert
- Abstract要約: そこで本研究では,パン光学セグメンテーションのためのセマンティックマスクとインスタンスマスクを同時に生成する,シンプルで高速で柔軟なフレームワークを提案する。
パノネットと呼ばれる我々の手法はクリーンで自然な構造設計を取り入れており、時間を要する検出処理を使わずにセグメンテーションタスクとして問題に対処する。
全体として、PanoNetは高解像度のCityscapes画像の高画質化結果をリアルタイムで得る。
- 参考スコア(独自算出の注目度): 27.15057692314514
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We propose a simple, fast, and flexible framework to generate simultaneously
semantic and instance masks for panoptic segmentation. Our method, called
PanoNet, incorporates a clean and natural structure design that tackles the
problem purely as a segmentation task without the time-consuming detection
process. We also introduce position-sensitive embedding for instance grouping
by accounting for both object's appearance and its spatial location. Overall,
PanoNet yields high panoptic quality results of high-resolution Cityscapes
images in real-time, significantly faster than all other methods with
comparable performance. Our approach well satisfies the practical speed and
memory requirement for many applications like autonomous driving and augmented
reality.
- Abstract(参考訳): 我々は,パンオプティカルセグメンテーションのためのセマンティクスとインスタンスマスクを同時に生成する,シンプルで高速で柔軟なフレームワークを提案する。
パノネットと呼ばれる我々の手法はクリーンで自然な構造設計を取り入れており、時間を要する検出処理が不要なセグメンテーションタスクとして問題に取り組む。
また,物体の外観と空間的位置の両方を考慮し,位置感性埋め込みを例示する。
全体的に、パノネットは高精細な都市景観画像のパンオプティカルな品質の結果をリアルタイムで得ることができ、同等の性能を持つ他の手法よりもかなり高速である。
私たちのアプローチは、自律運転や拡張現実といった多くのアプリケーションにおいて、現実的なスピードとメモリ要件を十分に満たしています。
関連論文リスト
- Panoptic-FlashOcc: An Efficient Baseline to Marry Semantic Occupancy with Panoptic via Instance Center [9.290505929115637]
我々は,リアルタイムなパノプティクスの占有を可能にする,単純かつ堅牢な2D機能フレームワークであるPanoptic-FlashOccを提案する。
本手法では,単一ネットワークにおけるセマンティック占有とクラス対応インスタンスクラスタリングを同時に学習する。
Panoptic-FlashOccは、汎視的占有率予測における顕著な成果を示す。
論文 参考訳(メタデータ) (2024-06-15T06:39:38Z) - SiamMask: A Framework for Fast Online Object Tracking and Segmentation [96.61632757952292]
SiamMaskは、ビジュアルオブジェクトトラッキングとビデオオブジェクトセグメンテーションの両方を、同じシンプルな方法でリアルタイムで実行するためのフレームワークである。
マルチタスクモデルを簡単に再利用することで、複数のオブジェクトのトラッキングとセグメンテーションを扱うためのフレームワークを拡張することができることを示す。
ビデオオブジェクトセグメンテーションベンチマークでは、高速で競合性能を示すと同時に、ビジュアルオブジェクト追跡ベンチマークでは、リアルタイムに最先端の結果が得られる。
論文 参考訳(メタデータ) (2022-07-05T14:47:17Z) - Panoramic Panoptic Segmentation: Insights Into Surrounding Parsing for
Mobile Agents via Unsupervised Contrastive Learning [93.6645991946674]
我々はパノラマパノラマパノプティクスのセグメンテーションを最も総合的なシーン理解として紹介する。
完全な周囲の理解は、移動エージェントに最大限の情報を提供する。
本稿では,標準的なピンホール画像のモデルトレーニングを可能にし,学習した特徴を別のドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T20:07:15Z) - Distortion-Aware Network Pruning and Feature Reuse for Real-time Video
Segmentation [49.17930380106643]
本稿では,リアルタイム視覚タスクのスキップ接続によるアーキテクチャの高速化を目的とした新しいフレームワークを提案する。
具体的には、各フレームの到着時に、前のフレームから特徴を変換し、特定の空間的ビンで再利用する。
次に、現在のフレームの領域におけるバックボーンネットワークの部分計算を行い、現在のフレームと前のフレームの時間差をキャプチャする。
論文 参考訳(メタデータ) (2022-06-20T07:20:02Z) - Panoptic-PHNet: Towards Real-Time and High-Precision LiDAR Panoptic
Segmentation via Clustering Pseudo Heatmap [9.770808277353128]
本稿では,Panoptic-PHNetと呼ばれる高速かつ高性能なLiDARベースのフレームワークを提案する。
我々は、クラスタリング擬似ヒートマップを新しいパラダイムとして導入し、それに続いて、集中型グループ化モジュールが、効率的なクラスタリングのためにインスタンスセンタを生成する。
バックボーンデザインでは、細粒度のボクセル機能と2D Bird's Eye View (BEV)機能を異なる受容領域に融合し、詳細情報とグローバル情報の両方を利用する。
論文 参考訳(メタデータ) (2022-05-14T08:16:13Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Panoptic-PolarNet: Proposal-free LiDAR Point Cloud Panoptic Segmentation [21.296942497092402]
我々は、Panoptic-PolarNetと呼ばれる高速で堅牢なLiDARポイントクラウドパノラマセグメンテーションフレームワークを提示します。
ポーラバードのアイビュー表現を用いて,セマンティックセグメンテーションとクラス非依存のインスタンスクラスタリングの両方を単一推論ネットワークで学習する。
実験の結果,Panoptic-PolarNetは,Semantic KITTIおよびnuScenesデータセットのベースライン手法をほぼリアルタイムな推論速度で上回っていることがわかった。
論文 参考訳(メタデータ) (2021-03-27T18:31:40Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z) - Auto-Panoptic: Cooperative Multi-Component Architecture Search for
Panoptic Segmentation [144.50154657257605]
本稿では、バックボーン、セグメンテーションブランチ、フィーチャーフュージョンモジュールを含むすべての主要コンポーネントを同時に検索する効率的なフレームワークを提案する。
検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
論文 参考訳(メタデータ) (2020-10-30T08:34:35Z) - EfficientPS: Efficient Panoptic Segmentation [13.23676270963484]
セマンティックにリッチなマルチスケール機能を効率的にエンコードし、融合する効率的パノプティクス(Efficient Panoptic, EfficientPS)アーキテクチャを導入する。
セマンティックヘッドは、細部とコンテキストの特徴を整合的に集約し、インスタンスヘッドとしてMask R-CNNの新たな変種を組み込む。
また、一般的なKITTIベンチマークのためのパノビュータアノテーションを含むKITTIパノビュータセグメンテーションデータセットについても紹介する。
論文 参考訳(メタデータ) (2020-04-05T20:15:59Z) - EPSNet: Efficient Panoptic Segmentation Network with Cross-layer
Attention Fusion [5.815742965809424]
高速な推論速度でパノプティカルセグメンテーションタスクに取り組むために,EPSNet(Efficient Panoptic Network)を提案する。
基本的に、EPSNetはプロトタイプマスクとマスク係数の単純な線形結合に基づいてマスクを生成する。
共有プロトタイプの品質を高めるために,我々は"クロスレイヤーアテンション融合モジュール"と呼ばれるモジュールを採用した。
論文 参考訳(メタデータ) (2020-03-23T09:11:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。