論文の概要: DPPD: Deformable Polar Polygon Object Detection
- arxiv url: http://arxiv.org/abs/2304.02250v1
- Date: Wed, 5 Apr 2023 06:43:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 13:19:42.775042
- Title: DPPD: Deformable Polar Polygon Object Detection
- Title(参考訳): DPPD:変形可能な極ポリゴン物体検出
- Authors: Yang Zheng, Oles Andrienko, Yonglei Zhao, Minwoo Park, Trung Pham
- Abstract要約: 我々は,ポリゴン形状の物体を検出するための新しい変形可能な極ポリゴン物体検出法(DPPD)を開発した。
DPPDは、自律運転のための様々な物体検出タスクで成功している。
- 参考スコア(独自算出の注目度): 3.9236649268347765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Regular object detection methods output rectangle bounding boxes, which are
unable to accurately describe the actual object shapes. Instance segmentation
methods output pixel-level labels, which are computationally expensive for
real-time applications. Therefore, a polygon representation is needed to
achieve precise shape alignment, while retaining low computation cost. We
develop a novel Deformable Polar Polygon Object Detection method (DPPD) to
detect objects in polygon shapes. In particular, our network predicts, for each
object, a sparse set of flexible vertices to construct the polygon, where each
vertex is represented by a pair of angle and distance in the Polar coordinate
system. To enable training, both ground truth and predicted polygons are
densely resampled to have the same number of vertices with equal-spaced
raypoints. The resampling operation is fully differentable, allowing gradient
back-propagation. Sparse polygon predicton ensures high-speed runtime inference
while dense resampling allows the network to learn object shapes with high
precision. The polygon detection head is established on top of an anchor-free
and NMS-free network architecture. DPPD has been demonstrated successfully in
various object detection tasks for autonomous driving such as traffic-sign,
crosswalk, vehicle and pedestrian objects.
- Abstract(参考訳): 正規オブジェクト検出手法は、実際のオブジェクト形状を正確に記述できない矩形境界ボックスを出力する。
インスタンスセグメンテーションメソッドは、リアルタイムアプリケーションに計算コストのかかるピクセルレベルのラベルを出力する。
そのため、計算コストを低く抑えつつ正確な形状アライメントを実現するために多角形表現が必要となる。
ポリゴン形状の物体を検出できる新しい変形可能な極性多角形物体検出法(dppd)を開発した。
特に、我々のネットワークは、各対象に対して、偏座標系において各頂点が一対の角度と距離で表されるような多角形を構築するための柔軟な頂点の集合を予測している。
トレーニングを可能にするために、基底真理と予測多角形の両方は、等間隔線点と同一数の頂点を持つように密に再サンプリングされる。
再サンプリング操作は完全に異なるため、勾配バックプロパゲーションが可能となる。
スパースポリゴン予測は高速な実行時推論を保証し、高密度再サンプリングによりネットワークは高い精度で物体形状を学習できる。
ポリゴン検出ヘッドは、アンカーフリーでNMSフリーなネットワークアーキテクチャの上に設けられる。
DPPDは、交通標識、横断歩道、車両、歩行者などの自律走行のための様々な物体検出タスクで成功している。
関連論文リスト
- Progressive Evolution from Single-Point to Polygon for Scene Text [79.29097971932529]
単点をコンパクトな多角形に効率よく変換できるPoint2Polygonを導入する。
まず認識信頼度に基づいてアンカーポイントを作成し,ポリゴンを垂直に水平に精製する。
また,本手法により生成したポリゴンを用いた学習において,GTと比較して精度の86%を達成し,さらに,提案したPoint2Polygonをシームレスに統合することにより,単一点スポッターにポリゴンの生成を促進させることができた。
論文 参考訳(メタデータ) (2023-12-21T12:08:27Z) - PolyBuilding: Polygon Transformer for End-to-End Building Extraction [9.196604757138825]
PolyBuildingはリモートセンシング画像から建物のベクトル表現を予測する。
モデルはそれらの関係を学習し、画像からコンテキスト情報を符号化し、構築ポリゴンの最終セットを予測する。
また、ピクセルレベルのカバレッジ、インスタンスレベルの精度とリコール、幾何学レベルの特性など、新たな最先端性を実現している。
論文 参考訳(メタデータ) (2022-11-03T04:53:17Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - PolarFormer: Multi-camera 3D Object Detection with Polar Transformers [93.49713023975727]
自律運転における3次元物体検出は、3次元の世界に存在する「何」と「どこに」の物体を推論することを目的としている。
既存の手法はしばしば垂直軸を持つ標準カルテ座標系を採用する。
鳥眼ビュー(BEV)におけるより正確な3次元物体検出のための新しい極変換器(PolarFormer)を,マルチカメラ2D画像のみを入力として提案する。
論文 参考訳(メタデータ) (2022-06-30T16:32:48Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - PolyNet: Polynomial Neural Network for 3D Shape Recognition with
PolyShape Representation [51.147664305955495]
3次元形状表現とその処理は3次元形状認識に大きな影響を及ぼす。
我々は、ディープニューラルネットワークに基づく手法(PolyNet)と特定のポリゴン表現(PolyShape)を提案する。
本研究では,3次元形状分類と検索作業におけるPolyNetの長所と長所を実証した。
論文 参考訳(メタデータ) (2021-10-15T06:45:59Z) - CenterPoly: real-time instance segmentation using bounding polygons [11.365829102707014]
有界多角形を用いたリアルタイムインスタンスセグメンテーションのための新しい手法であるCenterPolyを提案する。
都市部密集環境における道路利用者の検出に応用し,自動走行車などのインテリジェント交通システムへの適用に適している。
ネットワークパラメータのほとんどはネットワークヘッドによって共有され、高速かつ軽量でリアルタイムに実行することができる。
論文 参考訳(メタデータ) (2021-08-19T21:31:30Z) - Polylidar3D -- Fast Polygon Extraction from 3D Data [0.0]
3Dポイントクラウド処理によってキャプチャされたフラットな表面は、ローカライゼーションやモデリングにしばしば使用される。
屋上マッピング,道路面検出,壁面検出のためのRGBDカメラにおいて,自律型マルチス・スピードセグメンテーションを実証する。
結果は常に優れた精度を示す。
論文 参考訳(メタデータ) (2020-07-23T15:22:43Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。