論文の概要: Ellipse R-CNN: Learning to Infer Elliptical Object from Clustering and
Occlusion
- arxiv url: http://arxiv.org/abs/2001.11584v2
- Date: Sat, 14 Nov 2020 21:05:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 12:40:34.682428
- Title: Ellipse R-CNN: Learning to Infer Elliptical Object from Clustering and
Occlusion
- Title(参考訳): 楕円R-CNN:クラスタリングと閉塞から楕円オブジェクトを推測する学習
- Authors: Wenbo Dong, Pravakar Roy, Cheng Peng, Volkan Isler
- Abstract要約: 楕円形物体を楕円形に表現し,推定するために,最初のCNNベースの楕円形検出器であるEllipse R-CNNを導入する。
まず、楕円形物体検出のためのMask R-CNNアーキテクチャに基づく、頑健でコンパクトな楕円回帰法を提案する。
- 参考スコア(独自算出の注目度): 31.237782332036552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Images of heavily occluded objects in cluttered scenes, such as fruit
clusters in trees, are hard to segment. To further retrieve the 3D size and 6D
pose of each individual object in such cases, bounding boxes are not reliable
from multiple views since only a little portion of the object's geometry is
captured. We introduce the first CNN-based ellipse detector, called Ellipse
R-CNN, to represent and infer occluded objects as ellipses. We first propose a
robust and compact ellipse regression based on the Mask R-CNN architecture for
elliptical object detection. Our method can infer the parameters of multiple
elliptical objects even they are occluded by other neighboring objects. For
better occlusion handling, we exploit refined feature regions for the
regression stage, and integrate the U-Net structure for learning different
occlusion patterns to compute the final detection score. The correctness of
ellipse regression is validated through experiments performed on synthetic data
of clustered ellipses. We further quantitatively and qualitatively demonstrate
that our approach outperforms the state-of-the-art model (i.e., Mask R-CNN
followed by ellipse fitting) and its three variants on both synthetic and real
datasets of occluded and clustered elliptical objects.
- Abstract(参考訳): 樹木の果房などの散らばったシーンで密集した物体の画像は、セグメント化が難しい。
このような場合、各オブジェクトの3dサイズと6dポーズをさらに検索するため、バウンディングボックスは、オブジェクトの幾何のほんの一部しかキャプチャされていないため、複数のビューから信頼できない。
楕円形物体を楕円形に表現し,推定するために,最初のCNNベースの楕円形検出器であるEllipse R-CNNを導入する。
まず、楕円形物体検出のためのMask R-CNNアーキテクチャに基づく頑健でコンパクトな楕円回帰を提案する。
本手法は,複数の楕円物体のパラメータを他の隣接物体にオクルードされても推定できる。
そこで我々は, 改良された特徴領域を回帰段階に利用し, U-Net構造を統合し, 異なる閉塞パターンを学習し, 最終的な検出スコアを算出する。
楕円回帰の正確性は、クラスター楕円の合成データ上で行った実験によって検証される。
さらに定量的・定性的に,本手法が最先端モデル(仮面r-cnn,楕円フィッティング)およびその3つの変種をoccluded およびclustered elliptical objectsの合成データセットおよび実データ集合上で上回ることを示した。
関連論文リスト
- KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.23575166061413]
KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文 参考訳(メタデータ) (2024-03-15T08:44:56Z) - Level Set-Based Camera Pose Estimation From Multiple 2D/3D
Ellipse-Ellipsoid Correspondences [2.016317500787292]
2次元物体検出に対する3次元物体の投影を特徴付けるコスト関数の定義は簡単ではないことを示す。
レベルセットのサンプリングに基づいて楕円楕円コストを開発し、部分的な可視オブジェクトを扱うための優れた特性を実証し、その性能を他の一般的なメトリクスと比較する。
論文 参考訳(メタデータ) (2022-07-16T14:09:54Z) - Topologically Persistent Features-based Object Recognition in Cluttered
Indoor Environments [1.2691047660244335]
見えない屋内環境における隠蔽物体の認識は、移動ロボットにとって困難な問題である。
本研究では,物体点雲の3次元形状を捉えるスライシングに基づく新しいトポロジカルディスクリプタを提案する。
これは、隠蔽対象のディスクリプタとそれに対応する非隠蔽対象との類似性を生じさせ、オブジェクトのユニティに基づく認識を可能にする。
論文 参考訳(メタデータ) (2022-05-16T07:01:16Z) - Approximate Convex Decomposition for 3D Meshes with Collision-Aware
Concavity and Tree Search [23.52274863244624]
近似凸分解は、3次元形状をほぼ凸成分の集合に分解することを目的としている。
ゲームエンジン、物理シミュレーション、アニメーションで広く使われている。
本稿では,既存のアプローチの限界を3つの視点から解決する手法を提案する。
論文 参考訳(メタデータ) (2022-05-05T23:40:15Z) - Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic
Segmentation [12.61753274984776]
マルチスケールのスパース機能とグローバルなボクセル符号化されたアテンションを整合させて、インスタンスコンテキストの長距離関係をキャプチャする、新しいスパース・クロススケールアテンション・ネットワークであるSCANを提案する。
表面凝集点に対して、SCANは、整列した特徴の空間性を維持するだけでなく、スパース畳み込みによってネットワークの量を減少させる、新しいスパースクラス非依存のインスタンスセントロイド表現を採用する。
論文 参考訳(メタデータ) (2022-01-16T05:34:54Z) - Ellipse Regression with Predicted Uncertainties for Accurate Multi-View
3D Object Estimation [26.930403135038475]
三次元モデルを楕円体として表現できる物体を考察する。
本稿では,各オブジェクトをセグメント化して楕円形オブジェクトのパラメータを推定し,投影楕円のパラメータを正確に回帰するMask R-CNNの変種について述べる。
論文 参考訳(メタデータ) (2020-12-27T19:52:58Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Canonical 3D Deformer Maps: Unifying parametric and non-parametric
methods for dense weakly-supervised category reconstruction [79.98689027127855]
独立オブジェクトの2次元画像の集合から学習できる共通オブジェクトカテゴリの3次元形状の表現を提案する。
提案手法は, パラメトリック変形モデル, 非パラメトリック3次元再構成, 標準埋め込みの概念に基づく新しい手法で構築する。
顔、車、鳥の野生のデータセットを3Dで再現することで、最先端の成果が得られます。
論文 参考訳(メタデータ) (2020-08-28T15:44:05Z) - Geometry Constrained Weakly Supervised Object Localization [55.17224813345206]
弱教師付きオブジェクトローカライゼーションのための幾何制約付きネットワークであるGC-Netを提案する。
検出器は、幾何学的形状を記述する係数の集合によって定義された物体の位置を予測する。
ジェネレータは、得られたマスクされた画像を入力として、オブジェクトとバックグラウンドの2つの補完的な分類タスクを実行する。
従来のアプローチとは対照的に、GC-Netはエンドツーエンドでトレーニングされ、後処理なしでオブジェクトの位置を予測する。
論文 参考訳(メタデータ) (2020-07-19T17:33:42Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z) - Learning Nonparametric Human Mesh Reconstruction from a Single Image
without Ground Truth Meshes [56.27436157101251]
そこで本研究では,人間のメッシュ再構築を基礎となる真理メッシュを使わずに学習する手法を提案する。
これはグラフ畳み込みニューラルネットワーク(Graph CNN)の損失関数に2つの新しい用語を導入することで実現される。
論文 参考訳(メタデータ) (2020-02-28T20:30:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。