論文の概要: Ellipse Regression with Predicted Uncertainties for Accurate Multi-View
3D Object Estimation
- arxiv url: http://arxiv.org/abs/2101.05212v1
- Date: Sun, 27 Dec 2020 19:52:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-24 20:08:33.496903
- Title: Ellipse Regression with Predicted Uncertainties for Accurate Multi-View
3D Object Estimation
- Title(参考訳): 高精度な多視点3次元物体推定のための不確かさ予測による楕円回帰
- Authors: Wenbo Dong, Volkan Isler
- Abstract要約: 三次元モデルを楕円体として表現できる物体を考察する。
本稿では,各オブジェクトをセグメント化して楕円形オブジェクトのパラメータを推定し,投影楕円のパラメータを正確に回帰するMask R-CNNの変種について述べる。
- 参考スコア(独自算出の注目度): 26.930403135038475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional neural network (CNN) based architectures, such as Mask R-CNN,
constitute the state of the art in object detection and segmentation. Recently,
these methods have been extended for model-based segmentation where the network
outputs the parameters of a geometric model (e.g. an ellipse) directly. This
work considers objects whose three-dimensional models can be represented as
ellipsoids. We present a variant of Mask R-CNN for estimating the parameters of
ellipsoidal objects by segmenting each object and accurately regressing the
parameters of projection ellipses. We show that model regression is sensitive
to the underlying occlusion scenario and that prediction quality for each
object needs to be characterized individually for accurate 3D object
estimation. We present a novel ellipse regression loss which can learn the
offset parameters with their uncertainties and quantify the overall geometric
quality of detection for each ellipse. These values, in turn, allow us to fuse
multi-view detections to obtain 3D ellipsoid parameters in a principled
fashion. The experiments on both synthetic and real datasets quantitatively
demonstrate the high accuracy of our proposed method in estimating 3D objects
under heavy occlusions compared to previous state-of-the-art methods.
- Abstract(参考訳): Mask R-CNNのような畳み込みニューラルネットワーク(CNN)ベースのアーキテクチャは、オブジェクトの検出とセグメンテーションにおける技術の状態を構成する。
近年、ネットワークが幾何モデルのパラメータ(例えば、)を出力するモデルベースセグメンテーションのためにこれらの手法が拡張されている。
ellipse (複数形 ellipses)
この研究は、3次元モデルが楕円体として表現できる対象を考える。
本稿では,各オブジェクトをセグメント化して楕円形オブジェクトのパラメータを推定し,投影楕円のパラメータを正確に回帰するMask R-CNNの変種について述べる。
モデル回帰は下層の咬合シナリオに敏感であり,正確な3次元物体推定には各物体の予測品質を個別に特徴付ける必要がある。
本稿では,不確かさでオフセットパラメータを学習し,各楕円の幾何学的品質を定量化できる新しい楕円回帰損失を提案する。
これらの値によって,マルチビュー検出を融合して3次元楕円型パラメータを原理的に得ることができる。
人工データと実データの両方を用いた実験により, 従来手法と比較して, 重咬合下の3次元物体推定における提案手法の精度を定量的に検証した。
関連論文リスト
- Parameterization-driven Neural Surface Reconstruction for Object-oriented Editing in Neural Rendering [35.69582529609475]
本稿では,ニューラル暗黙表面を球面やポリキューブのような単純なパラメトリック領域にパラメータ化するための新しいニューラルアルゴリズムを提案する。
オブジェクトのゼロレベルセットからの前方マッピングと後方マッピングのための逆変形を用いて、オブジェクトとドメイン間の双方向の変形を計算する。
本手法の有効性を人間の頭部と人工物の画像に示す。
論文 参考訳(メタデータ) (2023-10-09T08:42:40Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Data-Driven Shadowgraph Simulation of a 3D Object [50.591267188664666]
我々は、数値コードをより安価でプロジェクションベースのサロゲートモデルに置き換えている。
このモデルは、数値的な方法で必要となるすべての前の電場を計算することなく、所定の時間で電場を近似することができる。
このモデルでは, シミュレーションパラメータの狭い範囲におけるデータの摂動問題において, 高品質な再構成が示されており, 大規模な入力データに利用することができる。
論文 参考訳(メタデータ) (2021-06-01T08:46:04Z) - Next-best-view Regression using a 3D Convolutional Neural Network [0.9449650062296823]
本論文では,次のベストビュー問題に対するデータ駆動アプローチを提案する。
提案手法は、次のベストビューのbtxtpositionを抑えるために、以前の再構成で3D畳み込みニューラルネットワークを訓練する。
提案手法を2つの実験グループを用いて検証した。
論文 参考訳(メタデータ) (2021-01-23T01:50:26Z) - DEF: Deep Estimation of Sharp Geometric Features in 3D Shapes [43.853000396885626]
サンプル3次元形状のシャープな幾何学的特徴を予測するための学習ベースフレームワークを提案する。
個々のパッチの結果を融合させることで、既存のデータ駆動方式では処理できない大きな3Dモデルを処理できる。
論文 参考訳(メタデータ) (2020-11-30T18:21:00Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Category Level Object Pose Estimation via Neural Analysis-by-Synthesis [64.14028598360741]
本稿では、勾配に基づくフィッティング法とパラメトリックニューラルネットワーク合成モジュールを組み合わせる。
画像合成ネットワークは、ポーズ設定空間を効率的に分散するように設計されている。
本研究では,2次元画像のみから高精度に物体の向きを復元できることを実験的に示す。
論文 参考訳(メタデータ) (2020-08-18T20:30:47Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z) - Learning Nonparametric Human Mesh Reconstruction from a Single Image
without Ground Truth Meshes [56.27436157101251]
そこで本研究では,人間のメッシュ再構築を基礎となる真理メッシュを使わずに学習する手法を提案する。
これはグラフ畳み込みニューラルネットワーク(Graph CNN)の損失関数に2つの新しい用語を導入することで実現される。
論文 参考訳(メタデータ) (2020-02-28T20:30:07Z) - Ellipse R-CNN: Learning to Infer Elliptical Object from Clustering and
Occlusion [31.237782332036552]
楕円形物体を楕円形に表現し,推定するために,最初のCNNベースの楕円形検出器であるEllipse R-CNNを導入する。
まず、楕円形物体検出のためのMask R-CNNアーキテクチャに基づく、頑健でコンパクトな楕円回帰法を提案する。
論文 参考訳(メタデータ) (2020-01-30T22:04:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。