論文の概要: Mushrooms Detection, Localization and 3D Pose Estimation using RGB-D
Sensor for Robotic-picking Applications
- arxiv url: http://arxiv.org/abs/2201.02837v1
- Date: Sat, 8 Jan 2022 14:32:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 16:05:41.314058
- Title: Mushrooms Detection, Localization and 3D Pose Estimation using RGB-D
Sensor for Robotic-picking Applications
- Title(参考訳): ロボットピッキング用RGB-Dセンサを用いたマッシュルーム検出・位置推定・3次元位置推定
- Authors: Nathanael L. Baisa, Bashir Al-Diri
- Abstract要約: RGB-Dデータを用いたキノコ検出,局所化,および3次元ポーズ推定アルゴリズムを提案する。
RGB色からキノコの初期輪郭位置を抽出する。
次に,キノコセグメンテーションのための初期輪郭位置と原画像の両方を活性輪郭に提供する。
検出されたキノコ中心の深度情報を欠く場合,各キノコの半径内に最も近い深度情報から推定する。
- 参考スコア(独自算出の注目度): 0.3655021726150367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose mushrooms detection, localization and 3D pose
estimation algorithm using RGB-D data acquired from a low-cost consumer RGB-D
sensor. We use the RGB and depth information for different purposes. From RGB
color, we first extract initial contour locations of the mushrooms and then
provide both the initial contour locations and the original image to active
contour for mushrooms segmentation. These segmented mushrooms are then used as
input to a circular Hough transform for each mushroom detection including its
center and radius. Once each mushroom's center position in the RGB image is
known, we then use the depth information to locate it in 3D space i.e. in world
coordinate system. In case of missing depth information at the detected center
of each mushroom, we estimate from the nearest available depth information
within the radius of each mushroom. We also estimate the 3D pose of each
mushroom using a pre-prepared upright mushroom model. We use a global
registration followed by local refine registration approach for this 3D pose
estimation. From the estimated 3D pose, we use only the rotation part expressed
in quaternion as an orientation of each mushroom. These estimated (X,Y,Z)
positions, diameters and orientations of the mushrooms are used for
robotic-picking applications. We carry out extensive experiments on both 3D
printed and real mushrooms which show that our method has an interesting
performance.
- Abstract(参考訳): 本稿では,低価格rgb-dセンサから取得したrgb-dデータを用いて,キノコの検出,局在化,3次元ポーズ推定アルゴリズムを提案する。
異なる目的のためにrgbと深度情報を使用します。
rgb色から,まずキノコの初期輪郭位置を抽出し,その後,初期輪郭位置と原画像の両方を,キノコセグメンテーションのためのアクティブ輪郭に提供した。
これらの分割されたキノコは、中心と半径を含むキノコ検出ごとに円形のハフ変換の入力として使用される。
rgb画像内の各キノコの中心位置が分かると、深度情報を使用して3d空間、すなわち世界座標系に配置する。
検出されたキノコ中心の深度情報を欠く場合,各キノコの半径内に最も近い深度情報から推定する。
また,プレ準備したアップライトキノコモデルを用いて,各キノコの3次元ポーズを推定した。
この3次元ポーズ推定には、グローバルな登録とローカルな精巧な登録手法を用いる。
推定された3次元ポーズから、各キノコの向きとして四元数で表される回転部分のみを用いる。
これらの推定された(x,y,z)位置、直径、方向はロボットピッキングに使用される。
我々は3Dプリンティングと実際のキノコについて広範な実験を行い、本手法が興味深い性能を示した。
関連論文リスト
- Depth-based Privileged Information for Boosting 3D Human Pose Estimation on RGB [48.31210455404533]
ヒートマップに基づく3Dポーズ推定器は、推定時に与えられるRGBフレームから深度情報を幻覚することができる。
深度情報は、RGBベースの幻覚ネットワークを強制して、深度データのみに基づいて事前訓練されたバックボーンに類似した特徴を学習することによって、トレーニング中にのみ使用される。
論文 参考訳(メタデータ) (2024-09-17T11:59:34Z) - Mushroom Segmentation and 3D Pose Estimation from Point Clouds using Fully Convolutional Geometric Features and Implicit Pose Encoding [25.598155230329972]
我々は,キノコを分類する深層学習手法を開発し,深度センサで取得した点雲の形で3次元データに基づいてそれらのポーズを推定する。
我々はキノコシーンの合成データセットを作成し、各キノコのポーズのような3D情報を完全に認識する。
提案したネットワークは完全な畳み込みバックボーンを持ち、スパース3Dデータを解析し、インスタンスセグメンテーションとポーズ推定タスクの両方を暗黙的に定義するポーズ情報を予測する。
論文 参考訳(メタデータ) (2024-04-17T12:37:25Z) - MatchU: Matching Unseen Objects for 6D Pose Estimation from RGB-D Images [57.71600854525037]
RGB-D画像からの6次元ポーズ推定のためのFuse-Describe-Match戦略を提案する。
MatchUは、2Dテクスチャと6Dポーズ予測のための3D幾何学的手がかりを融合する汎用的なアプローチである。
論文 参考訳(メタデータ) (2024-03-03T14:01:03Z) - Beyond Visual Field of View: Perceiving 3D Environment with Echoes and
Vision [51.385731364529306]
本稿では,エコーとRGB画像を用いた3次元環境の知覚とナビゲーションに焦点を当てた。
特に、複数の方向から受信したエコーでRGB画像を融合して深度推定を行う。
本稿では,RGB像を補完する3次元構造について,エコーが包括的かつ包括的情報を提供することを示す。
論文 参考訳(メタデータ) (2022-07-03T22:31:47Z) - Real-time RGBD-based Extended Body Pose Estimation [57.61868412206493]
3DヒトポーズのリアルタイムRGBDに基づく推定システムを提案する。
パラメトリック3次元変形可能なヒューマンメッシュモデル(SMPL-X)を表現として使用する。
身体のポーズと表情パラメータの推定子を訓練する。
論文 参考訳(メタデータ) (2021-03-05T13:37:50Z) - 3D Point-to-Keypoint Voting Network for 6D Pose Estimation [8.801404171357916]
3次元キーポイントの空間構造特性に基づくRGB-Dデータから6次元ポーズ推定のためのフレームワークを提案する。
提案手法は, LINEMOD と OCCLUSION LINEMOD の2つのベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2020-12-22T11:43:15Z) - Malleable 2.5D Convolution: Learning Receptive Fields along the
Depth-axis for RGB-D Scene Parsing [18.729547293510453]
本研究では, 可鍛性2.5D畳み込みと呼ばれる新しい演算子を提案し, 深度軸に沿った受容場を学習する。
本手法では,各画素の相対深度差に応じて,各画素を1つのカーネルに割り当てる。
提案したオペレータは標準的な2D機能マップ上で動作し、トレーニング済みのCNNにシームレスに組み込むことができる。
論文 参考訳(メタデータ) (2020-07-18T08:26:11Z) - Geometric Correspondence Fields: Learned Differentiable Rendering for 3D
Pose Refinement in the Wild [96.09941542587865]
野生の任意のカテゴリのオブジェクトに対する微分可能レンダリングに基づく新しい3次元ポーズ精細化手法を提案する。
このようにして、3DモデルとRGB画像のオブジェクトを正確に整列し、3Dポーズ推定を大幅に改善する。
我々は、Pix3Dデータセットの挑戦に対するアプローチを評価し、複数のメトリクスにおける最先端の精錬手法と比較して、最大55%の改善を実現した。
論文 参考訳(メタデータ) (2020-07-17T12:34:38Z) - EPOS: Estimating 6D Pose of Objects with Symmetries [57.448933686429825]
1つのRGB入力から利用可能な3次元モデルを用いて、剛体物体の6次元ポーズを推定する新しい手法を提案する。
オブジェクトは、体系的な方法で対称性を許容するコンパクトな表面フラグメントによって表現される。
エンコーダデコーダネットワークを用いて,高密度サンプリング画素とフラグメントの対応性を予測する。
論文 参考訳(メタデータ) (2020-04-01T17:41:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。