論文の概要: Mushroom Segmentation and 3D Pose Estimation from Point Clouds using Fully Convolutional Geometric Features and Implicit Pose Encoding
- arxiv url: http://arxiv.org/abs/2404.12144v1
- Date: Wed, 17 Apr 2024 12:37:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-19 12:31:46.719863
- Title: Mushroom Segmentation and 3D Pose Estimation from Point Clouds using Fully Convolutional Geometric Features and Implicit Pose Encoding
- Title(参考訳): 完全畳み込み幾何学的特徴とインシシットポーズ符号化を用いた点雲からのマッシュルーム分割と3次元ポス推定
- Authors: George Retsinas, Niki Efthymiou, Petros Maragos,
- Abstract要約: 我々は,キノコを分類する深層学習手法を開発し,深度センサで取得した点雲の形で3次元データに基づいてそれらのポーズを推定する。
我々はキノコシーンの合成データセットを作成し、各キノコのポーズのような3D情報を完全に認識する。
提案したネットワークは完全な畳み込みバックボーンを持ち、スパース3Dデータを解析し、インスタンスセグメンテーションとポーズ推定タスクの両方を暗黙的に定義するポーズ情報を予測する。
- 参考スコア(独自算出の注目度): 25.598155230329972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern agricultural applications rely more and more on deep learning solutions. However, training well-performing deep networks requires a large amount of annotated data that may not be available and in the case of 3D annotation may not even be feasible for human annotators. In this work, we develop a deep learning approach to segment mushrooms and estimate their pose on 3D data, in the form of point clouds acquired by depth sensors. To circumvent the annotation problem, we create a synthetic dataset of mushroom scenes, where we are fully aware of 3D information, such as the pose of each mushroom. The proposed network has a fully convolutional backbone, that parses sparse 3D data, and predicts pose information that implicitly defines both instance segmentation and pose estimation task. We have validated the effectiveness of the proposed implicit-based approach for a synthetic test set, as well as provided qualitative results for a small set of real acquired point clouds with depth sensors. Code is publicly available at https://github.com/georgeretsi/mushroom-pose.
- Abstract(参考訳): 現代の農業の応用は、ますますディープラーニングのソリューションに依存している。
しかし、十分な性能の深層ネットワークを訓練するには、利用できない大量の注釈付きデータが必要であり、3Dアノテーションの場合、人間のアノテーションには適用できないかもしれない。
本研究では,キノコを識別する深層学習手法を開発し,深度センサで取得した点雲の形で3次元データに基づくポーズを推定する。
アノテーション問題を回避するために,各キノコのポーズなどの3D情報を完全に認識する,キノコシーンの合成データセットを作成する。
提案したネットワークは完全な畳み込みバックボーンを持ち、スパース3Dデータを解析し、インスタンスセグメンテーションとポーズ推定タスクの両方を暗黙的に定義するポーズ情報を予測する。
提案手法の有効性を検証するとともに,深度センサ付き実点雲の小型集合に対する定性的結果も提示した。
コードはhttps://github.com/georgeretsi/mushroom-poseで公開されている。
関連論文リスト
- PointRegGPT: Boosting 3D Point Cloud Registration using Generative Point-Cloud Pairs for Training [90.06520673092702]
生成点クラウドペアを用いた3Dポイントクラウドの登録をトレーニングのために促進するPointRegGPTを提案する。
我々の知る限り、これは屋内のクラウド登録のためのリアルなデータ生成を探求する最初の生成的アプローチである。
論文 参考訳(メタデータ) (2024-07-19T06:29:57Z) - Clustering based Point Cloud Representation Learning for 3D Analysis [80.88995099442374]
本稿では,ポイントクラウド分析のためのクラスタリングに基づく教師付き学習手法を提案する。
現在のデファクトでシーンワイドなトレーニングパラダイムとは異なり、我々のアルゴリズムは点埋め込み空間上でクラス内のクラスタリングを行う。
我々のアルゴリズムは、有名なポイントクラウドセグメンテーションデータセットの顕著な改善を示している。
論文 参考訳(メタデータ) (2023-07-27T03:42:12Z) - PnP-3D: A Plug-and-Play for 3D Point Clouds [38.05362492645094]
本稿では,既存ネットワークのポイントクラウドデータ解析における有効性を改善するために,プラグイン・アンド・プレイモジュール -3D を提案する。
アプローチを徹底的に評価するために,3つの標準的なクラウド分析タスクについて実験を行った。
本研究は,最先端の成果の達成に加えて,我々のアプローチのメリットを実証する包括的研究を提案する。
論文 参考訳(メタデータ) (2021-08-16T23:59:43Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Exploring Deep 3D Spatial Encodings for Large-Scale 3D Scene
Understanding [19.134536179555102]
生の3次元点雲の空間的特徴を非方向性グラフモデルに符号化することで,CNNに基づくアプローチの限界を克服する代替手法を提案する。
提案手法は、訓練時間とモデル安定性を改善して、最先端の精度で達成し、さらなる研究の可能性を示す。
論文 参考訳(メタデータ) (2020-11-29T12:56:19Z) - Weakly-supervised 3D Shape Completion in the Wild [91.04095516680438]
非整合および実世界の部分点雲から3次元完全形状を学習する問題に対処する。
複数の部分的な観察から3次元標準形状と6-DoFのアライメントを推定する弱い教師付き手法を提案する。
合成データと実データの両方の実験では、形状やポーズを伴わずに大規模なデータを通じて3次元形状の完成を学習することは可能であり、有望であることが示された。
論文 参考訳(メタデータ) (2020-08-20T17:53:42Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z) - Pointwise Attention-Based Atrous Convolutional Neural Networks [15.499267533387039]
多数の点を効率的に扱うために,注目度に基づくアトラス畳み込みニューラルネットワークアーキテクチャを提案する。
提案モデルは,3次元セマンティックセグメンテーションタスクにおいて,最も重要な2つの3Dポイントクラウドデータセット上で評価されている。
精度の面では最先端モデルと比較して妥当な性能を達成し、パラメータの数ははるかに少ない。
論文 参考訳(メタデータ) (2019-12-27T13:12:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。