論文の概要: 3D shape sensing and deep learning-based segmentation of strawberries
- arxiv url: http://arxiv.org/abs/2111.13663v1
- Date: Fri, 26 Nov 2021 18:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 17:15:10.061266
- Title: 3D shape sensing and deep learning-based segmentation of strawberries
- Title(参考訳): イチゴの3次元形状センサと深層学習によるセグメンテーション
- Authors: Justin Le Lou\"edec and Grzegorz Cielniak
- Abstract要約: 農業における形状の3次元認識のためのステレオおよび飛行時間カメラを含む最新のセンシング技術を評価する。
本稿では,カメラベースの3Dセンサから得られる情報の組織的性質を利用した,新しい3Dディープニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 5.634825161148484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automation and robotisation of the agricultural sector are seen as a viable
solution to socio-economic challenges faced by this industry. This technology
often relies on intelligent perception systems providing information about
crops, plants and the entire environment. The challenges faced by traditional
2D vision systems can be addressed by modern 3D vision systems which enable
straightforward localisation of objects, size and shape estimation, or handling
of occlusions. So far, the use of 3D sensing was mainly limited to indoor or
structured environments. In this paper, we evaluate modern sensing technologies
including stereo and time-of-flight cameras for 3D perception of shape in
agriculture and study their usability for segmenting out soft fruit from
background based on their shape. To that end, we propose a novel 3D deep neural
network which exploits the organised nature of information originating from the
camera-based 3D sensors. We demonstrate the superior performance and efficiency
of the proposed architecture compared to the state-of-the-art 3D networks.
Through a simulated study, we also show the potential of the 3D sensing
paradigm for object segmentation in agriculture and provide insights and
analysis of what shape quality is needed and expected for further analysis of
crops. The results of this work should encourage researchers and companies to
develop more accurate and robust 3D sensing technologies to assure their wider
adoption in practical agricultural applications.
- Abstract(参考訳): 農業分野の自動化とロボット化は、この産業が直面する社会経済的課題に対する有効な解決策と見なされている。
この技術は、しばしば作物、植物、そして環境全体に関する情報を提供するインテリジェントな知覚システムに依存している。
従来の2次元視覚システムで直面する課題は、オブジェクトの局所化、サイズと形状の推定、オクルージョンの処理を可能にする現代の3次元視覚システムによって対処できる。
これまでの3dセンシングの使用は主に屋内環境や構造環境に限られていた。
本稿では,農業における形状の3次元認識のためのステレオカメラや飛行時間カメラなどの近代的センシング技術を評価し,その形状に基づいて軟質果実を抽出するためのユーザビリティについて検討する。
そこで我々は,カメラベースの3Dセンサから得られる情報の組織的性質を利用した,新しい3Dディープニューラルネットワークを提案する。
本稿では,最新の3Dネットワークと比較して,提案アーキテクチャの性能と効率性を実証する。
シミュレーション研究を通じて,農業における対象セグメンテーションにおける3次元センシングパラダイムの可能性を示し,作物のさらなる分析のためにどのような形状品質が必要か,どのような形状が必要か,そして期待できるかの洞察と分析を行う。
この研究の結果は、研究者や企業がより正確で堅牢な3dセンシング技術を開発し、実用的な農業応用に広く採用されるよう促すだろう。
関連論文リスト
- 3D Gaussian Splatting: Survey, Technologies, Challenges, and Opportunities [57.444435654131006]
3D Gaussian Splatting (3DGS) は、3D表現の主流となる可能性を持つ顕著な手法として登場した。
本調査は,複数視点から既存の3DGS関連作品を分析することを目的としている。
論文 参考訳(メタデータ) (2024-07-24T16:53:17Z) - A Survey on Occupancy Perception for Autonomous Driving: The Information Fusion Perspective [20.798308029074786]
3D占有感技術は、自動運転車の密集した3D環境を観察し理解することを目的としている。
従来の鳥眼視(BEV)と同様に、3D占有感は多ソース入力の性質と情報融合の必要性を持っている。
論文 参考訳(メタデータ) (2024-05-08T16:10:46Z) - Scalable Vision-Based 3D Object Detection and Monocular Depth Estimation
for Autonomous Driving [5.347428263669927]
この論文は、視覚に基づく3D知覚技術の進歩への多面的な貢献である。
第1節では、この論文はモノクロとステレオの両方のオブジェクト検出アルゴリズムに構造的拡張を導入している。
第2のセグメントは、データ駆動戦略と、3D視覚検出における実世界の応用に特化している。
論文 参考訳(メタデータ) (2024-03-04T13:42:54Z) - Robustness-Aware 3D Object Detection in Autonomous Driving: A Review and
Outlook [20.380856953006592]
本研究は,現実シナリオ下での知覚システム評価において,精度と遅延とともに頑健性の重要性を強調した。
本研究は,カメラベース,LiDAR,マルチモーダル3Dオブジェクト検出アルゴリズムを広範囲に調査し,精度,レイテンシ,堅牢性のトレードオフを徹底的に評価する。
これらのうち、マルチモーダル3D検出手法は、優れた堅牢性を示し、新しい分類法を導入して、その文献を再編成し、明確性を高める。
論文 参考訳(メタデータ) (2024-01-12T12:35:45Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - 3D objects and scenes classification, recognition, segmentation, and
reconstruction using 3D point cloud data: A review [5.85206759397617]
3次元(3D)点雲解析は、現実的な画像やマシンビジョンにおいて魅力的な対象の1つとなっている。
最近、ディープラーニングモデルのような様々な技術を用いて、新しい戦略の開発に多大な努力が注がれている。
オブジェクトやシーンの検出,認識,セグメンテーション,再構築など,3Dポイントで行うさまざまなタスクについて検討した。
論文 参考訳(メタデータ) (2023-06-09T15:45:23Z) - NeurOCS: Neural NOCS Supervision for Monocular 3D Object Localization [80.3424839706698]
入力として3Dボックスをインスタンスマスクとして使用するNeurOCSを提案する。
われわれのアプローチは、実際の運転シーンから直接カテゴリレベルの形状を学習する際の洞察に依存している。
我々は、オブジェクト中心の視点からオブジェクト座標をより効果的に学習するための重要な設計選択を行う。
論文 参考訳(メタデータ) (2023-05-28T16:18:41Z) - Szloca: towards a framework for full 3D tracking through a single camera
in context of interactive arts [1.0878040851638]
本研究は、オブジェクト/人のデータと仮想表現を得るための新しい方法と枠組みを提案する。
このモデルはコンピュータビジョンシステムの複雑な訓練には依存せず、コンピュータビジョンの研究とz深度を表現する能力が組み合わさっている。
論文 参考訳(メタデータ) (2022-06-26T20:09:47Z) - 3D Object Detection from Images for Autonomous Driving: A Survey [68.33502122185813]
画像から3Dオブジェクトを検出することは、自動運転の基本的かつ困難な問題の一つだ。
この問題を2015年から2021年にかけて200以上の研究が行われ、理論、アルゴリズム、応用の幅広い範囲で研究されている。
我々は,この新奇で継続的な研究分野を包括的に調査し,画像に基づく3D検出に最もよく使用されるパイプラインを要約する。
論文 参考訳(メタデータ) (2022-02-07T07:12:24Z) - Active 3D Shape Reconstruction from Vision and Touch [66.08432412497443]
人間は、視覚と触覚を共同で利用して、活発な物体探索を通じて世界の3D理解を構築する。
3次元形状の再構成では、最新の進歩はRGB画像、深度マップ、触覚読影などの限られた感覚データの静的データセットに依存している。
1)高空間分解能視覚に基づく触覚センサを応用した3次元物体のアクティブタッチに活用した触覚シミュレータ,2)触覚やビジュオクティビティルを先導するメッシュベースの3次元形状再構成モデル,3)触覚やビジュオのいずれかを用いたデータ駆動型ソリューションのセットからなるシステムを導入する。
論文 参考訳(メタデータ) (2021-07-20T15:56:52Z) - Kinematic 3D Object Detection in Monocular Video [123.7119180923524]
運動運動を注意深く利用して3次元位置決めの精度を向上させるモノクロ映像を用いた3次元物体検出法を提案する。
我々は、KITTI自動運転データセット内のモノクロ3次元物体検出とバードアイビュータスクの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-07-19T01:15:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。