論文の概要: Development and evaluation of automated localization and reconstruction
of all fruits on tomato plants in a greenhouse based on multi-view perception
and 3D multi-object tracking
- arxiv url: http://arxiv.org/abs/2211.02760v1
- Date: Fri, 4 Nov 2022 21:51:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 18:25:05.730637
- Title: Development and evaluation of automated localization and reconstruction
of all fruits on tomato plants in a greenhouse based on multi-view perception
and 3D multi-object tracking
- Title(参考訳): 多視点知覚と3次元マルチオブジェクト追跡に基づく温室栽培におけるトマト全果実の自動局在化・再構成法の開発と評価
- Authors: David Rapado Rincon, Eldert J. van Henten, Gert Kootstra
- Abstract要約: 本稿では,多視点認識と3次元多目的追跡を用いたアグロフード環境における汎用表現の構築手法を提案する。
我々の表現は検出対象ごとに部分点雲を生成する検出アルゴリズムに基づいて構築されている。
実世界のアグロフード環境における表現の精度を評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate representation and localization of relevant objects is important for
robots to perform tasks. Building a generic representation that can be used
across different environments and tasks is not easy, as the relevant objects
vary depending on the environment and the task. Furthermore, another challenge
arises in agro-food environments due to their complexity, and high levels of
clutter and occlusions. In this paper, we present a method to build generic
representations in highly occluded agro-food environments using multi-view
perception and 3D multi-object tracking. Our representation is built upon a
detection algorithm that generates a partial point cloud for each detected
object. The detected objects are then passed to a 3D multi-object tracking
algorithm that creates and updates the representation over time. The whole
process is performed at a rate of 10 Hz. We evaluated the accuracy of the
representation on a real-world agro-food environment, where it was able to
successfully represent and locate tomatoes in tomato plants despite a high
level of occlusion. We were able to estimate the total count of tomatoes with a
maximum error of 5.08% and to track tomatoes with a tracking accuracy up to
71.47%. Additionally, we showed that an evaluation using tracking metrics gives
more insight in the errors in localizing and representing the fruits.
- Abstract(参考訳): ロボットがタスクを実行するためには,関連オブジェクトの正確な表現と位置決めが重要である。
関連するオブジェクトは環境やタスクによって異なるため、さまざまな環境やタスクで使用できる汎用表現の構築は容易ではない。
さらに、その複雑さと高いレベルのクラッタとオクルージョンのため、アグロフード環境でも別の課題が発生する。
本稿では,マルチビュー知覚と3次元マルチオブジェクト追跡を用いて,高度にオクルードなアグロフード環境における汎用表現を構築する手法を提案する。
我々の表現は検出対象ごとに部分的点クラウドを生成する検出アルゴリズムに基づいている。
検出されたオブジェクトは3dマルチオブジェクトトラッキングアルゴリズムに渡され、時間とともに表現を生成し更新する。
プロセス全体は10Hzの速度で実行される。
実世界のアグロフード環境における表現の精度について検討し, 高い閉塞度にもかかわらずトマトのトマトの表現と位置を把握できた。
トマトの総数を最大誤差5.8%で推定し、追跡精度71.47%でトマトを追跡することができた。
さらに,トラッキングメトリクスを用いた評価によって,果実の局所化と表現におけるエラーに対する深い洞察が得られることを示した。
関連論文リスト
- ICGNet: A Unified Approach for Instance-Centric Grasping [44.75280244958735]
オブジェクト中心の把握のためのエンドツーエンドアーキテクチャを導入する。
提案手法の有効性を,合成データセット上での最先端手法に対して広範囲に評価することにより示す。
論文 参考訳(メタデータ) (2024-01-18T12:41:41Z) - Graphical Object-Centric Actor-Critic [55.2480439325792]
本稿では,アクター批判とモデルに基づくアプローチを組み合わせたオブジェクト中心強化学習アルゴリズムを提案する。
変換器エンコーダを用いてオブジェクト表現とグラフニューラルネットワークを抽出し、環境のダイナミクスを近似する。
本アルゴリズムは,現状のモデルフリーアクター批判アルゴリズムよりも複雑な3次元ロボット環境と構成構造をもつ2次元環境において,より優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-10-26T06:05:12Z) - Pave the Way to Grasp Anything: Transferring Foundation Models for
Universal Pick-Place Robots [50.73735524550534]
そこで本稿では,最先端基礎モデルによって生成された言語基底セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
マスクから伝達される正確なセマンティクスとジオメトリを多視点ポリシーモデルに統合することにより、正確なオブジェクトのポーズを認識し、サンプル効率のよい学習を可能にする。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Panoptic Mapping with Fruit Completion and Pose Estimation for
Horticultural Robots [33.21287030243106]
植物や果実を高解像度でモニタリングすることは、農業の未来において重要な役割を担っている。
正確な3D情報は、自律収穫から正確な収量推定まで、農業における多様なロボット応用への道を開くことができる。
移動ロボットによって構築された3次元多次元マップにおいて,果実の完全な3次元形状とそのポーズを共同で推定する問題に対処する。
論文 参考訳(メタデータ) (2023-03-15T20:41:24Z) - RREx-BoT: Remote Referring Expressions with a Bag of Tricks [19.036557405184656]
本研究では,未観測環境における物体の探索に視覚言語スコアリングモデルを用いる方法を示す。
私たちは、我々のモデルを現実世界のTurtleBotプラットフォーム上でデモし、このアプローチの単純さと有用性を強調します。
本分析では,3次元座標と文脈の利用から,視覚言語モデルから大規模3次元検索空間への一般化に至るまで,この課題を達成する上で不可欠な「トリックの袋」を概説する。
論文 参考訳(メタデータ) (2023-01-30T02:19:19Z) - Towards Multimodal Multitask Scene Understanding Models for Indoor
Mobile Agents [49.904531485843464]
本稿では,現実世界の屋内環境におけるラベル付きデータの不十分,あるいは不可能,といった主な課題について論じる。
MMISM (Multi-modality input Multi-task output Indoor Scene Understanding Model) について述べる。
MMISMは、RGB画像だけでなく、スパースライダーポイントを入力と3Dオブジェクト検出、深さ完了、人間のポーズ推定、セマンティックセグメンテーションを出力タスクとみなしている。
MMISMはシングルタスクモデルよりも同等かそれ以上の性能を示す。
論文 参考訳(メタデータ) (2022-09-27T04:49:19Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - Lifelong Ensemble Learning based on Multiple Representations for
Few-Shot Object Recognition [6.282068591820947]
本稿では,複数表現に基づく一生涯のアンサンブル学習手法を提案する。
生涯学習を容易にするため、各アプローチは、オブジェクト情報を即座に保存して検索するメモリユニットを備える。
提案手法の有効性を,オフラインおよびオープンエンドシナリオで評価するために,幅広い実験を行った。
論文 参考訳(メタデータ) (2022-05-04T10:29:10Z) - Object Manipulation via Visual Target Localization [64.05939029132394]
オブジェクトを操作するための訓練エージェントは、多くの課題を提起します。
本研究では,対象物体を探索する環境を探索し,位置が特定されると3次元座標を計算し,対象物が見えない場合でも3次元位置を推定する手法を提案する。
評価の結果,同じ感覚スイートにアクセス可能なモデルに比べて,成功率が3倍に向上したことが示された。
論文 参考訳(メタデータ) (2022-03-15T17:59:01Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。