論文の概要: Development and evaluation of automated localization and reconstruction
of all fruits on tomato plants in a greenhouse based on multi-view perception
and 3D multi-object tracking
- arxiv url: http://arxiv.org/abs/2211.02760v1
- Date: Fri, 4 Nov 2022 21:51:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 18:25:05.730637
- Title: Development and evaluation of automated localization and reconstruction
of all fruits on tomato plants in a greenhouse based on multi-view perception
and 3D multi-object tracking
- Title(参考訳): 多視点知覚と3次元マルチオブジェクト追跡に基づく温室栽培におけるトマト全果実の自動局在化・再構成法の開発と評価
- Authors: David Rapado Rincon, Eldert J. van Henten, Gert Kootstra
- Abstract要約: 本稿では,多視点認識と3次元多目的追跡を用いたアグロフード環境における汎用表現の構築手法を提案する。
我々の表現は検出対象ごとに部分点雲を生成する検出アルゴリズムに基づいて構築されている。
実世界のアグロフード環境における表現の精度を評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate representation and localization of relevant objects is important for
robots to perform tasks. Building a generic representation that can be used
across different environments and tasks is not easy, as the relevant objects
vary depending on the environment and the task. Furthermore, another challenge
arises in agro-food environments due to their complexity, and high levels of
clutter and occlusions. In this paper, we present a method to build generic
representations in highly occluded agro-food environments using multi-view
perception and 3D multi-object tracking. Our representation is built upon a
detection algorithm that generates a partial point cloud for each detected
object. The detected objects are then passed to a 3D multi-object tracking
algorithm that creates and updates the representation over time. The whole
process is performed at a rate of 10 Hz. We evaluated the accuracy of the
representation on a real-world agro-food environment, where it was able to
successfully represent and locate tomatoes in tomato plants despite a high
level of occlusion. We were able to estimate the total count of tomatoes with a
maximum error of 5.08% and to track tomatoes with a tracking accuracy up to
71.47%. Additionally, we showed that an evaluation using tracking metrics gives
more insight in the errors in localizing and representing the fruits.
- Abstract(参考訳): ロボットがタスクを実行するためには,関連オブジェクトの正確な表現と位置決めが重要である。
関連するオブジェクトは環境やタスクによって異なるため、さまざまな環境やタスクで使用できる汎用表現の構築は容易ではない。
さらに、その複雑さと高いレベルのクラッタとオクルージョンのため、アグロフード環境でも別の課題が発生する。
本稿では,マルチビュー知覚と3次元マルチオブジェクト追跡を用いて,高度にオクルードなアグロフード環境における汎用表現を構築する手法を提案する。
我々の表現は検出対象ごとに部分的点クラウドを生成する検出アルゴリズムに基づいている。
検出されたオブジェクトは3dマルチオブジェクトトラッキングアルゴリズムに渡され、時間とともに表現を生成し更新する。
プロセス全体は10Hzの速度で実行される。
実世界のアグロフード環境における表現の精度について検討し, 高い閉塞度にもかかわらずトマトのトマトの表現と位置を把握できた。
トマトの総数を最大誤差5.8%で推定し、追跡精度71.47%でトマトを追跡することができた。
さらに,トラッキングメトリクスを用いた評価によって,果実の局所化と表現におけるエラーに対する深い洞察が得られることを示した。
関連論文リスト
- Markerless Multi-view 3D Human Pose Estimation: a survey [0.49157446832511503]
3D人間のポーズ推定は、複数の関節を検知することで、シーン内のすべての個人の骨格を再構築することを目的としている。
3Dポーズの再構築に関わるすべての課題を解決する方法はまだない。
さらに、高い精度の3Dポーズを計算コストで迅速に推測できるアプローチを開発するためには、さらなる研究が必要である。
論文 参考訳(メタデータ) (2024-07-04T10:44:35Z) - SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。
SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。
SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-01T21:23:03Z) - Total-Decom: Decomposed 3D Scene Reconstruction with Minimal Interaction [51.3632308129838]
人間のインタラクションを最小限に抑えた3次元再構成法であるTotal-Decomを提案する。
提案手法は,Segment Anything Model (SAM) とハイブリッド型暗黙的なニューラルサーフェス表現をシームレスに統合し,メッシュベースの領域成長技術を用いて正確な3次元オブジェクト分解を行う。
提案手法をベンチマークデータセット上で広範囲に評価し,アニメーションやシーン編集などの下流アプリケーションの可能性を示す。
論文 参考訳(メタデータ) (2024-03-28T11:12:33Z) - Graphical Object-Centric Actor-Critic [55.2480439325792]
本稿では,アクター批判とモデルに基づくアプローチを組み合わせたオブジェクト中心強化学習アルゴリズムを提案する。
変換器エンコーダを用いてオブジェクト表現とグラフニューラルネットワークを抽出し、環境のダイナミクスを近似する。
本アルゴリズムは,現状のモデルフリーアクター批判アルゴリズムよりも複雑な3次元ロボット環境と構成構造をもつ2次元環境において,より優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-10-26T06:05:12Z) - Panoptic Mapping with Fruit Completion and Pose Estimation for
Horticultural Robots [33.21287030243106]
植物や果実を高解像度でモニタリングすることは、農業の未来において重要な役割を担っている。
正確な3D情報は、自律収穫から正確な収量推定まで、農業における多様なロボット応用への道を開くことができる。
移動ロボットによって構築された3次元多次元マップにおいて,果実の完全な3次元形状とそのポーズを共同で推定する問題に対処する。
論文 参考訳(メタデータ) (2023-03-15T20:41:24Z) - RREx-BoT: Remote Referring Expressions with a Bag of Tricks [19.036557405184656]
本研究では,未観測環境における物体の探索に視覚言語スコアリングモデルを用いる方法を示す。
私たちは、我々のモデルを現実世界のTurtleBotプラットフォーム上でデモし、このアプローチの単純さと有用性を強調します。
本分析では,3次元座標と文脈の利用から,視覚言語モデルから大規模3次元検索空間への一般化に至るまで,この課題を達成する上で不可欠な「トリックの袋」を概説する。
論文 参考訳(メタデータ) (2023-01-30T02:19:19Z) - Towards Multimodal Multitask Scene Understanding Models for Indoor
Mobile Agents [49.904531485843464]
本稿では,現実世界の屋内環境におけるラベル付きデータの不十分,あるいは不可能,といった主な課題について論じる。
MMISM (Multi-modality input Multi-task output Indoor Scene Understanding Model) について述べる。
MMISMは、RGB画像だけでなく、スパースライダーポイントを入力と3Dオブジェクト検出、深さ完了、人間のポーズ推定、セマンティックセグメンテーションを出力タスクとみなしている。
MMISMはシングルタスクモデルよりも同等かそれ以上の性能を示す。
論文 参考訳(メタデータ) (2022-09-27T04:49:19Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - Lifelong Ensemble Learning based on Multiple Representations for
Few-Shot Object Recognition [6.282068591820947]
本稿では,複数表現に基づく一生涯のアンサンブル学習手法を提案する。
生涯学習を容易にするため、各アプローチは、オブジェクト情報を即座に保存して検索するメモリユニットを備える。
提案手法の有効性を,オフラインおよびオープンエンドシナリオで評価するために,幅広い実験を行った。
論文 参考訳(メタデータ) (2022-05-04T10:29:10Z) - Object Manipulation via Visual Target Localization [64.05939029132394]
オブジェクトを操作するための訓練エージェントは、多くの課題を提起します。
本研究では,対象物体を探索する環境を探索し,位置が特定されると3次元座標を計算し,対象物が見えない場合でも3次元位置を推定する手法を提案する。
評価の結果,同じ感覚スイートにアクセス可能なモデルに比べて,成功率が3倍に向上したことが示された。
論文 参考訳(メタデータ) (2022-03-15T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。