論文の概要: 6D Strawberry Pose Estimation: Real-time and Edge AI Solutions Using Purely Synthetic Training Data
- arxiv url: http://arxiv.org/abs/2511.11307v1
- Date: Fri, 14 Nov 2025 13:51:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.634998
- Title: 6D Strawberry Pose Estimation: Real-time and Edge AI Solutions Using Purely Synthetic Training Data
- Title(参考訳): 6Dストローベリーポース推定:純合成学習データを用いたリアルタイムおよびエッジAIソリューション
- Authors: Saptarshi Neil Sinha, Julius Kühn, Mika Silvan Goschke, Michael Weinmann,
- Abstract要約: 本稿では, レンダリング用プロシージャパイプラインから生成した純合成データを用いて, イチゴの6次元ポーズ推定に着目する。
速度と精度のバランスとエッジ推論のサポートで知られているYOLOXのバックボーンを利用したシングルショットアプローチであるYOLOX-6D-Poseアルゴリズムを採用する。
- 参考スコア(独自算出の注目度): 5.767786408394506
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Automated and selective harvesting of fruits has become an important area of research, particularly due to challenges such as high costs and a shortage of seasonal labor in advanced economies. This paper focuses on 6D pose estimation of strawberries using purely synthetic data generated through a procedural pipeline for photorealistic rendering. We employ the YOLOX-6D-Pose algorithm, a single-shot approach that leverages the YOLOX backbone, known for its balance between speed and accuracy, and its support for edge inference. To address the lacking availability of training data, we introduce a robust and flexible pipeline for generating synthetic strawberry data from various 3D models via a procedural Blender pipeline, where we focus on enhancing the realism of the synthesized data in comparison to previous work to make it a valuable resource for training pose estimation algorithms. Quantitative evaluations indicate that our models achieve comparable accuracy on both the NVIDIA RTX 3090 and Jetson Orin Nano across several ADD-S metrics, with the RTX 3090 demonstrating superior processing speed. However, the Jetson Orin Nano is particularly suited for resource-constrained environments, making it an excellent choice for deployment in agricultural robotics. Qualitative assessments further confirm the model's performance, demonstrating its capability to accurately infer the poses of ripe and partially ripe strawberries, while facing challenges in detecting unripe specimens. This suggests opportunities for future improvements, especially in enhancing detection capabilities for unripe strawberries (if desired) by exploring variations in color. Furthermore, the methodology presented could be adapted easily for other fruits such as apples, peaches, and plums, thereby expanding its applicability and impact in the field of agricultural automation.
- Abstract(参考訳): 果物の自動化と選択的な収穫は、特に高コストや先進国における季節労働の不足といった課題により、研究の重要領域となっている。
本稿では,フォトリアリスティックレンダリングのためのプロシージャパイプラインから生成された純合成データを用いて,イチゴの6次元ポーズ推定に着目する。
速度と精度のバランスとエッジ推論のサポートで知られているYOLOXのバックボーンを利用したシングルショットアプローチであるYOLOX-6D-Poseアルゴリズムを採用する。
トレーニングデータの可用性の欠如に対処するため,手続き型ブレンダーパイプラインを用いて,様々な3次元モデルから合成イチゴデータを生成する,堅牢で柔軟なパイプラインを導入する。
定量的評価の結果, NVIDIA RTX 3090とJetson Orin Nanoの両モデルにおいて, ADD-Sの指標で比較精度が向上し, RTX 3090は処理速度に優れていた。
しかし、Jetson Orin Nanoは特に資源に制約のある環境に適しているため、農業ロボティクスへの展開には最適である。
定性的評価はモデルの性能をさらに確認し、未熟な標本を検出する上で困難に直面しながら、熟したイチゴと部分的に熟したイチゴのポーズを正確に推測する能力を示した。
これは、色の変化を探求することによって、特にイチゴの(望めば)検出能力を向上する将来の改善の機会を示唆している。
さらに、提示された手法はリンゴ、桃、梅などの他の果実にも容易に適用でき、農業自動化の分野で適用性と影響を広げることができた。
関連論文リスト
- Sparse 3D Perception for Rose Harvesting Robots: A Two-Stage Approach Bridging Simulation and Real-World Applications [0.5407319151576264]
ダマスク・ローズのような薬用植物は人口増加とともに急増しているが、労働集約的な収穫はスケーラビリティのボトルネックとなっている。
そこで本研究では,バラセンタのスパース3D局所化に着目し,花を刈り取るロボットに適した新しい3D知覚パイプラインを提案する。
我々の2段階のアルゴリズムはまずステレオ画像上で2次元点検出を行い、続いて軽量のディープニューラルネットワークを用いて深度推定を行う。
論文 参考訳(メタデータ) (2025-07-28T16:09:34Z) - Raspberry PhenoSet: A Phenology-based Dataset for Automated Growth Detection and Yield Estimation [1.2661567777618703]
7つの発達段階にまたがるラズベリー果実の検出とセグメンテーションのための表現学ベースのデータセットであるRaspberry PhenoSetを紹介した。
このデータセットには1,853枚の高解像度画像が含まれており、これは文学の中で最高品質であり、垂直農場で制御された人工照明の下で撮影された。
YOLOv8, YOLOv10, RT-DETR, Mask R-CNNなど,最先端のディープラーニングモデルをベンチマークして, データセットのパフォーマンスを総合的に評価した。
論文 参考訳(メタデータ) (2024-11-01T18:34:26Z) - Key Point-based Orientation Estimation of Strawberries for Robotic Fruit
Picking [8.657107511095242]
本稿では,2次元画像から直接3次元方向を予測できるキーポイント型果物配向推定手法を提案する。
提案手法は, 平均誤差を8円程度に抑え, 従来よりも$sim30%の予測精度を向上する。
論文 参考訳(メタデータ) (2023-10-17T15:12:11Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Autoregressive Uncertainty Modeling for 3D Bounding Box Prediction [63.3021778885906]
3Dバウンディングボックスは、多くのコンピュータビジョンアプリケーションで広く使われている中間表現である。
本稿では,自己回帰モデルを利用して高い信頼度予測と意味のある不確実性対策を行う手法を提案する。
我々はシミュレーションデータセットであるCOB-3Dをリリースし、現実世界のロボティクスアプリケーションで発生する新しいタイプのあいまいさを強調します。
論文 参考訳(メタデータ) (2022-10-13T23:57:40Z) - Learning 6D Pose Estimation from Synthetic RGBD Images for Robotic
Applications [0.6299766708197883]
提案したパイプラインは、興味のある対象のために大量の写真リアリスティックなRGBD画像を生成することができる。
オブジェクト検出器YOLO-V4-tinyと6次元ポーズ推定アルゴリズムPVN3Dを統合し,リアルタイム2次元ポーズ推定手法を開発した。
結果として得られたネットワークは、LineModデータセットで評価した場合の最先端手法と比較して、競合性能を示す。
論文 参考訳(メタデータ) (2022-08-30T14:17:15Z) - Generative models-based data labeling for deep networks regression:
application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。
従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。
マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-09T09:06:51Z) - Sim-to-Real 6D Object Pose Estimation via Iterative Self-training for
Robotic Bin-picking [98.5984733963713]
コスト効率の良いロボットグルーピングを容易にするために,シミュレート・トゥ・リアルな6次元オブジェクトのポーズ推定のための反復的自己学習フレームワークを提案する。
我々は、豊富な仮想データを合成するためのフォトリアリスティックシミュレータを構築し、これを初期ポーズ推定ネットワークのトレーニングに利用する。
このネットワークは教師モデルの役割を担い、未ラベルの実データに対するポーズ予測を生成する。
論文 参考訳(メタデータ) (2022-04-14T15:54:01Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。