論文の概要: TomatoScanner: phenotyping tomato fruit based on only RGB image
- arxiv url: http://arxiv.org/abs/2503.05568v1
- Date: Fri, 07 Mar 2025 16:47:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 15:56:33.641752
- Title: TomatoScanner: phenotyping tomato fruit based on only RGB image
- Title(参考訳): トマトスキャナー:RGB画像のみに基づくトマト果実の表現型化
- Authors: Xiaobei Zhao, Xiangrong Zeng, Yihang Ma, Pengjin Tang, Xiang Li,
- Abstract要約: トマトの温室では、表現型測定は、研究者や農家が作物の生育を監視する上で有意義である。
いくつかの研究では、手動表現の代替としてコンピュータビジョンに基づく手法が研究されている。
本稿では,RGB画像が入力に必要なすべてである非接触トマト果実表現法であるTomatoScannerを提案する。
- 参考スコア(独自算出の注目度): 4.217003794764974
- License:
- Abstract: In tomato greenhouse, phenotypic measurement is meaningful for researchers and farmers to monitor crop growth, thereby precisely control environmental conditions in time, leading to better quality and higher yield. Traditional phenotyping mainly relies on manual measurement, which is accurate but inefficient, more importantly, endangering the health and safety of people. Several studies have explored computer vision-based methods to replace manual phenotyping. However, the 2D-based need extra calibration, or cause destruction to fruit, or can only measure limited and meaningless traits. The 3D-based need extra depth camera, which is expensive and unacceptable for most farmers. In this paper, we propose a non-contact tomato fruit phenotyping method, titled TomatoScanner, where RGB image is all you need for input. First, pixel feature is extracted by instance segmentation of our proposed EdgeYOLO with preprocessing of individual separation and pose correction. Second, depth feature is extracted by depth estimation of Depth Pro. Third, pixel and depth feature are fused to output phenotype results in reality. We establish self-built Tomato Phenotype Dataset to test TomatoScanner, which achieves excellent phenotyping on width, height, vertical area and volume, with median relative error of 5.63%, 7.03%, -0.64% and 37.06%, respectively. We propose and add three innovative modules - EdgeAttention, EdgeLoss and EdgeBoost - into EdgeYOLO, to enhance the segmentation accuracy on edge portion. Precision and mean Edge Error greatly improve from 0.943 and 5.641% to 0.986 and 2.963%, respectively. Meanwhile, EdgeYOLO keeps lightweight and efficient, with 48.7 M weights size and 76.34 FPS. Codes and datasets: https://github.com/AlexTraveling/TomatoScanner.
- Abstract(参考訳): トマト温室では、表現型測定は、研究者や農家が作物の生育を監視し、時間とともに環境条件を正確に制御することで、品質と収量の向上につながる。
伝統的な表現型付けは主に手動測定に依存しており、これは正確だが非効率であり、より重要なのは人々の健康と安全を危険にさらすことである。
いくつかの研究では、手動表現の代替としてコンピュータビジョンに基づく手法が研究されている。
しかし、2Dベースでは、余分なキャリブレーションが必要か、果物の破壊を引き起こすか、制限された無意味な特性しか測定できない。
3Dベースのデプスカメラは高価で、ほとんどの農家には受け入れられない。
本稿では,RGB画像が入力に必要なすべてである非接触トマト果実表現法であるTomatoScannerを提案する。
まず,提案するEdgeYOLOのインスタンスセグメンテーションによって画素の特徴を抽出し,個別分離とポーズ補正を前処理する。
次に、深さプロの深さ推定により深さ特徴を抽出する。
第3に、ピクセルと深度の特徴を融合させて、現実の表現型結果を出力する。
TomatoScannerは,5.63%,7.03%,-0.64%,37.06%の相対誤差で,幅,高さ,垂直面積,体積の表現率に優れる。
EdgeYOLOにEdgeAttention、EdgeLoss、EdgeBoostの3つの革新的なモジュールを提案し、エッジ部分のセグメンテーション精度を高める。
精度と平均エッジエラーは、それぞれ0.943と5.641%から0.986と2.963%に大幅に改善された。
一方、EdgeYOLOは軽量で効率的であり、重量は48.7M、FPSは76.34FPSである。
コードとデータセット:https://github.com/AlexTraveling/TomatoScanner。
関連論文リスト
- Aggrotech: Leveraging Deep Learning for Sustainable Tomato Disease Management [0.0]
2つの確立された畳み込みニューラルネットワーク(CNN)を用いた深層学習によるトマト葉病検出手法を提案する。
VGG19とインセプションv3モデルはトマトの葉病検出のためにトマトビレッジデータセット(4525画像)に採用されている。
降水層の93.93%の精度は、作物の健康モニタリングに有用であることを示している。
論文 参考訳(メタデータ) (2025-01-21T11:25:44Z) - MVSDet: Multi-View Indoor 3D Object Detection via Efficient Plane Sweeps [51.44887282336391]
多視点屋内3次元物体検出の課題は、画像から正確な幾何学情報を推測して正確な3次元物体検出を行うことである。
それまでの手法は、幾何推論にNeRFに依存していた。
平面スイープを用いた3次元物体検出のためのMVSDetを提案する。
論文 参考訳(メタデータ) (2024-10-28T21:58:41Z) - Energy-Efficient Uncertainty-Aware Biomass Composition Prediction at the Edge [6.76163770004542]
クローバーを含むハーベージは食物の摂取量を増加させ、牛乳の生産量も増加する。
深層学習アルゴリズムは,草地の直接画像から乾式バイオマス組成を推定する目的で提案されている。
本稿では,既存のディープラーニングソリューションのエネルギー要求を削減するためにフィルタプルーニングを適用して,このギャップを埋めることを提案する。
この課題は, 分散減衰損失を用いたフィルタ解析モデルを用いて, 予測の不確かさを予測し, しきい値を超えた場合, より正確な未解析モデルを用いて再推論を行うことによって解決される。
論文 参考訳(メタデータ) (2024-04-17T10:26:49Z) - Early and Accurate Detection of Tomato Leaf Diseases Using TomFormer [0.3169023552218211]
本稿ではトマト葉病検出のためのトランスフォーマーモデルTomFormerを紹介する。
本稿では,視覚変換器と畳み込みニューラルネットワークを組み合わせた融合モデルを用いて,トマト葉病の検出手法を提案する。
論文 参考訳(メタデータ) (2023-12-26T20:47:23Z) - Visual based Tomato Size Measurement System for an Indoor Farming
Environment [3.176607626141415]
本稿では,3つの低コストRGBDカメラから得られた機械学習モデルと深度画像を組み合わせたサイズ計測手法を提案する。
本システムの性能は, 実のトマト果実と偽の葉を用いた実験室環境で評価した。
我々の3カメラシステムは高さ測定精度0.9114、幅精度0.9443を達成できた。
論文 参考訳(メタデータ) (2023-04-12T22:27:05Z) - Look how they have grown: Non-destructive Leaf Detection and Size
Estimation of Tomato Plants for 3D Growth Monitoring [4.303287713669109]
本稿では,非破壊画像に基づく自動計測システムについて述べる。
Zividの3Dカメラで得られた2Dと3Dのデータを使って、トマトの3D仮想表現(デジタル双生児)を生成する。
実生トマトの総合的な試験を通じて, プラットフォームの性能を測定した。
論文 参考訳(メタデータ) (2023-04-07T12:16:10Z) - Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.10717041384625]
Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文 参考訳(メタデータ) (2023-03-24T04:22:41Z) - MonoGraspNet: 6-DoF Grasping with a Single RGB Image [73.96707595661867]
6-DoFロボットの把握は長続きするが未解決の問題だ。
近年の手法では3次元ネットワークを用いて深度センサから幾何的把握表現を抽出している。
我々はMonoGraspNetと呼ばれるRGBのみの6-DoFグルーピングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-09-26T21:29:50Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Single image deep defocus estimation and its applications [82.93345261434943]
画像パッチを20レベルの曖昧さの1つに分類するために、ディープニューラルネットワークをトレーニングします。
トレーニングされたモデルは、反復重み付きガイドフィルタを適用して改善するパッチのぼかしを決定するために使用される。
その結果、デフォーカスマップは各ピクセルのぼやけた度合いの情報を運ぶ。
論文 参考訳(メタデータ) (2021-07-30T06:18:16Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。