論文の概要: A Multi-Strategy Framework for Enhancing Shatian Pomelo Detection in Real-World Orchards
- arxiv url: http://arxiv.org/abs/2510.09948v1
- Date: Sat, 11 Oct 2025 01:30:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.709316
- Title: A Multi-Strategy Framework for Enhancing Shatian Pomelo Detection in Real-World Orchards
- Title(参考訳): 実世界の果樹園におけるシャチアンポメロ検出の強化のためのマルチストラテジーフレームワーク
- Authors: Pan Wang, Yihao Hu, Xiaodong Bai, Aiping Yang, Xiangxiang Li, Meiping Ding, Jianguo Yao,
- Abstract要約: 本研究は,シャチのポメロ検出の精度に影響を与える4つの重要な課題を明らかにする。
これらの課題を軽減するため,本稿ではマルチストラテジー・フレームワークを提案する。
提案するネットワークは,他の最先端検出手法と比較して優れた性能を示す。
- 参考スコア(独自算出の注目度): 5.779478641472218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a specialty agricultural product with a large market scale, Shatian pomelo necessitates the adoption of automated detection to ensure accurate quantity and meet commercial demands for lean production. Existing research often involves specialized networks tailored for specific theoretical or dataset scenarios, but these methods tend to degrade performance in real-world. Through analysis of factors in this issue, this study identifies four key challenges that affect the accuracy of Shatian pomelo detection: imaging devices, lighting conditions, object scale variation, and occlusion. To mitigate these challenges, a multi-strategy framework is proposed in this paper. Firstly, to effectively solve tone variation introduced by diverse imaging devices and complex orchard environments, we utilize a multi-scenario dataset, STP-AgriData, which is constructed by integrating real orchard images with internet-sourced data. Secondly, to simulate the inconsistent illumination conditions, specific data augmentations such as adjusting contrast and changing brightness, are applied to the above dataset. Thirdly, to address the issues of object scale variation and occlusion in fruit detection, an REAS-Det network is designed in this paper. For scale variation, RFAConv and C3RFEM modules are designed to expand and enhance the receptive fields. For occlusion variation, a multi-scale, multi-head feature selection structure (MultiSEAM) and soft-NMS are introduced to enhance the handling of occlusion issues to improve detection accuracy. The results of these experiments achieved a precision(P) of 87.6%, a recall (R) of 74.9%, a mAP@.50 of 82.8%, and a mAP@.50:.95 of 53.3%. Our proposed network demonstrates superior performance compared to other state-of-the-art detection methods.
- Abstract(参考訳): 市場規模が大きい特産品として、シャティアン・ポメロは正確な量を確保し、リーン生産の商業的要求を満たすために自動検出を採用する必要がある。
既存の研究は、特定の理論やデータセットのシナリオに適した特殊なネットワークを伴っていることが多いが、これらの手法は実世界での性能を低下させる傾向がある。
本研究は,シャチのポメロ検出の精度に影響を与える4つの重要な課題,すなわち撮像装置,照明条件,物体スケールの変動,閉塞について分析した。
これらの課題を軽減するため,本稿ではマルチストラテジー・フレームワークを提案する。
まず,多様な画像装置や複雑な果樹園環境によってもたらされるトーン変動を効果的に解消するために,実果樹園イメージとインターネットソースデータを統合することで構築されたマルチシナリオデータセットであるSTP-AgriDataを利用する。
第2に、一貫性のない照明条件をシミュレートするために、上記データセットにコントラストの調整や明るさの変化などの特定のデータ拡張を適用する。
第3に,REAS-Detネットワークを設計した。
RFAConvとC3RFEMモジュールは、スケールの変動のために、受容場を拡張して拡張するように設計されている。
咬合変動に対して,マルチスケールのマルチヘッド特徴選択構造 (MultiSEAM) とソフトNMSを導入し,閉塞問題の取り扱いを改善し,検出精度を向上させる。
これらの実験の結果は87.6%の精度(P)、74.9%のリコール(R)、82.8%のmAP@.50、53.3%のmAP@.50:.95の精度を達成した。
提案するネットワークは,他の最先端検出手法と比較して優れた性能を示す。
関連論文リスト
- A Comparative Benchmark of Real-time Detectors for Blueberry Detection towards Precision Orchard Management [2.667064587590596]
本研究では,先進的リアルタイム物体検出器の比較ベンチマーク解析を行った。
このデータセットは、2022-2023シーズンにスマートフォンで収集された671枚の天蓋画像からなる。
YOLOモデルのうち、YOLOv12mはmAP@50の93.3%で最高の精度を達成した。
論文 参考訳(メタデータ) (2025-09-24T21:42:24Z) - MSSDF: Modality-Shared Self-supervised Distillation for High-Resolution Multi-modal Remote Sensing Image Learning [25.381211868583826]
本稿では,高解像度RGB画像,マルチスペクトルデータ,デジタル表面モデル(DSM)を事前学習に用いるマルチモーダル自己教師学習フレームワークを提案する。
提案手法は,シーン分類,セマンティックセグメンテーション,変化検出,オブジェクト検出,深度推定など,典型的なリモートセンシングアプリケーションを対象として,複数のダウンストリームタスクに対して評価を行う。
論文 参考訳(メタデータ) (2025-06-11T02:01:36Z) - Category-Level 6D Object Pose Estimation in Agricultural Settings Using a Lattice-Deformation Framework and Diffusion-Augmented Synthetic Data [22.68237431620023]
我々は、RGB入力にのみ依存するカテゴリ6D推定のための新しいフレームワークを開発する。
各種形状,大きさ,熟度の評価に挑戦するベンチマーク評価において,本フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-05-30T14:25:52Z) - RAAD-LLM: Adaptive Anomaly Detection Using LLMs and RAG Integration [2.879328762187361]
本稿では,適応型異常検出のための新しいフレームワークであるRAAD-LLMを提案する。
ドメイン固有の知識を効果的に活用することにより、RAAD-LLMは時系列データにおける異常の検出を強化する。
実際のデータセットでは,70.7%から88.6%に精度が向上した。
論文 参考訳(メタデータ) (2025-03-04T17:20:43Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。