論文の概要: CBAM-STN-TPS-YOLO: Enhancing Agricultural Object Detection through Spatially Adaptive Attention Mechanisms
- arxiv url: http://arxiv.org/abs/2506.07357v1
- Date: Mon, 09 Jun 2025 02:11:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.777998
- Title: CBAM-STN-TPS-YOLO: Enhancing Agricultural Object Detection through Spatially Adaptive Attention Mechanisms
- Title(参考訳): CBAM-STN-TPS-YOLO:空間適応型注意機構による農業用物体検出の強化
- Authors: Satvik Praveen, Yoonsung Jung,
- Abstract要約: オブジェクト検出は、植物モニタリング、病気検出、収量推定のための精密農業において不可欠である。
本研究では,TPS(Thin-Plate Splines)をSpatial Transformer Networks(Spatial Transformer Networks)に統合し,フレキシブルで非剛性な空間変換を実現するモデルCBAM-STN-TPS-YOLOを提案する。
排卵量の多い植物成長データセットとPhenotypingデータセットでは,STN-YOLOよりも精度,リコール,mAPが優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection is vital in precision agriculture for plant monitoring, disease detection, and yield estimation. However, models like YOLO struggle with occlusions, irregular structures, and background noise, reducing detection accuracy. While Spatial Transformer Networks (STNs) improve spatial invariance through learned transformations, affine mappings are insufficient for non-rigid deformations such as bent leaves and overlaps. We propose CBAM-STN-TPS-YOLO, a model integrating Thin-Plate Splines (TPS) into STNs for flexible, non-rigid spatial transformations that better align features. Performance is further enhanced by the Convolutional Block Attention Module (CBAM), which suppresses background noise and emphasizes relevant spatial and channel-wise features. On the occlusion-heavy Plant Growth and Phenotyping (PGP) dataset, our model outperforms STN-YOLO in precision, recall, and mAP. It achieves a 12% reduction in false positives, highlighting the benefits of improved spatial flexibility and attention-guided refinement. We also examine the impact of the TPS regularization parameter in balancing transformation smoothness and detection performance. This lightweight model improves spatial awareness and supports real-time edge deployment, making it ideal for smart farming applications requiring accurate and efficient monitoring.
- Abstract(参考訳): オブジェクト検出は、植物モニタリング、病気検出、収量推定のための精密農業において不可欠である。
しかし、YOLOのようなモデルは、オクルージョン、不規則な構造、バックグラウンドノイズに悩まされ、検出精度が低下する。
空間変換ネットワーク(STN)は学習変換によって空間不変性を向上するが,アフィンマッピングは屈曲葉や重なりなどの非剛性変形には不十分である。
本稿では,TPS(Thin-Plate Splines)をSTNに組み込んだCBAM-STN-TPS-YOLOを提案する。
CBAM(Convolutional Block Attention Module)により、バックグラウンドノイズを抑制し、関連する空間的およびチャネル的特徴を強調する。
排卵量の多い植物成長とPGP(Phenotyping)データセットでは,STN-YOLOよりも精度,リコール,mAPが優れている。
偽陽性の12%の減少を実現し、空間的柔軟性の改善と注意誘導改善の利点を強調している。
また,TPS正則化パラメータが変換の滑らかさと検出性能のバランスに与える影響についても検討した。
この軽量モデルは、空間認識を改善し、リアルタイムのエッジデプロイメントをサポートする。
関連論文リスト
- Adaptive Spatial Augmentation for Semi-supervised Semantic Segmentation [51.645152962504056]
半教師付きセマンティックセグメンテーションでは、データ拡張は弱い一貫性の規則化フレームワークにおいて重要な役割を果たす。
空間増強はSSSSのモデルトレーニングに寄与するが,弱い面と強い面の間には一貫性のないマスクが生じる。
本稿では,各インスタンスのエントロピーに基づいて動的に拡張を調整する適応的拡張戦略を提案する。
論文 参考訳(メタデータ) (2025-05-29T13:35:48Z) - ACMamba: Fast Unsupervised Anomaly Detection via An Asymmetrical Consensus State Space Model [51.83639270669481]
ハイパースペクトル画像(HSI)における教師なし異常検出は、背景から未知のターゲットを検出することを目的としている。
HSI研究は、HSIの高次元特性と高密度サンプリングベーストレーニングパラダイムにより、計算コストの急激さによって妨げられている。
計算コストを大幅に削減する非対称コンセンサス状態空間モデル(ACMamba)を提案する。
論文 参考訳(メタデータ) (2025-04-16T05:33:42Z) - Model Hemorrhage and the Robustness Limits of Large Language Models [119.46442117681147]
大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。
この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文 参考訳(メタデータ) (2025-03-31T10:16:03Z) - Spatial-Spectral Diffusion Contrastive Representation Network for Hyperspectral Image Classification [8.600534616819333]
本稿では,空間スペクトル拡散コントラスト表現ネットワーク(DiffCRN)を提案する。
DiffCRNは、高スペクトル画像分類のための拡散確率モデル(DDPM)とコントラスト学習(CL)の組み合わせに基づく。
広く使われている4つのHSIデータセットを用いて実験を行い、提案したDiffCRNの性能改善を実証した。
論文 参考訳(メタデータ) (2025-02-27T02:34:23Z) - SPFFNet: Strip Perception and Feature Fusion Spatial Pyramid Pooling for Fabric Defect Detection [0.0]
YOLOv11に基づくファブリック欠陥検出モデルを提案する。
SPM(Strip Perception Module)を導入し,マルチスケールのコンボリューションにより機能キャプチャを改善する。
また,適応重み付き共振器(FECIoU)の新たな拡張完全交叉法を提案する。
論文 参考訳(メタデータ) (2025-02-03T15:33:11Z) - Scalable and Effective Negative Sample Generation for Hyperedge Prediction [55.9298019975967]
ハイパーエッジ予測は、Webベースのアプリケーションにおける複雑なマルチエンタリティ相互作用を理解するために不可欠である。
従来の手法では、正と負のインスタンスの不均衡により、高品質な負のサンプルを生成するのが困難であることが多い。
本稿では,これらの課題に対処するために拡散モデルを利用するハイパーエッジ予測(SEHP)フレームワークのスケーラブルで効果的な負のサンプル生成について述べる。
論文 参考訳(メタデータ) (2024-11-19T09:16:25Z) - Bi-TTA: Bidirectional Test-Time Adapter for Remote Physiological Measurement [25.11883761217408]
リモート光胸腺撮影(r)は、カメラのみを用いて生理的信号を監視する非侵襲的アプローチとして注目されている。
約束にもかかわらず、新しいドメインへのrモデルの適応性は、生理的信号の環境感受性のために妨げられている。
Bi-TTA(Bidirectional Test-Time Adapter)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2024-09-25T19:55:20Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Spatial Transformer Network YOLO Model for Agricultural Object Detection [0.3124884279860061]
本稿では,空間変換器ネットワーク(STN)をYOLOに統合し,性能を向上させる手法を提案する。
提案するSTN-YOLOは,画像の重要な領域に着目し,モデルの有効性を高めることを目的としている。
農業オブジェクト検出のためのベンチマークデータセットと、最先端の植物表現型温室施設からの新たなデータセットにSTN-YOLOを適用した。
論文 参考訳(メタデータ) (2024-07-31T14:53:41Z) - Towards Overcoming False Positives in Visual Relationship Detection [95.15011997876606]
視覚的関係検出(VRD)における偽陽性率の高い原因について検討する。
本稿では,偽陽性の影響を軽減する堅牢なVRDフレームワークとして,Spatially-Aware Balanced negative pRoposal sAmpling(SABRA)を提案する。
論文 参考訳(メタデータ) (2020-12-23T06:28:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。