論文の概要: Iterative Optimization Annotation Pipeline and ALSS-YOLO-Seg for Efficient Banana Plantation Segmentation in UAV Imagery
- arxiv url: http://arxiv.org/abs/2410.07955v1
- Date: Wed, 9 Oct 2024 13:19:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 13:53:52.205382
- Title: Iterative Optimization Annotation Pipeline and ALSS-YOLO-Seg for Efficient Banana Plantation Segmentation in UAV Imagery
- Title(参考訳): UAV画像における効率的なバナナプランテーションセグメンテーションのための反復最適化アノテーションパイプラインとALSS-YOLO-Seg
- Authors: Ang He, Ximei Wu, Xing Xu, Jing Chen, Xiaobin Guo, Sheng Xu,
- Abstract要約: UAV画像に最適化された効率的な軽量セグメンテーションモデルであるALSS-YOLO-Segを開発した。
モデルのバックボーンには、チャネル間の情報交換を改善するために、Adaptive Lightweight Channel Splitting and Shuffling (ALSS)モジュールが含まれている。
MSCA(Multi-Scale Channel Attention)モジュールは、マルチスケールの特徴抽出とチャネルアテンションを組み合わせて、ターゲットサイズや複雑な背景の異なる課題に取り組む。
- 参考スコア(独自算出の注目度): 11.048503703669667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise segmentation of Unmanned Aerial Vehicle (UAV)-captured images plays a vital role in tasks such as crop yield estimation and plant health assessment in banana plantations. By identifying and classifying planted areas, crop area can be calculated, which is indispensable for accurate yield predictions. However, segmenting banana plantation scenes requires a substantial amount of annotated data, and manual labeling of these images is both time-consuming and labor-intensive, limiting the development of large-scale datasets. Furthermore, challenges such as changing target sizes, complex ground backgrounds, limited computational resources, and correct identification of crop categories make segmentation even more difficult. To address these issues, we proposed a comprehensive solution. Firstly, we designed an iterative optimization annotation pipeline leveraging SAM2's zero-shot capabilities to generate high-quality segmentation annotations, thereby reducing the cost and time associated with data annotation significantly. Secondly, we developed ALSS-YOLO-Seg, an efficient lightweight segmentation model optimized for UAV imagery. The model's backbone includes an Adaptive Lightweight Channel Splitting and Shuffling (ALSS) module to improve information exchange between channels and optimize feature extraction, aiding accurate crop identification. Additionally, a Multi-Scale Channel Attention (MSCA) module combines multi-scale feature extraction with channel attention to tackle challenges of varying target sizes and complex ground backgrounds.
- Abstract(参考訳): バナナプランテーションにおける収穫量推定や植物健康評価などのタスクにおいて,無人航空機(UAV)の精密セグメンテーションが重要な役割を担っている。
耕作地を特定して分類することにより、正確な収量予測には欠かせない作物面積を計算することができる。
しかし、バナナプランテーションシーンのセグメンテーションには大量の注釈付きデータが必要であり、これらの画像の手動ラベリングには時間と労力がかかり、大規模なデータセットの開発が制限される。
さらに, ターゲットサイズ, 複雑な背景, 限られた計算資源, 作物カテゴリーの正確な識別といった課題により, セグメンテーションがさらに困難になる。
これらの問題に対処するため、我々は包括的な解決策を提案した。
まず、SAM2のゼロショット機能を活用して、高品質なセグメンテーションアノテーションを生成する反復最適化アノテーションパイプラインを設計し、データアノテーションに関連するコストと時間を大幅に削減した。
次に,UAV画像に最適化された効率的な軽量セグメンテーションモデルであるALSS-YOLO-Segを開発した。
モデルのバックボーンには、チャネル間の情報交換を改善し、特徴抽出を最適化し、正確な作物識別を支援するアダプティブ・ライトウェイト・チャネル・スプリッティング・シャッフルング(ALSS)モジュールが含まれている。
さらに、マルチスケールチャネル注意(MSCA)モジュールは、様々なターゲットサイズと複雑な背景の課題に取り組むために、マルチスケールの特徴抽出とチャンネルアテンションを組み合わせる。
関連論文リスト
- High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
SDモデルに先立って、頑健な一般化機能とリッチで多目的な画像表現を活用することにより、高忠実で詳細な生成を保ちながら、推論時間を著しく短縮する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-14T02:49:23Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Improving Data Efficiency for Plant Cover Prediction with Label
Interpolation and Monte-Carlo Cropping [7.993547048820065]
植物群落の組成は環境変化の重要な指標であり、通常生態学的研究で分析される。
本稿では,収集した植生計画時系列のスパースラベルを中間密度・未ラベル画像に補間する手法を提案する。
また,高解像度画像の処理を効率的に行うため,モンテカルロ・クロッピングと呼ばれる新しい手法を導入する。
論文 参考訳(メタデータ) (2023-07-17T15:17:39Z) - SepHRNet: Generating High-Resolution Crop Maps from Remote Sensing
imagery using HRNet with Separable Convolution [3.717258819781834]
本稿では、HRNetと分離可能な畳み込み層を統合し、空間的パターンをキャプチャし、データの時間的パターンをキャプチャする、新たなDeep Learningアプローチを提案する。
提案アルゴリズムは、作物マップの生成において、97.5%の分類精度と55.2%のIoUを高い分類精度で達成する。
論文 参考訳(メタデータ) (2023-07-11T18:07:25Z) - Agave crop segmentation and maturity classification with deep learning
data-centric strategies using very high-resolution satellite imagery [101.18253437732933]
超高解像度衛星画像を用いたAgave tequilana Weber azul crop segmentation and mature classificationを提案する。
実世界の深層学習問題を,作物の選別という非常に具体的な文脈で解決する。
結果として得られた正確なモデルにより、大規模地域で生産予測を行うことができる。
論文 参考訳(メタデータ) (2023-03-21T03:15:29Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - Split-Merge Pooling [36.2980225204665]
スプリット・マージ・プールはサブサンプリングなしで空間情報を保存するために導入された。
本研究では,CityscapesとGTA-5データセットから得られた大規模画像の高密度なセマンティックセマンティックセマンティックセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-13T23:20:30Z) - Super Resolution for Root Imaging [2.0924876102146714]
超解像度(SR)アルゴリズムは、センサーの解像度制限を克服し、ストレージスペースの要求を減らし、後の分析の性能を高めるために望まれる。
畳み込みニューラルネットワーク(CNN)を用いた植物の根の画像向上のためのSRフレームワークを提案する。
我々は、SRモデルが非ルートデータセットでトレーニングされた場合でも、基本的なバイコビックよりも優れる、公開データセットの集合を実証する。
論文 参考訳(メタデータ) (2020-03-30T15:11:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。