論文の概要: Few-Shot Adaptation of Grounding DINO for Agricultural Domain
- arxiv url: http://arxiv.org/abs/2504.07252v1
- Date: Wed, 09 Apr 2025 19:57:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:21:00.841996
- Title: Few-Shot Adaptation of Grounding DINO for Agricultural Domain
- Title(参考訳): 農業領域における地すべりダイノのわずかな適応
- Authors: Rajhans Singh, Rafael Bidese Puhl, Kshitiz Dhakal, Sudhir Sornapudi,
- Abstract要約: Grounding-DINOのようなオープンセットオブジェクト検出モデルは、テキストプロンプト入力に基づいて興味のある領域を検出する潜在的なソリューションを提供する。
そこで本研究では,テキストエンコーダモジュールを除去することで,グラウンディング・ディノアーキテクチャを単純化する,効率的な数ショット適応手法を提案する。
本手法は, 植物雑草の検出, 植物数, 昆虫の識別, 果実数, リモートセンシングタスクなど, 複数の農業データセットにまたがる優れた性能を実現する。
- 参考スコア(独自算出の注目度): 0.29998889086656577
- License:
- Abstract: Deep learning models are transforming agricultural applications by enabling automated phenotyping, monitoring, and yield estimation. However, their effectiveness heavily depends on large amounts of annotated training data, which can be labor and time intensive. Recent advances in open-set object detection, particularly with models like Grounding-DINO, offer a potential solution to detect regions of interests based on text prompt input. Initial zero-shot experiments revealed challenges in crafting effective text prompts, especially for complex objects like individual leaves and visually similar classes. To address these limitations, we propose an efficient few-shot adaptation method that simplifies the Grounding-DINO architecture by removing the text encoder module (BERT) and introducing a randomly initialized trainable text embedding. This method achieves superior performance across multiple agricultural datasets, including plant-weed detection, plant counting, insect identification, fruit counting, and remote sensing tasks. Specifically, it demonstrates up to a $\sim24\%$ higher mAP than fully fine-tuned YOLO models on agricultural datasets and outperforms previous state-of-the-art methods by $\sim10\%$ in remote sensing, under few-shot learning conditions. Our method offers a promising solution for automating annotation and accelerating the development of specialized agricultural AI solutions.
- Abstract(参考訳): ディープラーニングモデルは、自動表現型付け、モニタリング、収量推定を可能にして、農業応用を変革している。
しかし、その効果は大量の注釈付きトレーニングデータに大きく依存する。
オープンセットオブジェクト検出の最近の進歩、特にGrounding-DINOのようなモデルは、テキストプロンプト入力に基づいて興味のある領域を検出する潜在的なソリューションを提供する。
初期のゼロショット実験は、特に個々の葉や視覚的に類似したクラスのような複雑なオブジェクトに対して、効果的なテキストプロンプトを作成する上での課題を明らかにした。
そこで本研究では,テキストエンコーダモジュール (BERT) を除去し,ランダムに初期化可能なテキスト埋め込みを導入することにより,グラウンディング・ディノアーキテクチャを単純化する,効率的な数ショット適応手法を提案する。
本手法は, 植物雑草の検出, 植物数, 昆虫の識別, 果実数, リモートセンシングタスクなど, 複数の農業データセットにまたがる優れた性能を実現する。
具体的には、農業データセット上で完全に調整されたYOLOモデルよりも$\sim24\%$のmAPを示し、数ショットの学習条件下では、リモートセンシングで$\sim10\%の従来の最先端のメソッドより優れている。
本手法は、アノテーションの自動化と、専門農業用AIソリューションの開発を加速するための有望なソリューションを提供する。
関連論文リスト
- WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields [0.7421845364041001]
雑草は作物の収穫が減少する主な原因の1つであるが、現在の雑草の慣行は、効率的で標的とした方法で雑草を管理するのに失敗している。
農作物畑における作物と雑草のセマンティックスとインスタンスセグメンテーションのための新しいデータセットを提案する。
論文 参考訳(メタデータ) (2025-02-18T18:13:19Z) - Edge-AI for Agriculture: Lightweight Vision Models for Disease Detection in Resource-Limited Settings [0.0]
提案システムは,エッジデバイスへの展開に最適化された高度なオブジェクト検出,分類,セグメンテーションモデルを統合する。
本研究は, 精度, 計算効率, 一般化能力に着目し, 各種最先端モデルの性能を評価する。
論文 参考訳(メタデータ) (2024-12-23T06:48:50Z) - Explainable AI in Grassland Monitoring: Enhancing Model Performance and
Domain Adaptability [0.6131022957085438]
草原は高い生物多様性と複数の生態系サービスを提供する能力で知られている。
指標植物の自動識別の課題は、大規模な草地モニタリングの鍵となる障害である。
本稿では,移動学習と草地モニタリングへのXAIアプローチを中心に,後者の2つの課題を考察する。
論文 参考訳(メタデータ) (2023-12-13T10:17:48Z) - Embedding-based Retrieval with LLM for Effective Agriculture Information
Extracting from Unstructured Data [5.573704309892796]
農業用文書から人的介入を最小限に抑えて構造化されたデータを抽出するために,ドメインに依存しない一般学習型大規模言語モデル(LLM)について検討する。
既存の手法と比較して,提案手法は効率を保ちながらベンチマークの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2023-08-06T13:18:38Z) - A Novel Dataset for Evaluating and Alleviating Domain Shift for Human
Detection in Agricultural Fields [59.035813796601055]
トレーニングセットの分布外のデータに展開した場合、ドメインシフトが、よく知られたオブジェクト検出データセット上で訓練された人間の検出モデルに与える影響を評価する。
我々は、ロボットティプラットフォームを用いて、農業ロボット応用の文脈で収集されたOpenDR Humans in Fieldデータセットを紹介した。
論文 参考訳(メタデータ) (2022-09-27T07:04:28Z) - Generative models-based data labeling for deep networks regression:
application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。
従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。
マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-09T09:06:51Z) - Learning Feature Decomposition for Domain Adaptive Monocular Depth
Estimation [51.15061013818216]
改良されたアプローチは、深層学習の進歩で大きな成功をもたらしたが、それらは大量の地底深度アノテーションに依存している。
教師なしドメイン適応(UDA)は、教師付き学習の制約を緩和するため、ラベル付きソースデータからラベルなしターゲットデータに知識を転送する。
本稿では,その特徴空間をコンテンツやスタイルコンポーネントに分解することを学ぶための,学習特徴分解 for Adaptation (LFDA) と呼ばれる新しいMDEのためのUDA手法を提案する。
論文 参考訳(メタデータ) (2022-07-30T08:05:35Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Learning to Augment for Data-Scarce Domain BERT Knowledge Distillation [55.34995029082051]
本稿では,データスカース領域BERT知識蒸留のための拡張学習法を提案する。
提案手法が4つの異なるタスクにおける最先端のベースラインを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2021-01-20T13:07:39Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。