論文の概要: iNatAg: Multi-Class Classification Models Enabled by a Large-Scale Benchmark Dataset with 4.7M Images of 2,959 Crop and Weed Species
- arxiv url: http://arxiv.org/abs/2503.20068v1
- Date: Tue, 25 Mar 2025 21:04:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:20:43.600899
- Title: iNatAg: Multi-Class Classification Models Enabled by a Large-Scale Benchmark Dataset with 4.7M Images of 2,959 Crop and Weed Species
- Title(参考訳): iNatAg:2,959種および雑草の4.7M画像を用いた大規模ベンチマークデータセットで実現可能なマルチクラス分類モデル
- Authors: Naitik Jain, Amogh Joshi, Mason Earles,
- Abstract要約: iNatAgは2,959種の異なる作物と雑草の470万枚以上の画像を含む大規模な画像データセットである。
iNatAgには各大陸のデータが含まれており、自然画像のキャプチャや環境の変化を正確に反映している。
大規模種のカバー、マルチタスクラベル、地理的多様性を組み合わせることで、iNatAgは堅牢で位置対応の農業分類システムを構築するための新しい基盤を提供する。
- 参考スコア(独自算出の注目度): 0.8795327496993479
- License:
- Abstract: Accurate identification of crop and weed species is critical for precision agriculture and sustainable farming. However, it remains a challenging task due to a variety of factors -- a high degree of visual similarity among species, environmental variability, and a continued lack of large, agriculture-specific image data. We introduce iNatAg, a large-scale image dataset which contains over 4.7 million images of 2,959 distinct crop and weed species, with precise annotations along the taxonomic hierarchy from binary crop/weed labels to specific species labels. Curated from the broader iNaturalist database, iNatAg contains data from every continent and accurately reflects the variability of natural image captures and environments. Enabled by this data, we train benchmark models built upon the Swin Transformer architecture and evaluate the impact of various modifications such as the incorporation of geospatial data and LoRA finetuning. Our best models achieve state-of-the-art performance across all taxonomic classification tasks, achieving 92.38\% on crop and weed classification. Furthermore, the scale of our dataset enables us to explore incorrect misclassifications and unlock new analytic possiblities for plant species. By combining large-scale species coverage, multi-task labels, and geographic diversity, iNatAg provides a new foundation for building robust, geolocation-aware agricultural classification systems. We release the iNatAg dataset publicly through AgML (https://github.com/Project-AgML/AgML), enabling direct access and integration into agricultural machine learning workflows.
- Abstract(参考訳): 作物と雑草の正確な識別は、精密農業と持続可能な農業にとって重要である。
しかし、種間の視覚的類似度の高さ、環境変動性、大規模で農業固有の画像データの欠如など、さまざまな要因により、これは依然として困難な課題である。
iNatAgは2,959種の異なる作物と雑草の470万枚以上の画像を含む大規模な画像データセットである。
iNatAgは広いiNaturalistデータベースから算出され、各大陸のデータを含み、自然画像のキャプチャや環境の変化を正確に反映している。
このデータにより、Swin Transformerアーキテクチャ上に構築されたベンチマークモデルをトレーニングし、地理空間データの導入やLoRA微調整など、様々な変更の影響を評価する。
最良モデルはすべての分類タスクにおいて最先端のパフォーマンスを達成し、作物と雑草の分類において92.38\%を達成している。
さらに, データセットのスケールにより, 不正確な誤分類を探索し, 植物種に対する新たな解析的可能性の開放を可能にした。
大規模種のカバー、マルチタスクラベル、地理的多様性を組み合わせることで、iNatAgは堅牢で位置対応の農業分類システムを構築するための新しい基盤を提供する。
我々は、AgML(https://github.com/Project-AgML/AgML)を通じてiNatAgデータセットを公開し、農業機械学習ワークフローへの直接アクセスと統合を可能にします。
関連論文リスト
- Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - HarvestNet: A Dataset for Detecting Smallholder Farming Activity Using
Harvest Piles and Remote Sensing [50.4506590177605]
HarvestNetは、2020-2023年のエチオピアのティグレイとアムハラの農場の存在をマッピングするためのデータセットである。
本研究は,多くの小作システムの特徴ある収穫杭の検出に基づく新しい手法を提案する。
本研究は, 農作物のリモートセンシングが, 食品の安全地帯において, よりタイムリーかつ正確な農地評価に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-08-23T11:03:28Z) - CWD30: A Comprehensive and Holistic Dataset for Crop Weed Recognition in
Precision Agriculture [1.64709990449384]
精密農業における作物雑草認識タスクに適した大規模・多種多様・包括的・階層的データセットであるCWD30データセットを提示する。
CWD30は20種の雑草と10種の高解像度画像を219,770枚以上、様々な成長段階、複数の視角、環境条件を含む。
データセットの階層的な分類は、きめ細かい分類を可能にし、より正確で堅牢で一般化可能なディープラーニングモデルの開発を促進する。
論文 参考訳(メタデータ) (2023-05-17T09:39:01Z) - Agave crop segmentation and maturity classification with deep learning
data-centric strategies using very high-resolution satellite imagery [101.18253437732933]
超高解像度衛星画像を用いたAgave tequilana Weber azul crop segmentation and mature classificationを提案する。
実世界の深層学習問題を,作物の選別という非常に具体的な文脈で解決する。
結果として得られた正確なモデルにより、大規模地域で生産予測を行うことができる。
論文 参考訳(メタデータ) (2023-03-21T03:15:29Z) - The Power of Transfer Learning in Agricultural Applications: AgriNet [1.9087335681007478]
我々は19以上の地理的な場所から160万の農業画像を集めたAgriNetデータセットを提案する。
また、5つのImageNetアーキテクチャ上で事前訓練されたモデルのセットであるAgriNetモデルを紹介します。
提案したすべてのモデルでは、植物種、病気、害虫、雑草の423種を87%の精度で正確に分類することが判明した。
論文 参考訳(メタデータ) (2022-07-08T13:15:16Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - Multi-Domain Few-Shot Learning and Dataset for Agricultural Applications [0.0]
そこで本研究では,いくつかのサンプルから異なる害虫,植物,その病原体を自動分類する手法を提案する。
埋め込みを生成する機能抽出器を学習し、Transformerを使って埋め込みを更新する。
モデル全体を包括的に解析するために42の実験を行い、画像分類ベンチマークで最大14%と24%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2021-09-21T04:20:18Z) - Multi-resolution Outlier Pooling for Sorghum Classification [4.434302808728865]
Sorghum-100データセットは,最先端のガントリーシステムによって得られたソルガムのRGB画像の大規模なデータセットである。
Dynamic Outlier Poolingと呼ばれる新しいグローバルプール戦略は、このタスクにおける標準的なグローバルプール戦略より優れています。
論文 参考訳(メタデータ) (2021-06-10T13:57:33Z) - Two-View Fine-grained Classification of Plant Species [66.75915278733197]
本研究では,2視点の葉のイメージ表現に基づく新しい手法と,植物種の粒度認識のための階層的分類戦略を提案する。
シームズ畳み込みニューラルネットワークに基づく深度測定は、多数のトレーニングサンプルへの依存を減らし、新しい植物種に拡張性を持たせるために用いられる。
論文 参考訳(メタデータ) (2020-05-18T21:57:47Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z) - Agriculture-Vision: A Large Aerial Image Database for Agricultural
Pattern Analysis [110.30849704592592]
本稿では,農業パターンのセマンティックセグメンテーションのための大規模空中農地画像データセットであるGarmry-Visionを提案する。
各画像はRGBと近赤外線(NIR)チャンネルで構成され、解像度は1ピクセルあたり10cmである。
農家にとって最も重要な9種類のフィールド異常パターンに注釈を付ける。
論文 参考訳(メタデータ) (2020-01-05T20:19:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。