論文の概要: M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation
- arxiv url: http://arxiv.org/abs/2407.11275v1
- Date: Mon, 15 Jul 2024 22:50:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 19:02:01.236289
- Title: M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation
- Title(参考訳): M18K: 総合的なRGB-Dデータセットとマッシュルーム検出とインスタンスセグメンテーションのためのベンチマーク
- Authors: Abdollah Zakeri, Mulham Fawakherji, Jiming Kang, Bikram Koirala, Venkatesh Balan, Weihang Zhu, Driss Benhaddou, Fatima A. Merchant,
- Abstract要約: 本稿では,キノコ検出専用のデータセットを提供することにより,農業プロセスの自動化に寄与する。
Intel RealSense D405カメラで撮影された423のRGB-Dイメージペアに18,000以上のキノコインスタンスがあり、キノコ固有のデータセットのギャップを埋める。
- 参考スコア(独自算出の注目度): 0.7528462379265576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automating agricultural processes holds significant promise for enhancing efficiency and sustainability in various farming practices. This paper contributes to the automation of agricultural processes by providing a dedicated mushroom detection dataset related to automated harvesting, growth monitoring, and quality control of the button mushroom produced using Agaricus Bisporus fungus. With over 18,000 mushroom instances in 423 RGB-D image pairs taken with an Intel RealSense D405 camera, it fills the gap in mushroom-specific datasets and serves as a benchmark for detection and instance segmentation algorithms in smart mushroom agriculture. The dataset, featuring realistic growth environment scenarios with comprehensive annotations, is assessed using advanced detection and instance segmentation algorithms. The paper details the dataset's characteristics, evaluates algorithmic performance, and for broader applicability, we have made all resources publicly available including images, codes, and trained models via our GitHub repository https://github.com/abdollahzakeri/m18k
- Abstract(参考訳): 農業プロセスの自動化は、様々な農業慣行における効率性と持続可能性を高めるための重要な約束である。
本稿では,Agaricus Bisporus fungusを用いたボタンキノコの自動収穫,成長モニタリング,品質管理に関連するキノコ検出データセットを提供することにより,農業プロセスの自動化に寄与する。
Intel RealSense D405カメラで撮影された423のRGB-Dイメージペアに18,000以上のキノコインスタンスがあり、キノコ固有のデータセットのギャップを埋め、スマートキノコ農業における検出とインスタンスセグメンテーションアルゴリズムのベンチマークとして機能する。
包括的なアノテーションを備えた現実的な成長環境シナリオを特徴とするデータセットは、高度な検出アルゴリズムとインスタンスセグメンテーションアルゴリズムを使用して評価される。
論文ではデータセットの特徴を詳述し、アルゴリズムのパフォーマンスを評価し、より広範な適用性のために、GitHubリポジトリ https://github.com/abdollahzakeri/m18kを通じて、イメージ、コード、トレーニングされたモデルを含むすべてのリソースを公開しました。
関連論文リスト
- MaizeEar-SAM: Zero-Shot Maize Ear Phenotyping [0.9659487278134938]
エーカー当たりの穀物収量は、エーカー当たりの植物数、植物当たりの耳数、耳当たりの核数、および平均核重量を乗じることで計算される。
これら2つの特性を測定する従来の手作業の手法は時間を要するため、大規模なデータ収集が制限される。
提案手法は多種多様なトウモロコシの耳にまたがる1列あたりのカーネル数を同定する。
論文 参考訳(メタデータ) (2025-02-19T03:18:29Z) - WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields [0.7421845364041001]
雑草は作物の収穫が減少する主な原因の1つであるが、現在の雑草の慣行は、効率的で標的とした方法で雑草を管理するのに失敗している。
農作物畑における作物と雑草のセマンティックスとインスタンスセグメンテーションのための新しいデータセットを提案する。
論文 参考訳(メタデータ) (2025-02-18T18:13:19Z) - TimberVision: A Multi-Task Dataset and Framework for Log-Component Segmentation and Tracking in Autonomous Forestry Operations [2.0499240875881997]
51kのトランク成分を含む2k以上の注釈付きRGB画像からなるTimberVisionデータセットを紹介した。
我々は、両方のタスクに対してモデルによって検出されたコンポーネントを統一されたトランク表現に融合する汎用フレームワークを導入する。
私たちのソリューションは幅広いアプリケーションシナリオに適しており、他のセンサーのモダリティと簡単に組み合わせることができる。
論文 参考訳(メタデータ) (2025-01-13T14:30:01Z) - Beyond Labels: A Self-Supervised Framework with Masked Autoencoders and Random Cropping for Breast Cancer Subtype Classification [0.3374875022248865]
この領域でコンピュータビジョンタスクに適した自己教師型埋め込みを学習する。
私たちはWSIから自動的に大規模なデータセットを生成します。
我々は、BRACSデータセット上でのモデルの性能を評価し、既存のベンチマークと比較する。
論文 参考訳(メタデータ) (2024-10-15T19:13:05Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - Segment Any Events via Weighted Adaptation of Pivotal Tokens [85.39087004253163]
本稿では,Segment Anything Models (SAM) をイベントデータと統合する上で,難易度の高い課題に焦点を当てる。
本稿では,RGB画像とイベントデータからのトークン埋め込みのアライメントを最適化するマルチスケールな特徴蒸留手法を提案する。
論文 参考訳(メタデータ) (2023-12-24T12:47:08Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - GrowliFlower: An image time series dataset for GROWth analysis of
cauLIFLOWER [2.8247971782279615]
この記事では、2020年と2021年に取得した0.39と0.60haの2つの監視されたカリフラワーフィールドのイメージベースUAV時系列データセットであるGrowliFlowerについて述べる。
このデータセットは、約14,000個の植物座標が導出され提供されるRGBおよび多スペクトル正光を含む。
このデータセットは、発生段階、植物、カリフラワーサイズを含む740種の植物の表現型形質を収集する。
論文 参考訳(メタデータ) (2022-04-01T08:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。