論文の概要: M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation
- arxiv url: http://arxiv.org/abs/2407.11275v1
- Date: Mon, 15 Jul 2024 22:50:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 19:02:01.236289
- Title: M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation
- Title(参考訳): M18K: 総合的なRGB-Dデータセットとマッシュルーム検出とインスタンスセグメンテーションのためのベンチマーク
- Authors: Abdollah Zakeri, Mulham Fawakherji, Jiming Kang, Bikram Koirala, Venkatesh Balan, Weihang Zhu, Driss Benhaddou, Fatima A. Merchant,
- Abstract要約: 本稿では,キノコ検出専用のデータセットを提供することにより,農業プロセスの自動化に寄与する。
Intel RealSense D405カメラで撮影された423のRGB-Dイメージペアに18,000以上のキノコインスタンスがあり、キノコ固有のデータセットのギャップを埋める。
- 参考スコア(独自算出の注目度): 0.7528462379265576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automating agricultural processes holds significant promise for enhancing efficiency and sustainability in various farming practices. This paper contributes to the automation of agricultural processes by providing a dedicated mushroom detection dataset related to automated harvesting, growth monitoring, and quality control of the button mushroom produced using Agaricus Bisporus fungus. With over 18,000 mushroom instances in 423 RGB-D image pairs taken with an Intel RealSense D405 camera, it fills the gap in mushroom-specific datasets and serves as a benchmark for detection and instance segmentation algorithms in smart mushroom agriculture. The dataset, featuring realistic growth environment scenarios with comprehensive annotations, is assessed using advanced detection and instance segmentation algorithms. The paper details the dataset's characteristics, evaluates algorithmic performance, and for broader applicability, we have made all resources publicly available including images, codes, and trained models via our GitHub repository https://github.com/abdollahzakeri/m18k
- Abstract(参考訳): 農業プロセスの自動化は、様々な農業慣行における効率性と持続可能性を高めるための重要な約束である。
本稿では,Agaricus Bisporus fungusを用いたボタンキノコの自動収穫,成長モニタリング,品質管理に関連するキノコ検出データセットを提供することにより,農業プロセスの自動化に寄与する。
Intel RealSense D405カメラで撮影された423のRGB-Dイメージペアに18,000以上のキノコインスタンスがあり、キノコ固有のデータセットのギャップを埋め、スマートキノコ農業における検出とインスタンスセグメンテーションアルゴリズムのベンチマークとして機能する。
包括的なアノテーションを備えた現実的な成長環境シナリオを特徴とするデータセットは、高度な検出アルゴリズムとインスタンスセグメンテーションアルゴリズムを使用して評価される。
論文ではデータセットの特徴を詳述し、アルゴリズムのパフォーマンスを評価し、より広範な適用性のために、GitHubリポジトリ https://github.com/abdollahzakeri/m18kを通じて、イメージ、コード、トレーニングされたモデルを含むすべてのリソースを公開しました。
関連論文リスト
- Beyond Labels: A Self-Supervised Framework with Masked Autoencoders and Random Cropping for Breast Cancer Subtype Classification [0.3374875022248865]
この領域でコンピュータビジョンタスクに適した自己教師型埋め込みを学習する。
私たちはWSIから自動的に大規模なデータセットを生成します。
我々は、BRACSデータセット上でのモデルの性能を評価し、既存のベンチマークと比較する。
論文 参考訳(メタデータ) (2024-10-15T19:13:05Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - Segment Any Events via Weighted Adaptation of Pivotal Tokens [85.39087004253163]
本稿では,Segment Anything Models (SAM) をイベントデータと統合する上で,難易度の高い課題に焦点を当てる。
本稿では,RGB画像とイベントデータからのトークン埋め込みのアライメントを最適化するマルチスケールな特徴蒸留手法を提案する。
論文 参考訳(メタデータ) (2023-12-24T12:47:08Z) - Multimodal Dataset for Localization, Mapping and Crop Monitoring in
Citrus Tree Farms [7.666806082770633]
このデータセットは、深度情報を備えたステレオRGB画像と、モノクロ、近赤外線、熱画像を提供する。
データセットは、キツネの3つの畑で収集された7つの配列から構成される。
総運転時間は1.7時間、走行距離は7.5km、データ量は1.3TBである。
論文 参考訳(メタデータ) (2023-09-27T00:30:08Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Mushroom image recognition and distance generation based on
attention-mechanism model and genetic information [4.845860279763184]
注目機構に基づく新しいモデルであるMushroomNetを提案し,バックボーンモデルとして軽量ネットワークMobileNetV3を適用した。
パブリックデータセットでは、MushroomNetモデルのテスト精度が83.9%に達し、ローカルデータセットでは、テスト精度が77.4%に達した。
その結果,MES活性化関数はキノコの遺伝的距離を非常に正確に予測できるが,精度はSoftMaxよりも低いことがわかった。
論文 参考訳(メタデータ) (2022-06-27T15:43:03Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - GrowliFlower: An image time series dataset for GROWth analysis of
cauLIFLOWER [2.8247971782279615]
この記事では、2020年と2021年に取得した0.39と0.60haの2つの監視されたカリフラワーフィールドのイメージベースUAV時系列データセットであるGrowliFlowerについて述べる。
このデータセットは、約14,000個の植物座標が導出され提供されるRGBおよび多スペクトル正光を含む。
このデータセットは、発生段階、植物、カリフラワーサイズを含む740種の植物の表現型形質を収集する。
論文 参考訳(メタデータ) (2022-04-01T08:56:59Z) - VersatileGait: A Large-Scale Synthetic Gait Dataset with
Fine-GrainedAttributes and Complicated Scenarios [16.26581300428201]
本稿では,ゲームエンジンによる大規模な合成歩行データセット(VersatileGait)の自動生成を提案する。
VersatileGaitデータセットは、さまざまな複雑なシナリオできめ細かい属性を持つ11,000人の約100万のシルエットシーケンスで構成されています。
広範な実験により,提案手法の歩容認識における有用性とその応用性が実証された。
論文 参考訳(メタデータ) (2021-01-05T07:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。