論文の概要: Snap and Diagnose: An Advanced Multimodal Retrieval System for Identifying Plant Diseases in the Wild
- arxiv url: http://arxiv.org/abs/2408.14723v1
- Date: Tue, 27 Aug 2024 01:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 15:14:31.900880
- Title: Snap and Diagnose: An Advanced Multimodal Retrieval System for Identifying Plant Diseases in the Wild
- Title(参考訳): Snap and Diagnose: 野生植物病の同定のための高度なマルチモーダル検索システム
- Authors: Tianqi Wei, Zhi Chen, Xin Yu,
- Abstract要約: 我々は,画像やテキストのプロンプトに基づいて,病気検索を支援するマルチモーダル植物病画像検索システムを開発した。
我々は、89のカテゴリで18,000枚以上の画像を含む、最大規模の植物病データセットであるPlantWildを利用している。
クロスモーダル検索は、新しいCLIPベースの視覚言語モデルによって促進される開発システムで実現されている。
- 参考スコア(独自算出の注目度): 22.940441995788063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Plant disease recognition is a critical task that ensures crop health and mitigates the damage caused by diseases. A handy tool that enables farmers to receive a diagnosis based on query pictures or the text description of suspicious plants is in high demand for initiating treatment before potential diseases spread further. In this paper, we develop a multimodal plant disease image retrieval system to support disease search based on either image or text prompts. Specifically, we utilize the largest in-the-wild plant disease dataset PlantWild, which includes over 18,000 images across 89 categories, to provide a comprehensive view of potential diseases relating to the query. Furthermore, cross-modal retrieval is achieved in the developed system, facilitated by a novel CLIP-based vision-language model that encodes both disease descriptions and disease images into the same latent space. Built on top of the retriever, our retrieval system allows users to upload either plant disease images or disease descriptions to retrieve the corresponding images with similar characteristics from the disease dataset to suggest candidate diseases for end users' consideration.
- Abstract(参考訳): 植物病の認識は作物の健康を確実にし、病気による被害を軽減する重要な課題である。
農夫が検索画像や不審植物のテキスト記述に基づいて診断を受けられるような便利なツールが、潜在的な病気がさらに広まる前に治療を開始するのに高い需要がある。
本稿では,画像やテキストのプロンプトに基づいて,病気検索を支援するマルチモーダル植物病画像検索システムを開発する。
具体的には、89のカテゴリにわたる18,000以上の画像を含む、最大規模の植物病データセットであるPildWildを用いて、クエリに関連する潜在的な疾患の総合的なビューを提供する。
さらに,CLIPをベースとした新たな視覚言語モデルにより,疾患記述と疾患画像の両方を同一の潜伏空間にエンコードするクロスモーダル検索を実現する。
検索装置上に構築した検索システムでは, 植物病画像や病状記述をアップロードして, 類似した特徴のイメージを検索し, エンドユーザが考慮すべき疾患候補を提案する。
関連論文リスト
- FairSkin: Fair Diffusion for Skin Disease Image Generation [54.29840149709033]
拡散モデル (DM) は, 合成医用画像の生成において主要な手法となっているが, 臨界二倍偏差に悩まされている。
このようなバイアスを3段階のリサンプリング機構によって緩和する新しいDMフレームワークであるFairSkinを提案する。
本手法は, 画像の多様性と品質を著しく向上させ, 臨床環境における皮膚疾患の検出精度の向上に寄与する。
論文 参考訳(メタデータ) (2024-10-29T21:37:03Z) - Decomposing Disease Descriptions for Enhanced Pathology Detection: A Multi-Aspect Vision-Language Pre-training Framework [43.453943987647015]
医学的な視覚言語事前訓練は研究の最前線として現れ、ゼロショットの病理診断を可能にしている。
バイオメディカルテキストの複雑なセマンティクスのため、現在の方法では、医学的画像と、非構造化レポートの重要な病理学的所見の整合に苦慮している。
これは、大きな言語モデルと医療専門家に相談することで達成される。
我々の研究は、近年の手法の精度を最大8.56%まで改善し、17.26%を目に見えるカテゴリーで改善した。
論文 参考訳(メタデータ) (2024-03-12T13:18:22Z) - Detection of healthy and diseased crops in drone captured images using
Deep Learning [0.0]
病気によって引き起こされる植物の正常な状態の破壊は、しばしば本質的な植物活動に干渉する。
ドローン画像を用いた植物病の効率的な検出のための深層学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-22T21:15:12Z) - Image Quality Assessment for Foliar Disease Identification (AgroPath) [2.9718407579521675]
作物病は食料安全保障にとって大きな脅威であり、その急速な識別は収量減少を防ぐために重要である。
近年のコンピュータビジョンの進歩とスマートフォンの普及により、スマートフォンによる病原体同定の道が開かれた。
この研究は2020年にパキスタンのラホール工科大学のコンピュータ科学工学科で行われ、葉に基づく植物病の同定が行なわれた。
論文 参考訳(メタデータ) (2022-09-26T06:20:35Z) - Paddy Doctor: A Visual Image Dataset for Paddy Disease Classification [0.0]
パディドクター(Paddy Doctor)は、水田病を識別するための画像データセットである。
本データセットは10クラス(9つの疾患と正常な葉)に13,876点の注釈付き水田葉画像を含む。
我々は、畳み込みニューラルネットワーク(CNN)とVGG16とMobileNetの2つの移行学習アプローチを用いて、パディドクターをベンチマークした。
論文 参考訳(メタデータ) (2022-05-23T07:57:40Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - Image-based Plant Disease Diagnosis with Unsupervised Anomaly Detection
Based on Reconstructability of Colors [0.0]
画像に基づく植物病診断のための教師なし異常検出手法を提案する。
提案手法は,pix2pixと呼ばれる条件付き対向ネットワークを利用した植物病検出のための新しい画像ベースフレームワークを含む。
PlantVillageデータセットを用いた実験では,既存の異常検出装置と比較して提案手法の優位性を示した。
論文 参考訳(メタデータ) (2020-11-29T07:44:05Z) - A Multi-Plant Disease Diagnosis Method using Convolutional Neural
Network [0.0]
本章では,複数植物の診断を併用した最適な植物病原体同定モデルについて検討する。
我々は多くの一般的な畳み込みニューラルネットワーク(CNN)アーキテクチャを実装している。
Xception と DenseNet アーキテクチャは,マルチラベル植物病の分類タスクにおいて,より優れた性能を示した。
論文 参考訳(メタデータ) (2020-11-10T15:18:52Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。