論文の概要: Tomato Maturity Recognition with Convolutional Transformers
- arxiv url: http://arxiv.org/abs/2307.01530v2
- Date: Tue, 2 Jan 2024 13:13:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 20:02:03.294472
- Title: Tomato Maturity Recognition with Convolutional Transformers
- Title(参考訳): 畳み込み変換器を用いたトマト成熟度認識
- Authors: Asim Khan, Taimur Hassan, Muhammad Shafay, Israa Fahmy, Naoufel
Werghi, Lakmal Seneviratne and Irfan Hussain
- Abstract要約: 著者らは畳み込み変換器を用いたトマト成熟度分類の新しい手法を提案する。
KUTomaDataと呼ばれる新しいトマトデータセットは、トマトのセグメンテーションと分類のためのディープラーニングモデルをトレーニングするために設計されている。
著者らは、この畳み込みトランスフォーマーがトマト成熟度分類の最先端手法より優れていることを示した。
- 参考スコア(独自算出の注目度): 5.220581005698766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tomatoes are a major crop worldwide, and accurately classifying their
maturity is important for many agricultural applications, such as harvesting,
grading, and quality control. In this paper, the authors propose a novel method
for tomato maturity classification using a convolutional transformer. The
convolutional transformer is a hybrid architecture that combines the strengths
of convolutional neural networks (CNNs) and transformers. Additionally, this
study introduces a new tomato dataset named KUTomaData, explicitly designed to
train deep-learning models for tomato segmentation and classification.
KUTomaData is a compilation of images sourced from a greenhouse in the UAE,
with approximately 700 images available for training and testing. The dataset
is prepared under various lighting conditions and viewing perspectives and
employs different mobile camera sensors, distinguishing it from existing
datasets. The contributions of this paper are threefold:Firstly, the authors
propose a novel method for tomato maturity classification using a modular
convolutional transformer. Secondly, the authors introduce a new tomato image
dataset that contains images of tomatoes at different maturity levels. Lastly,
the authors show that the convolutional transformer outperforms
state-of-the-art methods for tomato maturity classification. The effectiveness
of the proposed framework in handling cluttered and occluded tomato instances
was evaluated using two additional public datasets, Laboro Tomato and Rob2Pheno
Annotated Tomato, as benchmarks. The evaluation results across these three
datasets demonstrate the exceptional performance of our proposed framework,
surpassing the state-of-the-art by 58.14%, 65.42%, and 66.39% in terms of mean
average precision scores for KUTomaData, Laboro Tomato, and Rob2Pheno Annotated
Tomato, respectively.
- Abstract(参考訳): トマトは世界中で主要な作物であり、その成熟度を正確に分類することは収穫、採点、品質管理など多くの農業用途において重要である。
本稿では,畳み込みトランスを用いたトマト成熟度分類法を提案する。
畳み込みトランスフォーマー(convolutional transformer)は、畳み込みニューラルネットワーク(cnns)とトランスフォーマーの強みを組み合わせたハイブリッドアーキテクチャである。
さらに,本研究では,トマトのセグメンテーションと分類のためのディープラーニングモデルのトレーニングを目的とした,KUTomaDataという新しいトマトデータセットを導入する。
KUTomaDataは、UAEの温室からソースされた画像のコンパイルであり、約700枚の画像がトレーニングとテストのために利用可能である。
データセットは、さまざまな照明条件と視点の下で作成され、既存のデータセットと区別するために、異なるモバイルカメラセンサーを使用する。
まず,モジュール型畳み込み変圧器を用いたトマトの成熟度分類法を提案する。
次に,異なる成熟度レベルでトマトの画像を含む新しいトマト画像データセットを提案する。
最後に, コンボリューショントランスフォーマーはトマト成熟度分類の最先端手法より優れていることを示す。
乱雑なトマトインスタンスと隠蔽トマトインスタンスの処理におけるフレームワークの有効性を,2つの公開データセットである Laboro Tomato と Rob2Pheno Annotated Tomato をベンチマークとして評価した。
これら3つのデータセットにおける評価結果から, トマトをアノテートしたkutomadata, laboro tomato, rob2phenoの平均精度スコアにおいて, 最先端の58.14%, 65.42%, 66.39%を上回った。
関連論文リスト
- Deep learning-based approach for tomato classification in complex scenes [0.8287206589886881]
複雑な場面における深層学習に基づくトマト熟成モニタリング手法を提案する。
目的は、成熟したトマトを検出し、タイムリーに収穫することである。
実験は、さまざまな言語にまたがるトマトの状態を用いて、インターネットから収集された画像に基づいて行われる。
論文 参考訳(メタデータ) (2024-01-26T18:33:57Z) - Early and Accurate Detection of Tomato Leaf Diseases Using TomFormer [0.3169023552218211]
本稿ではトマト葉病検出のためのトランスフォーマーモデルTomFormerを紹介する。
本稿では,視覚変換器と畳み込みニューラルネットワークを組み合わせた融合モデルを用いて,トマト葉病の検出手法を提案する。
論文 参考訳(メタデータ) (2023-12-26T20:47:23Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - TomatoDIFF: On-plant Tomato Segmentation with Denoising Diffusion Models [3.597418929000278]
TomatoDIFFは植物のトマトのセマンティックセグメンテーションのための新しい拡散モデルである。
トマトピアは温室トマトの新しい、大きくて挑戦的なデータセットである。
論文 参考訳(メタデータ) (2023-07-03T14:43:40Z) - Detection of Tomato Ripening Stages using Yolov3-tiny [0.0]
トマトの分類と検出にはニューラルネットワークを用いたモデルを用いる。
実験の結果, カスタムデータセットにおける熟成段階の局在と分類において, f1スコアは90.0%であった。
論文 参考訳(メタデータ) (2023-02-01T00:57:58Z) - Fusion of Satellite Images and Weather Data with Transformer Networks
for Downy Mildew Disease Detection [3.6868861317674524]
作物病は農業生産量と品質に大きな影響を及ぼす。
本稿では,3つのトランスを用いたデータ融合を実現するための新しい手法を提案する。
このアーキテクチャは、視覚変換器と2つの変換器エンコーダという3つの主要コンポーネントで構築されており、画像と気象の両方を融合させることができる。
論文 参考訳(メタデータ) (2022-09-06T19:55:16Z) - 3D Vision with Transformers: A Survey [114.86385193388439]
自然言語処理におけるトランスフォーマーアーキテクチャの成功は、コンピュータビジョン分野の注目を集めている。
本稿では,異なる3次元視覚タスクのための100以上のトランスフォーマー手法の体系的,徹底的なレビューを行う。
我々は3次元視覚におけるトランスフォーマー設計について議論し、様々な3次元表現でデータを処理できるようにする。
論文 参考訳(メタデータ) (2022-08-08T17:59:11Z) - Visual Saliency Transformer [127.33678448761599]
RGBとRGB-Dの液状物体検出(SOD)のための、純粋な変圧器であるVST(Visual Saliency Transformer)に基づく新しい統一モデルを開発しました。
イメージパッチを入力として取り、トランスフォーマーを利用してイメージパッチ間のグローバルコンテキストを伝搬する。
実験結果から,RGBとRGB-D SODのベンチマークデータセットにおいて,本モデルが既存の最新結果を上回っていることが示された。
論文 参考訳(メタデータ) (2021-04-25T08:24:06Z) - 3D Human Pose Estimation with Spatial and Temporal Transformers [59.433208652418976]
PoseFormerは、3D人間のポーズ推定のための純粋にトランスフォーマーベースのアプローチです。
近年の視覚変換器の発展に触発されて,空間時間変換器構造を設計する。
提案手法を2つの人気ベンチマークと標準ベンチマークで定量的に定性的に評価する。
論文 参考訳(メタデータ) (2021-03-18T18:14:37Z) - Two-View Fine-grained Classification of Plant Species [66.75915278733197]
本研究では,2視点の葉のイメージ表現に基づく新しい手法と,植物種の粒度認識のための階層的分類戦略を提案する。
シームズ畳み込みニューラルネットワークに基づく深度測定は、多数のトレーニングサンプルへの依存を減らし、新しい植物種に拡張性を持たせるために用いられる。
論文 参考訳(メタデータ) (2020-05-18T21:57:47Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。