Fugu-MT 論文翻訳(概要): Advancing Image-Based Grapevine Variety Classification with a New Benchmark and Evaluation of Masked Autoencoders

論文の概要: Advancing Image-Based Grapevine Variety Classification with a New Benchmark and Evaluation of Masked Autoencoders

arxiv url: http://arxiv.org/abs/2506.13335v1
Date: Mon, 16 Jun 2025 10:25:23 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-17 17:28:48.184435
Title: Advancing Image-Based Grapevine Variety Classification with a New Benchmark and Evaluation of Masked Autoencoders
Title（参考訳）: 新しいベンチマークによる画像ベースGrapevine品種分類の強化とマスクオートエンコーダの評価
Authors: Gabriel A. Carneiro, Thierry J. Aubry, António Cunha, Petia Radeva, Joaquim Sousa,
Abstract要約: 本研究では,フィールド取得画像に基づくブドウ品種識別のためのMAE(Masked Autoencoders)の評価を行った。その結果,MAEとラベルなしデータセットで事前学習したViT-B/16モデルでは,F1スコアが0.7956となり,他のモデルよりも優れていた。
参考スコア（独自算出の注目度）: 4.1483280897786905
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Grapevine varieties are essential for the economies of many wine-producing countries, influencing the production of wine, juice, and the consumption of fruits and leaves. Traditional identification methods, such as ampelography and molecular analysis, have limitations: ampelography depends on expert knowledge and is inherently subjective, while molecular methods are costly and time-intensive. To address these limitations, recent studies have applied deep learning (DL) models to classify grapevine varieties using image data. However, due to the small dataset sizes, these methods often depend on transfer learning from datasets from other domains, e.g., ImageNet1K (IN1K), which can lead to performance degradation due to domain shift and supervision collapse. In this context, self-supervised learning (SSL) methods can be a good tool to avoid this performance degradation, since they can learn directly from data, without external labels. This study presents an evaluation of Masked Autoencoders (MAEs) for identifying grapevine varieties based on field-acquired images. The main contributions of this study include two benchmarks comprising 43 grapevine varieties collected across different seasons, an analysis of MAE's application in the agricultural context, and a performance comparison of trained models across seasons. Our results show that a ViT-B/16 model pre-trained with MAE and the unlabeled dataset achieved an F1 score of 0.7956, outperforming all other models. Additionally, we observed that pre-trained models benefit from long pre-training, perform well under low-data training regime, and that simple data augmentation methods are more effective than complex ones. The study also found that the mask ratio in MAE impacts performance only marginally.
Abstract（参考訳）: ブドウ品種は多くのワイン生産国の経済にとって必須であり、ワイン、ジュース、果物や葉の消費に影響している。アンペログラフィーや分子解析のような従来の識別法には限界があり、アンペログラフィーは専門家の知識に依存し、本質的に主観的であり、分子法は費用がかかり時間もかかる。これらの制約に対処するため、近年の研究では、画像データを用いてブドウ品種の分類にディープラーニング(DL)モデルを適用している。しかし、データセットのサイズが小さいため、これらの手法は、ドメインのシフトや監督の崩壊によってパフォーマンスが低下する可能性がある、例えば、ImageNet1K(IN1K)などの他のドメインからのデータセットからの変換学習に依存することが多い。この文脈では、自己教師付き学習(SSL)メソッドは、外部ラベルなしでデータから直接学習できるので、このパフォーマンス劣化を避けるのに良いツールである。本研究では,フィールド取得画像に基づくブドウ品種識別のためのMAE(Masked Autoencoders)の評価を行った。本研究の主な貢献は、異なる季節にわたって収集された43種のブドウ品種からなる2つのベンチマーク、農業におけるMAEの適用状況の分析、および、季節にわたって訓練されたモデルの性能比較である。その結果,MAEとラベルなしデータセットで事前学習したViT-B/16モデルでは,F1スコアが0.7956となり,他のモデルよりも優れていた。さらに, 事前学習モデルでは, 長期間の事前学習の恩恵を受け, 低データトレーニング体制下では良好に動作し, 複雑なモデルよりも単純なデータ拡張手法の方が有効であることがわかった。研究によると、MAEのマスク比はパフォーマンスにわずかに影響を与えている。

関連論文リスト

LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。 LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文参考訳（メタデータ） (2024-10-14T17:51:23Z)
ReAugment: Model Zoo-Guided RL for Few-Shot Time Series Augmentation and Forecasting [74.00765474305288]
本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文参考訳（メタデータ） (2024-09-10T07:34:19Z)
Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文参考訳（メタデータ） (2024-04-04T00:49:05Z)
Classification of grapevine varieties using UAV hyperspectral imaging [0.0]
ブドウ品種の分類は、精密ブドウ栽培において関連する表現型課題である。無人航空機(UAV)は、ハイパースペクトルデータの収集に対して、より効率的で禁止的でないアプローチを提供する。本研究では,17種類の赤と白のブドウ品種を分類するために,畳み込みニューラルネットワーク(CNN)を提案する。
論文参考訳（メタデータ） (2024-01-23T15:35:50Z)
Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文参考訳（メタデータ） (2023-06-20T09:46:01Z)
Generative models-based data labeling for deep networks regression: application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文参考訳（メタデータ） (2022-08-09T09:06:51Z)
End-to-end deep learning for directly estimating grape yield from ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文参考訳（メタデータ） (2022-08-04T01:34:46Z)
Facilitated machine learning for image-based fruit quality assessment in developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。事前学習型視覚変換器(ViT)に基づく代替手法を提案する。標準的なデバイス上で限られたリソースで簡単に実装できる。
論文参考訳（メタデータ） (2022-07-10T19:52:20Z)
Investigating classification learning curves for automatically generated and labelled plant images [0.1338174941551702]
本研究では,異なる生育段階のマニトバ草原に共通する作物や雑草を代表とする植物画像のデータセットを提示する。本稿では、ResNetアーキテクチャを用いて、このデータに基づく分類タスクの学習曲線を決定する。ラベルノイズとトレーニング可能なパラメータの低減が,このデータセットの学習曲線に与える影響について検討する。
論文参考訳（メタデータ） (2022-05-22T23:28:42Z)
Using Explainable Boosting Machine to Compare Idiographic and Nomothetic Approaches for Ecological Momentary Assessment Data [2.0824228840987447]
本稿では,非線形解釈型機械学習(ML)モデルを用いた分類問題について検討する。木々の様々なアンサンブルは、不均衡な合成データセットと実世界のデータセットを用いて線形モデルと比較される。 2つの実世界のデータセットのうちの1つで、知識蒸留法は改善されたAUCスコアを達成する。
論文参考訳（メタデータ） (2022-04-04T17:56:37Z)
Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。 CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文参考訳（メタデータ） (2021-05-18T15:13:00Z)
Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文参考訳（メタデータ） (2020-05-18T09:36:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。