論文の概要: Automated Classification of Dry Bean Varieties Using XGBoost and SVM Models
- arxiv url: http://arxiv.org/abs/2408.01244v1
- Date: Fri, 2 Aug 2024 13:05:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 13:27:42.074561
- Title: Automated Classification of Dry Bean Varieties Using XGBoost and SVM Models
- Title(参考訳): XGBoostモデルとSVMモデルを用いたドライビーン品種の自動分類
- Authors: Ramtin Ardeshirifar,
- Abstract要約: 本稿では,機械学習モデルを用いた7種類の乾燥豆の自動分類について比較検討する。
XGBoostとSVMのモデルはそれぞれ94.00%と94.39%の正確な分類率を達成した。
本研究は, 種子品質制御と収量最適化を効果的に支援できることを実証し, 精密農業への取り組みの活発化に寄与する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a comparative study on the automated classification of seven different varieties of dry beans using machine learning models. Leveraging a dataset of 12,909 dry bean samples, reduced from an initial 13,611 through outlier removal and feature extraction, we applied Principal Component Analysis (PCA) for dimensionality reduction and trained two multiclass classifiers: XGBoost and Support Vector Machine (SVM). The models were evaluated using nested cross-validation to ensure robust performance assessment and hyperparameter tuning. The XGBoost and SVM models achieved overall correct classification rates of 94.00% and 94.39%, respectively. The results underscore the efficacy of these machine learning approaches in agricultural applications, particularly in enhancing the uniformity and efficiency of seed classification. This study contributes to the growing body of work on precision agriculture, demonstrating that automated systems can significantly support seed quality control and crop yield optimization. Future work will explore incorporating more diverse datasets and advanced algorithms to further improve classification accuracy.
- Abstract(参考訳): 本稿では,機械学習モデルを用いた7種類の乾燥豆の自動分類について比較検討する。
12,909個のドライビーンサンプルを用いて, 初期13,611個から外乱除去と特徴抽出を行い, 主成分分析 (PCA) を次元化に応用し, XGBoost と Support Vector Machine (SVM) の2種類のマルチクラス分類器を訓練した。
モデルをネストしたクロスバリデーションを用いて評価し,ロバストな性能評価とハイパーパラメータチューニングを実現した。
XGBoostとSVMのモデルはそれぞれ94.00%と94.39%の正確な分類率を達成した。
この結果は、特に種子分類の均一性と効率を高めるために、農業応用におけるこれらの機械学習アプローチの有効性を裏付けるものである。
本研究は, 種子品質制御と収量最適化を効果的に支援できることを実証し, 精密農業への取り組みの活発化に寄与する。
今後は、より多様なデータセットと高度なアルゴリズムを取り入れて、分類精度をさらに向上していく予定だ。
関連論文リスト
- LSTM Autoencoder-based Deep Neural Networks for Barley Genotype-to-Phenotype Prediction [16.99449054451577]
そこで本研究では,オオムギの開花時期と収量推定のために,オオムギの遺伝子型からフェノタイプへの予測のためのLSTMオートエンコーダを用いた新しいモデルを提案する。
我々のモデルは、複雑な高次元農業データセットを扱う可能性を示す他のベースライン手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-21T16:07:43Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるRussetポテトクローンの適合性を予測するため, 機械学習アルゴリズムの適用について検討する。
我々はオレゴン州で手作業で収集した試験のデータを活用している。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Extension of Transformational Machine Learning: Classification Problems [0.0]
本研究では、薬物発見における変換機械学習(TML)の適用と性能について検討する。
メタ学習アルゴリズムであるTMLは、さまざまなドメインにまたがる共通属性の活用に優れています。
薬物発見プロセスは複雑で時間を要するが、予測精度の増大から大きな恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-08-07T07:34:18Z) - Benchmarking the Effectiveness of Classification Algorithms and SVM
Kernels for Dry Beans [0.6263481844384227]
本研究では,異なる支援ベクトルマシン(SVM)分類アルゴリズム,すなわち線形および放射基底関数(RBF)を解析する。
この分析はDry Beanデータセット上で行われ、PCA(Principal Component Analysis)は次元減少のための前処理ステップとして実行される。
RBF SVMカーネルアルゴリズムは93.34%、精度92.61%、リコール92.35%、F1スコア91.40%を達成している。
論文 参考訳(メタデータ) (2023-07-15T18:13:29Z) - Machine Learning-Assisted Pattern Recognition Algorithms for Estimating
Ultimate Tensile Strength in Fused Deposition Modeled Polylactic Acid
Specimens [0.0]
混合沈着モデル(FDM)プロセスを用いて作製したポリ乳酸(PLA)試料の最大引張強度(UTS)を推定するための教師付き機械学習アルゴリズムの適用について検討した。
主な目的は、ロジスティック分類(Logistic Classification)、グラディエントブースティング分類(Gradient Boosting Classification)、決定木(Decision Tree)、K-Nearest Neighbor(K-Nearest Neighbor)の4つの異なる分類アルゴリズムの精度と有効性を評価することである。
その結果、決定木とK-Nearest NeighborアルゴリズムはともにF1スコア0.71を達成したが、KNNアルゴリズムはAUC(Area Under the Curve)スコア0.79を達成し、他のアルゴリズムを上回った。
論文 参考訳(メタデータ) (2023-07-13T11:10:22Z) - Attribute Graph Clustering via Learnable Augmentation [71.36827095487294]
対照的なディープグラフクラスタリング(CDGC)は、異なるクラスタにノードをグループ化するために対照的な学習を利用する。
本稿では,高品質な増分サンプルのための学習可能な増分器を導入するための,Learningable Augmentation (textbfAGCLA) を用いた属性グラフクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2022-12-07T10:19:39Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - SelectAugment: Hierarchical Deterministic Sample Selection for Data
Augmentation [72.58308581812149]
そこで我々は,SelectAugmentと呼ばれる効果的な手法を提案し,決定論的かつオンラインに拡張するサンプルを選択する。
具体的には、各バッチにおいて、まず増分比率を決定し、次にこの比で各トレーニングサンプルを増分するかを決定する。
これにより、サンプルを増量する際のランダム性による負の効果を効果的に軽減し、DAの有効性を向上させることができる。
論文 参考訳(メタデータ) (2021-12-06T08:38:38Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - Active Hybrid Classification [79.02441914023811]
本論文では,クラスタとマシンが分類問題にどう対応できるかを示す。
本稿では,活発な学習と群集分類を編成し,それらを活発なサイクルで組み合わせるアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-01-21T21:09:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。