論文の概要: Automated Classification of Dry Bean Varieties Using XGBoost and SVM Models
- arxiv url: http://arxiv.org/abs/2408.01244v1
- Date: Fri, 2 Aug 2024 13:05:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 13:27:42.074561
- Title: Automated Classification of Dry Bean Varieties Using XGBoost and SVM Models
- Title(参考訳): XGBoostモデルとSVMモデルを用いたドライビーン品種の自動分類
- Authors: Ramtin Ardeshirifar,
- Abstract要約: 本稿では,機械学習モデルを用いた7種類の乾燥豆の自動分類について比較検討する。
XGBoostとSVMのモデルはそれぞれ94.00%と94.39%の正確な分類率を達成した。
本研究は, 種子品質制御と収量最適化を効果的に支援できることを実証し, 精密農業への取り組みの活発化に寄与する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a comparative study on the automated classification of seven different varieties of dry beans using machine learning models. Leveraging a dataset of 12,909 dry bean samples, reduced from an initial 13,611 through outlier removal and feature extraction, we applied Principal Component Analysis (PCA) for dimensionality reduction and trained two multiclass classifiers: XGBoost and Support Vector Machine (SVM). The models were evaluated using nested cross-validation to ensure robust performance assessment and hyperparameter tuning. The XGBoost and SVM models achieved overall correct classification rates of 94.00% and 94.39%, respectively. The results underscore the efficacy of these machine learning approaches in agricultural applications, particularly in enhancing the uniformity and efficiency of seed classification. This study contributes to the growing body of work on precision agriculture, demonstrating that automated systems can significantly support seed quality control and crop yield optimization. Future work will explore incorporating more diverse datasets and advanced algorithms to further improve classification accuracy.
- Abstract(参考訳): 本稿では,機械学習モデルを用いた7種類の乾燥豆の自動分類について比較検討する。
12,909個のドライビーンサンプルを用いて, 初期13,611個から外乱除去と特徴抽出を行い, 主成分分析 (PCA) を次元化に応用し, XGBoost と Support Vector Machine (SVM) の2種類のマルチクラス分類器を訓練した。
モデルをネストしたクロスバリデーションを用いて評価し,ロバストな性能評価とハイパーパラメータチューニングを実現した。
XGBoostとSVMのモデルはそれぞれ94.00%と94.39%の正確な分類率を達成した。
この結果は、特に種子分類の均一性と効率を高めるために、農業応用におけるこれらの機械学習アプローチの有効性を裏付けるものである。
本研究は, 種子品質制御と収量最適化を効果的に支援できることを実証し, 精密農業への取り組みの活発化に寄与する。
今後は、より多様なデータセットと高度なアルゴリズムを取り入れて、分類精度をさらに向上していく予定だ。
関連論文リスト
- Efficient Multi-Agent System Training with Data Influence-Oriented Tree Search [59.75749613951193]
木探索とデータ選択の両方をガイドするデータインフルエンス指向木探索(DITS)を提案する。
インフルエンススコアを活用することで、システム改善のための最も影響力のあるデータを効果的に特定する。
非微分不可能な指標に適した影響スコア推定法を導出する。
論文 参考訳(メタデータ) (2025-02-02T23:20:16Z) - GBFRS: Robust Fuzzy Rough Sets via Granular-ball Computing [48.33779268699777]
ファジィ粗セット理論は複雑な属性を持つデータセットを処理するのに有効である。
既存のモデルのほとんどは最も細かい粒度で動作しており、非効率でノイズに敏感である。
本稿では,多粒度グラニュラーボール計算をファジィ粗集合理論に統合し,サンプル点の代替としてグラニュラーボールを提案する。
論文 参考訳(メタデータ) (2025-01-30T15:09:26Z) - A Robust Support Vector Machine Approach for Raman COVID-19 Data Classification [0.7864304771129751]
本稿では,ラマン分光法から得られた新型コロナウイルスの分類における,SVM(Support Vector Machine)のための新しいロバストな定式化の性能について検討する。
我々は、各観測の周囲の有界な不確実性集合を用いて、決定論的定式化の頑健な相反するモデルを導出する。
本手法の有効性は,イタリアの病院が提供した実世界のCOVID-19データセットで検証されている。
論文 参考訳(メタデータ) (2025-01-29T14:02:45Z) - Artificial Liver Classifier: A New Alternative to Conventional Machine Learning Models [4.395397502990339]
本稿では,ヒト肝臓の解毒機能に触発された新しい教師付き学習分類器であるArtificial Liver(ALC)を紹介する。
ALCの特徴は、その単純さ、速度、ハイパーパラメータフリー、オーバーフィッティングを減らす能力、そして多重分類問題に対処する効果である。
Iris Flower、Breast Cancer Wisconsin、Wine、Voice Gender、MNISTの5つのベンチマーク機械学習データセットで評価された。
論文 参考訳(メタデータ) (2025-01-14T12:42:01Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Extension of Transformational Machine Learning: Classification Problems [0.0]
本研究では、薬物発見における変換機械学習(TML)の適用と性能について検討する。
メタ学習アルゴリズムであるTMLは、さまざまなドメインにまたがる共通属性の活用に優れています。
薬物発見プロセスは複雑で時間を要するが、予測精度の増大から大きな恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-08-07T07:34:18Z) - Benchmarking the Effectiveness of Classification Algorithms and SVM
Kernels for Dry Beans [0.6263481844384227]
本研究では,異なる支援ベクトルマシン(SVM)分類アルゴリズム,すなわち線形および放射基底関数(RBF)を解析する。
この分析はDry Beanデータセット上で行われ、PCA(Principal Component Analysis)は次元減少のための前処理ステップとして実行される。
RBF SVMカーネルアルゴリズムは93.34%、精度92.61%、リコール92.35%、F1スコア91.40%を達成している。
論文 参考訳(メタデータ) (2023-07-15T18:13:29Z) - PruMUX: Augmenting Data Multiplexing with Model Compression [42.89593283051397]
本稿では、構造化プルーニングとデータ多重化という2つの手法を組み合わせて、どちらの手法でも得られる高速化ゲインを合成する。
我々のアプローチであるPruMUXは、精度が80%から74%のBERTベースモデルよりも7.5-29.5倍のスループット向上を実現している。
我々は,所望の精度損失予算を条件として,プルーニングと多重化の高性能パラメータを予測できるメタレベルモデルであるAuto-PruMUXを提案する。
論文 参考訳(メタデータ) (2023-05-24T04:22:38Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - SelectAugment: Hierarchical Deterministic Sample Selection for Data
Augmentation [72.58308581812149]
そこで我々は,SelectAugmentと呼ばれる効果的な手法を提案し,決定論的かつオンラインに拡張するサンプルを選択する。
具体的には、各バッチにおいて、まず増分比率を決定し、次にこの比で各トレーニングサンプルを増分するかを決定する。
これにより、サンプルを増量する際のランダム性による負の効果を効果的に軽減し、DAの有効性を向上させることができる。
論文 参考訳(メタデータ) (2021-12-06T08:38:38Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。