論文の概要: BioAutoML-NAS: An End-to-End AutoML Framework for Multimodal Insect Classification via Neural Architecture Search on Large-Scale Biodiversity Data
- arxiv url: http://arxiv.org/abs/2510.05888v1
- Date: Tue, 07 Oct 2025 13:00:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.25829
- Title: BioAutoML-NAS: An End-to-End AutoML Framework for Multimodal Insect Classification via Neural Architecture Search on Large-Scale Biodiversity Data
- Title(参考訳): BioAutoML-NAS:大規模生物多様性データを用いたニューラルネットワーク探索によるマルチモーダル昆虫分類のためのエンドツーエンドオートMLフレームワーク
- Authors: Arefin Ittesafun Abian, Debopom Sutradhar, Md Rafi Ur Rashid, Reem E. Mohamed, Md Rafiqul Islam, Asif Karim, Kheng Cher Yeo, Sami Azam,
- Abstract要約: 画像やメタデータを含むマルチモーダルデータを用いた最初のBioAutoMLモデルであるBioAutoML-NASを提案する。
マルチモーダル融合モジュールは、画像埋め込みとメタデータを組み合わせることで、視覚的および分類的生物学的情報の両方を使って昆虫を分類することができる。
BIOSCAN-5Mデータセットの大規模な評価は、BioAutoML-NASが96.81%の精度、97.46%の精度、96.81%のリコール、97.05%のF1スコアを達成したことを示している。
- 参考スコア(独自算出の注目度): 2.629942857823441
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Insect classification is important for agricultural management and ecological research, as it directly affects crop health and production. However, this task remains challenging due to the complex characteristics of insects, class imbalance, and large-scale datasets. To address these issues, we propose BioAutoML-NAS, the first BioAutoML model using multimodal data, including images, and metadata, which applies neural architecture search (NAS) for images to automatically learn the best operations for each connection within each cell. Multiple cells are stacked to form the full network, each extracting detailed image feature representations. A multimodal fusion module combines image embeddings with metadata, allowing the model to use both visual and categorical biological information to classify insects. An alternating bi-level optimization training strategy jointly updates network weights and architecture parameters, while zero operations remove less important connections, producing sparse, efficient, and high-performing architectures. Extensive evaluation on the BIOSCAN-5M dataset demonstrates that BioAutoML-NAS achieves 96.81% accuracy, 97.46% precision, 96.81% recall, and a 97.05% F1 score, outperforming state-of-the-art transfer learning, transformer, AutoML, and NAS methods by approximately 16%, 10%, and 8% respectively. Further validation on the Insects-1M dataset obtains 93.25% accuracy, 93.71% precision, 92.74% recall, and a 93.22% F1 score. These results demonstrate that BioAutoML-NAS provides accurate, confident insect classification that supports modern sustainable farming.
- Abstract(参考訳): 昆虫の分類は、作物の健康と生産に直接影響を与えるため、農業管理と生態学研究にとって重要である。
しかし、昆虫の複雑な特徴、階級不均衡、大規模なデータセットのため、この課題は依然として困難なままである。
これらの問題に対処するために,画像やメタデータを含むマルチモーダルデータを用いた最初のBioAutoMLモデルであるBioAutoML-NASを提案する。
複数のセルを積み重ねて全ネットワークを形成し、それぞれが詳細な画像特徴表現を抽出する。
マルチモーダル融合モジュールは、画像埋め込みとメタデータを組み合わせることで、視覚的および分類的生物学的情報の両方を使って昆虫を分類することができる。
双方向最適化のトレーニング戦略は、ネットワーク重みとアーキテクチャパラメータを共同で更新する一方で、ゼロ操作は重要でないコネクションを排除し、疎結合で効率的で高性能なアーキテクチャを生成する。
BIOSCAN-5Mデータセットの大規模な評価は、BioAutoML-NASが96.81%の精度、97.46%の精度、96.81%のリコール、97.05%のF1スコアを達成し、それぞれ16%、10%、8%の精度で最先端のトランスファーラーニング、トランスフォーマー、オートML、NASメソッドを上回ったことを示している。
Insects-1Mデータセットのさらなる検証では、93.25%の精度、93.71%の精度、92.74%のリコール、93.22%のF1スコアが得られる。
これらの結果から,BioAutoML-NASは持続的農業を支援する正確で確実な昆虫分類を提供することが示された。
関連論文リスト
- Transfer Learning-Based CNN Models for Plant Species Identification Using Leaf Venation Patterns [0.0]
本研究では,3つのディープラーニングアーキテクチャ(ResNet50,MobileNetV2,EfficientNetB0)の有効性を評価する。
論文 参考訳(メタデータ) (2025-09-03T21:23:09Z) - CellPainTR: Generalizable Representation Learning for Cross-Dataset Cell Painting Analysis [51.56484100374058]
本稿では,細胞形態の基本的な表現を学習するためのトランスフォーマーベースのアーキテクチャであるCellPainTRを紹介する。
私たちの研究は、画像ベースのプロファイリングのための真の基盤モデルを作成するための重要なステップであり、より信頼性が高くスケーラブルなクロススタディ生物学的分析を可能にします。
論文 参考訳(メタデータ) (2025-09-02T03:30:07Z) - BeetleVerse: A Study on Taxonomic Classification of Ground Beetles [0.310688583550805]
地上の甲虫は、非常に敏感で特異な生物学的指標であり、生物多様性のモニタリングに不可欠である。
本稿では,4つの多種多様な長い尾を持つデータセットの分類分類に関する12の視覚モデルを評価する。
その結果,視覚と言語変換器を頭部と組み合わせたモデルが最も優れており,97%の精度で種・種レベルでの精度が得られた。
論文 参考訳(メタデータ) (2025-04-18T01:06:37Z) - Protein sequence classification using natural language processing techniques [3.0846824529023396]
本研究の目的は,自然言語処理(NLP)技術を用いたタンパク質配列分類の高度化である。
我々は、ランダムスプリッティングとECODファミリースプリッティングという2つの異なるデータ分割戦略の下で、さまざまな機械学習モデルとディープラーニングモデルを比較した。
論文 参考訳(メタデータ) (2024-09-06T13:16:16Z) - A Pairwise Comparison Relation-assisted Multi-objective Evolutionary Neural Architecture Search Method with Multi-population Mechanism [56.09418231453024]
ニューラルアーキテクチャサーチ(NAS)により、研究者は広大なサーチスペースを自動的に探索し、効率的なニューラルネットワークを見つけることができる。
NASは重要なボトルネックに悩まされており、探索プロセス中に多くのアーキテクチャを評価する必要がある。
SMEM-NASは,多集団構造に基づく相互比較比較支援型多目的進化アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-22T12:46:22Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - An Efficient Insect Pest Classification Using Multiple Convolutional
Neural Network Based Models [0.3222802562733786]
昆虫の分類は、様々な種類、スケール、形状、フィールドの複雑な背景、昆虫種間の外観的類似性から難しい課題である。
本研究では、注目、特徴ピラミッド、きめ細かいモデルを含む、さまざまな畳み込みニューラルネットワークベースのモデルを提示する。
実験の結果、これらの畳み込みニューラルネットワークベースのモデルを組み合わせることで、これらの2つのデータセットの最先端の手法よりもパフォーマンスが向上することが示された。
論文 参考訳(メタデータ) (2021-07-26T12:53:28Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。