論文の概要: BeetleFlow: An Integrative Deep Learning Pipeline for Beetle Image Processing
- arxiv url: http://arxiv.org/abs/2511.00255v1
- Date: Fri, 31 Oct 2025 20:55:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.693213
- Title: BeetleFlow: An Integrative Deep Learning Pipeline for Beetle Image Processing
- Title(参考訳): BeetleFlow: ビートル画像処理のための統合型ディープラーニングパイプライン
- Authors: Fangxun Liu, S M Rayeed, Samuel Stevens, Alyson East, Cheng Hsuan Chiang, Colin Lee, Daniel Yi, Junke Yang, Tejas Naik, Ziyi Wang, Connor Kilrain, Elijah H Buckwalter, Jiacheng Hou, Saul Ibaven Bueno, Shuheng Wang, Xinyue Ma, Yifan Liu, Zhiyuan Tao, Ziheng Zhang, Eric Sokol, Michael Belitz, Sydne Record, Charles V. Stewart, Wei-Lun Chao,
- Abstract要約: 我々は,各トレー上のすべての甲虫を検知し,各甲虫のイメージをソートし,収穫した甲虫に形態的セグメンテーションを行う3段階のパイプラインを開発した。
セグメンテーションでは,手動で670個の甲虫画像とトランスフォーマーベースセグメンテーションモデルの2つの変種をラベル付けし,比較的高精度に甲虫の微細なセグメンテーションを実現した。
- 参考スコア(独自算出の注目度): 27.88572259119556
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In entomology and ecology research, biologists often need to collect a large number of insects, among which beetles are the most common species. A common practice for biologists to organize beetles is to place them on trays and take a picture of each tray. Given the images of thousands of such trays, it is important to have an automated pipeline to process the large-scale data for further research. Therefore, we develop a 3-stage pipeline to detect all the beetles on each tray, sort and crop the image of each beetle, and do morphological segmentation on the cropped beetles. For detection, we design an iterative process utilizing a transformer-based open-vocabulary object detector and a vision-language model. For segmentation, we manually labeled 670 beetle images and fine-tuned two variants of a transformer-based segmentation model to achieve fine-grained segmentation of beetles with relatively high accuracy. The pipeline integrates multiple deep learning methods and is specialized for beetle image processing, which can greatly improve the efficiency to process large-scale beetle data and accelerate biological research.
- Abstract(参考訳): 昆虫学と生態学の研究において、生物学者はしばしば多数の昆虫を採集する必要がある。
生物学者が甲虫を組織する一般的な習慣は、それらをトレイの上に置き、各トレイの写真を撮ることである。
このようなトレイの数千の画像を考えると、さらなる研究のために大規模なデータを処理する自動化パイプラインを持つことが重要です。
そこで我々は,各トレー上の全ての甲虫を検知し,各甲虫のイメージをソートし,収穫した甲虫に形態的セグメンテーションを行う3段階のパイプラインを開発した。
本研究では,トランスをベースとしたオープンボキャブラリオブジェクト検出器と視覚言語モデルを用いた反復処理を設計する。
セグメンテーションでは,手動で670個の甲虫画像とトランスフォーマーベースセグメンテーションモデルの2つの変種をラベル付けし,比較的高精度に甲虫の微細なセグメンテーションを実現した。
このパイプラインは複数の深層学習手法を統合し、甲虫画像処理に特化しており、大規模な甲虫データを処理し、生物研究を加速する効率を大幅に向上させることができる。
関連論文リスト
- A multi-modal dataset for insect biodiversity with imagery and DNA at the trap and individual level [12.817729932901779]
本研究は,昆虫標本の自動分類器を訓練するための混合節足類標本同定データセット(MassID45)について述べる。
これは、分類されていないサンプルレベルと、個々の標本の完全なセットの両方で、分子とイメージングのデータを一意に組み合わせている。
AI支援ツールによって支えられた人間のアノテーションは、各節足動物の周囲にセグメンテーションマスクを作成し、17万以上の標本に分類学的ラベルを割り当てるという、バルク画像の2つのタスクを実行した。
論文 参考訳(メタデータ) (2025-07-09T16:03:06Z) - BioCLIP 2: Emergent Properties from Scaling Hierarchical Contrastive Learning [60.80381372245902]
生体視覚モデルでは,大規模コントラスト視覚言語学習により創発的行動が観察される。
我々は、異なる種を区別するために、TreeOfLife-200MでBioCLIP 2を訓練する。
得られたBioCLIP 2の埋め込み空間における創発的特性を同定する。
論文 参考訳(メタデータ) (2025-05-29T17:48:20Z) - BeetleVerse: A Study on Taxonomic Classification of Ground Beetles [0.310688583550805]
地上の甲虫は、非常に敏感で特異な生物学的指標であり、生物多様性のモニタリングに不可欠である。
本稿では,4つの多種多様な長い尾を持つデータセットの分類分類に関する12の視覚モデルを評価する。
その結果,視覚と言語変換器を頭部と組み合わせたモデルが最も優れており,97%の精度で種・種レベルでの精度が得られた。
論文 参考訳(メタデータ) (2025-04-18T01:06:37Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Comparison between transformers and convolutional models for
fine-grained classification of insects [7.107353918348911]
私たちはInsectaの分類学クラスを考えます。
昆虫の識別は多くの生態系の基盤にある住民の1つであるため、生物多様性監視に不可欠である。
何十億もの画像が自動的に分類され、ディープニューラルネットワークアルゴリズムが、きめ細かいタスクのために研究されている主要なテクニックの1つです。
論文 参考訳(メタデータ) (2023-07-20T10:00:04Z) - Machine Learning Challenges of Biological Factors in Insect Image Data [3.867363075280544]
BIOSCANプロジェクトは、世界規模での生物多様性の変化の研究を目指している。
プロジェクトの1つの構成要素は、すべての昆虫の種間相互作用と動学の研究である。
年間150万枚以上の画像が収集され、それぞれが分類学的な分類を必要とする。
論文 参考訳(メタデータ) (2022-11-04T15:58:20Z) - Cascaded Robust Learning at Imperfect Labels for Chest X-ray
Segmentation [61.09321488002978]
不完全アノテーションを用いた胸部X線分割のための新しいカスケードロバスト学習フレームワークを提案する。
モデルは3つの独立したネットワークから成り,ピアネットワークから有用な情報を効果的に学習できる。
提案手法は,従来の手法と比較して,セグメント化タスクの精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-04-05T15:50:16Z) - Pollen13K: A Large Scale Microscope Pollen Grain Image Dataset [63.05335933454068]
この研究は、1万3千以上の天体を含む最初の大規模花粉画像データセットを提示する。
本稿では, エアロバイオロジカルサンプリング, 顕微鏡画像取得, 物体検出, セグメンテーション, ラベル付けなど, 採用データ取得のステップに注目した。
論文 参考訳(メタデータ) (2020-07-09T10:33:31Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。