Fugu-MT 論文翻訳(概要): BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity

論文の概要: BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity

arxiv url: http://arxiv.org/abs/2406.12723v4
Date: Wed, 13 Nov 2024 01:45:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:33.833405
Title: BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity
Title（参考訳）: BIOSCAN-5M:昆虫の生物多様性のためのマルチモーダルデータセット
Authors: Zahra Gharaee, Scott C. Lowe, ZeMing Gong, Pablo Millan Arias, Nicholas Pellegrino, Austin T. Wang, Joakim Bruslund Haurum, Iuliia Zarubiieva, Lila Kari, Dirk Steinke, Graham W. Taylor, Paul Fieguth, Angel X. Chang,
Abstract要約: BIOSCAN-5Mは、500万以上の昆虫の標本のマルチモーダル情報を含む包括的データセットである。マルチモーダルデータ型が分類とクラスタリングの精度に与える影響を示すための3つのベンチマーク実験を提案する。
参考スコア（独自算出の注目度）: 19.003642885871546
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: As part of an ongoing worldwide effort to comprehend and monitor insect biodiversity, this paper presents the BIOSCAN-5M Insect dataset to the machine learning community and establish several benchmark tasks. BIOSCAN-5M is a comprehensive dataset containing multi-modal information for over 5 million insect specimens, and it significantly expands existing image-based biological datasets by including taxonomic labels, raw nucleotide barcode sequences, assigned barcode index numbers, geographical, and size information. We propose three benchmark experiments to demonstrate the impact of the multi-modal data types on the classification and clustering accuracy. First, we pretrain a masked language model on the DNA barcode sequences of the BIOSCAN-5M dataset, and demonstrate the impact of using this large reference library on species- and genus-level classification performance. Second, we propose a zero-shot transfer learning task applied to images and DNA barcodes to cluster feature embeddings obtained from self-supervised learning, to investigate whether meaningful clusters can be derived from these representation embeddings. Third, we benchmark multi-modality by performing contrastive learning on DNA barcodes, image data, and taxonomic information. This yields a general shared embedding space enabling taxonomic classification using multiple types of information and modalities. The code repository of the BIOSCAN-5M Insect dataset is available at https://github.com/bioscan-ml/BIOSCAN-5M.
Abstract（参考訳）: 本稿では,昆虫の生物多様性を理解・監視するための国際的な取り組みの一環として,BIOSCAN-5M Insectデータセットを機械学習コミュニティに提示し,いくつかのベンチマークタスクを確立する。 BIOSCAN-5Mは500万以上の昆虫標本のマルチモーダル情報を含む包括的データセットであり、分類学的ラベル、生ヌクレオチドバーコード配列、割り当てられたバーコードインデックス番号、地理的、サイズ情報を含む既存の画像ベースの生物学的データセットを著しく拡張する。マルチモーダルデータ型が分類とクラスタリングの精度に与える影響を示すための3つのベンチマーク実験を提案する。まず、BIOSCAN-5MデータセットのDNAバーコード配列にマスク付き言語モデルを事前学習し、この大きな参照ライブラリが種と種レベルの分類性能に与える影響を実証する。次に、自己教師付き学習から得られたクラスタ特徴埋め込みに画像やDNAバーコードに適用したゼロショット転送学習タスクを提案し、これらの表現埋め込みから有意義なクラスタを抽出できるかどうかを検討する。第3に、DNAバーコード、画像データ、分類情報に対してコントラスト学習を行うことにより、マルチモダリティをベンチマークする。これにより、複数の種類の情報とモダリティを用いた分類学的分類を可能にする一般的な共有埋め込み空間が得られる。 BIOSCAN-5M Insectデータセットのコードリポジトリはhttps://github.com/bioscan-ml/BIOSCAN-5Mで公開されている。

関連論文リスト

Hyperbolic Multimodal Representation Learning for Biological Taxonomies [23.639218053531962]
生物多様性研究における分類学的分類は、証拠に基づいて生物学的標本を構造化階層に分類することを含む。このような階層モデルに対して,双曲型ネットワークがより良い埋め込み空間を提供できるかどうかを検討する。提案手法は, マルチモーダルな入力を, コントラッシブと新規な重み付きエンテーメントに基づく目的を用いた共有双曲空間に埋め込む。
論文参考訳（メタデータ） (2025-08-22T18:52:50Z)
A multi-modal dataset for insect biodiversity with imagery and DNA at the trap and individual level [12.817729932901779]
本研究は,昆虫標本の自動分類器を訓練するための混合節足類標本同定データセット(MassID45)について述べる。これは、分類されていないサンプルレベルと、個々の標本の完全なセットの両方で、分子とイメージングのデータを一意に組み合わせている。 AI支援ツールによって支えられた人間のアノテーションは、各節足動物の周囲にセグメンテーションマスクを作成し、17万以上の標本に分類学的ラベルを割り当てるという、バルク画像の2つのタスクを実行した。
論文参考訳（メタデータ） (2025-07-09T16:03:06Z)
CrypticBio: A Large Multimodal Dataset for Visually Confusing Biodiversity [3.73232466691291]
我々はCrypticBioについて紹介する。 iNaturalistのコミュニティアノテーターの間では、実際の種誤認の傾向から批判され、CrypticBioは67K種にまたがる52Kの独特な暗号グループを含んでいる。
論文参考訳（メタデータ） (2025-05-16T14:35:56Z)
BarcodeMamba: State Space Models for Biodiversity Analysis [14.524535359259414]
BarcodeMambaは、生物多様性分析におけるDNAバーコードのパフォーマンスと効率的な基礎モデルである。本研究は,BarcodeMambaがパラメータの8.3%しか使用していない場合でも,BarcodeBERTよりも優れた性能を示した。スケーリング調査では、BarcodeBERTのパラメータの63.6%のBarcodeMambaが、1-nearest neighbor(1-NN)探索で70.2%の遺伝子レベルの精度を達成した。
論文参考訳（メタデータ） (2024-12-15T06:52:18Z)
FungiTastic: A multi-modal dataset and benchmark for image categorization [21.01939456569417]
我々は,20年間にわたって連続的に収集された菌類記録に基づいて,新しいベンチマークとデータセットFungiTasticを導入する。データセットは専門家によってラベル付けされ、キュレーションされ、5kの細粒度カテゴリー(種)の約350kのマルチモーダル観測で構成されている。 FungiTasticは、前例のないラベルの信頼性に関するDNA配列の真実をテストセットを含む数少ないベンチマークの1つである。
論文参考訳（メタデータ） (2024-08-24T17:22:46Z)
CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale [21.995678534789615]
コントラスト学習を用いて画像、バーコードDNA、および統合埋め込み空間における分類ラベルのテキストベース表現を整列する。本手法は、ゼロショット学習タスクにおいて、従来の単一モダリティアプローチを8%以上精度で上回る。
論文参考訳（メタデータ） (2024-05-27T17:57:48Z)
UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文参考訳（メタデータ） (2024-02-20T11:50:27Z)
BarcodeBERT: Transformers for Biodiversity Analysis [19.082058886309028]
本稿では,生物多様性解析のための自己管理手法BarcodeBERTを提案する。大規模なDNAバーコードデータセットで事前訓練されたBarcodeBERTは、複数の下流分類タスクでDNABERTとDNABERT-2を上回っている。
論文参考訳（メタデータ） (2023-11-04T13:25:49Z)
A Step Towards Worldwide Biodiversity Assessment: The BIOSCAN-1M Insect Dataset [18.211840156134784]
本稿では,画像に基づく分類学的評価が可能なコンピュータビジョンモデルの訓練を目的とした,100万画像データセットを提案する。このデータセットは魅力的な特徴も示しており、その研究はより広範な機械学習コミュニティにとって興味深いものとなるだろう。
論文参考訳（メタデータ） (2023-07-19T20:54:08Z)
Multimodal Masked Autoencoders Learn Transferable Representations [127.35955819874063]
単純でスケーラブルなネットワークアーキテクチャであるM3AE(Multimodal Masked Autoencoder)を提案する。 M3AEは、マスク付きトークン予測により、視覚と言語データの両方の統一エンコーダを学習する。我々は,大規模な画像テキストデータセット上で訓練されたM3AEについて実証的研究を行い,M3AEが下流タスクによく伝達される一般化可能な表現を学習できることを見出した。
論文参考訳（メタデータ） (2022-05-27T19:09:42Z)
Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy [69.07918114341298]
大規模データセットはコンピュータビジョンにおいて重要な役割を果たす。既存のデータセットはラベルシステムに従って収集されるか、サンプルを区別せずに盲目的に収集される。我々は,包括的ラベルシステム上で,積極的に注釈付きかつ継続的な高品質な視覚データセットの構築を提唱する。
論文参考訳（メタデータ） (2022-03-15T13:01:00Z)
One Model is All You Need: Multi-Task Learning Enables Simultaneous Histology Image Segmentation and Classification [3.8725005247905386]
組織領域のセグメンテーションと分類のためのマルチタスク学習手法を提案する。一つのネットワークで同時予測を可能にする。また,機能共有の結果,学習した表現が下流タスクの改善に有効であることを示す。
論文参考訳（メタデータ） (2022-02-28T20:22:39Z)
G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。 2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文参考訳（メタデータ） (2021-01-27T19:28:04Z)
A Trainable Optimal Transport Embedding for Feature Aggregation and its Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文参考訳（メタデータ） (2020-06-22T08:35:58Z)
Automatic image-based identification and biomass estimation of invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文参考訳（メタデータ） (2020-02-05T21:38:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。