論文の概要: CrypticBio: A Large Multimodal Dataset for Visually Confusing Biodiversity
- arxiv url: http://arxiv.org/abs/2505.14707v1
- Date: Fri, 16 May 2025 14:35:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:58.635245
- Title: CrypticBio: A Large Multimodal Dataset for Visually Confusing Biodiversity
- Title(参考訳): CrypticBio: 生物多様性を視覚的に理解するための大規模マルチモーダルデータセット
- Authors: Georgiana Manolache, Gerard Schouten, Joaquin Vanschoren,
- Abstract要約: 我々はCrypticBioについて紹介する。
iNaturalistのコミュニティアノテーターの間では、実際の種誤認の傾向から批判され、CrypticBioは67K種にまたがる52Kの独特な暗号グループを含んでいる。
- 参考スコア(独自算出の注目度): 3.73232466691291
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present CrypticBio, the largest publicly available multimodal dataset of visually confusing species, specifically curated to support the development of AI models in the context of biodiversity applications. Visually confusing or cryptic species are groups of two or more taxa that are nearly indistinguishable based on visual characteristics alone. While much existing work addresses taxonomic identification in a broad sense, datasets that directly address the morphological confusion of cryptic species are small, manually curated, and target only a single taxon. Thus, the challenge of identifying such subtle differences in a wide range of taxa remains unaddressed. Curated from real-world trends in species misidentification among community annotators of iNaturalist, CrypticBio contains 52K unique cryptic groups spanning 67K species, represented in 166 million images. Rich research-grade image annotations--including scientific, multicultural, and multilingual species terminology, hierarchical taxonomy, spatiotemporal context, and associated cryptic groups--address multimodal AI in biodiversity research. For easy dataset curation, we provide an open-source pipeline CrypticBio-Curate. The multimodal nature of the dataset beyond vision-language arises from the integration of geographical and temporal data as complementary cues to identifying cryptic species. To highlight the importance of the dataset, we benchmark a suite of state-of-the-art foundation models across CrypticBio subsets of common, unseen, endangered, and invasive species, and demonstrate the substantial impact of geographical context on vision-language zero-shot learning for cryptic species. By introducing CrypticBio, we aim to catalyze progress toward real-world-ready biodiversity AI models capable of handling the nuanced challenges of species ambiguity.
- Abstract(参考訳): 我々はCrypticBioについて紹介する。CrypticBioは、視覚的に紛らわしい種のマルチモーダルデータセットで、生物多様性応用の文脈におけるAIモデルの開発を支援するために特別に作成されている。
視覚的に紛らわしい種は2つ以上の分類群であり、視覚的特徴のみに基づいてほとんど区別できない。
多くの既存の研究は、広い意味での分類学的同定に対処しているが、隠蔽種の形態的混乱に直接対処するデータセットは小さく、手作業でキュレートされ、1つの分類群のみをターゲットにしている。
このように、広範囲の分類群でこのような微妙な違いを特定するという課題は、未解決のままである。
CrypticBioは、iNaturalistのコミュニティアノテーターの間で、種誤認の現実的な傾向から、67K種にまたがる52Kのユニークな隠蔽群を1億6600万枚の画像で表現している。
リッチリサーチグレードの画像アノテーション - 科学的、多文化的、多言語種分類学、階層分類学、時空間的文脈、関連する暗号グループを含む。
簡単なデータセットのキュレーションのために、オープンソースのパイプラインCrypticBio-Curateを提供しています。
視覚言語を超越したデータセットのマルチモーダルな性質は、地理的および時間的データを相補的な手段として統合することから生じる。
このデータセットの重要性を強調するため、CrypticBioサブセットの共通、見えざる、絶滅危惧種、外来種を対象とし、最先端の基盤モデルをベンチマークし、地理的文脈が暗黙の種に対する視覚言語ゼロショット学習に与える影響を実証した。
CrypticBioを導入することで、種あいまいさの微妙な問題に対処できる現実世界対応の生物多様性AIモデルへの進歩を触媒することを目指している。
関連論文リスト
- BioCube: A Multimodal Dataset for Biodiversity Research [0.6749750044497732]
生態学および生物多様性研究のための微細なグローバルデータセットであるBioCubeを紹介する。
BioCubeは、画像、オーディオ記録、説明、環境DNA、植生指標、農業、森林、土地の指標、高解像度気候変数を通じて種を観察する。
すべての観測は、2000年から2020年の間、WGS84の測地システムの下で測地的に一致している。
論文 参考訳(メタデータ) (2025-05-16T09:46:08Z) - Taxonomic Reasoning for Rare Arthropods: Combining Dense Image Captioning and RAG for Interpretable Classification [12.923336716880506]
画像キャプションと検索拡張生成(RAG)を大規模言語モデル(LLM)と統合し,生物多様性モニタリングを強化する。
我々の発見は、生物多様性保護イニシアチブをサポートする現代のビジョン言語AIパイプラインの可能性を強調した。
論文 参考訳(メタデータ) (2025-03-13T21:18:10Z) - Biology Instructions: A Dataset and Benchmark for Multi-Omics Sequence Understanding Capability of Large Language Models [51.316001071698224]
本稿では,生物配列関連命令チューニングデータセットであるBiology-Instructionsを紹介する。
このデータセットは、大きな言語モデル(LLM)と複雑な生物学的シーケンスに関連するタスクのギャップを埋めることができます。
また、新たな3段階トレーニングパイプラインを備えたChatMultiOmicsという強力なベースラインも開発しています。
論文 参考訳(メタデータ) (2024-12-26T12:12:23Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - A Step Towards Worldwide Biodiversity Assessment: The BIOSCAN-1M Insect
Dataset [18.211840156134784]
本稿では,画像に基づく分類学的評価が可能なコンピュータビジョンモデルの訓練を目的とした,100万画像データセットを提案する。
このデータセットは魅力的な特徴も示しており、その研究はより広範な機械学習コミュニティにとって興味深いものとなるだろう。
論文 参考訳(メタデータ) (2023-07-19T20:54:08Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文 参考訳(メタデータ) (2021-04-17T18:39:22Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。