論文の概要: Insect Identification in the Wild: The AMI Dataset
- arxiv url: http://arxiv.org/abs/2406.12452v2
- Date: Mon, 30 Sep 2024 03:56:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 22:01:53.586792
- Title: Insect Identification in the Wild: The AMI Dataset
- Title(参考訳): 野生における昆虫の識別:AMIデータセット
- Authors: Aditya Jain, Fagner Cunha, Michael James Bunsen, Juan Sebastián Cañas, Léonard Pasi, Nathan Pinoy, Flemming Helsing, JoAnne Russo, Marc Botham, Michael Sabourin, Jonathan Fréchette, Alexandre Anctil, Yacksecari Lopez, Eduardo Navarro, Filonila Perez Pimentel, Ana Cecilia Zamora, José Alejandro Ramirez Silva, Jonathan Gagnon, Tom August, Kim Bjerge, Alba Gomez Segura, Marc Bélisle, Yves Basset, Kent P. McFarland, David Roy, Toke Thomas Høye, Maxim Larrivée, David Rolnick,
- Abstract要約: 昆虫は世界の生物多様性の半分を占めるが、世界の昆虫の多くは姿を消している。
この危機にもかかわらず、昆虫の多様性と豊かさに関するデータはいまだに不十分である。
昆虫認識のための大規模な機械学習ベンチマークを初めて提供します。
- 参考スコア(独自算出の注目度): 35.41544843896443
- License:
- Abstract: Insects represent half of all global biodiversity, yet many of the world's insects are disappearing, with severe implications for ecosystems and agriculture. Despite this crisis, data on insect diversity and abundance remain woefully inadequate, due to the scarcity of human experts and the lack of scalable tools for monitoring. Ecologists have started to adopt camera traps to record and study insects, and have proposed computer vision algorithms as an answer for scalable data processing. However, insect monitoring in the wild poses unique challenges that have not yet been addressed within computer vision, including the combination of long-tailed data, extremely similar classes, and significant distribution shifts. We provide the first large-scale machine learning benchmarks for fine-grained insect recognition, designed to match real-world tasks faced by ecologists. Our contributions include a curated dataset of images from citizen science platforms and museums, and an expert-annotated dataset drawn from automated camera traps across multiple continents, designed to test out-of-distribution generalization under field conditions. We train and evaluate a variety of baseline algorithms and introduce a combination of data augmentation techniques that enhance generalization across geographies and hardware setups.
- Abstract(参考訳): 昆虫は世界の生物多様性の半分を占めているが、世界の昆虫の多くは絶滅しており、生態系や農業に深刻な影響を及ぼしている。
この危機にもかかわらず、人間の専門家が不足し、監視のためのスケーラブルなツールが不足しているため、昆虫の多様性と豊かさに関するデータはいまだに不十分である。
生態学者は、昆虫を記録・研究するためにカメラトラップを採用し始め、スケーラブルなデータ処理の解決策としてコンピュータビジョンアルゴリズムを提案している。
しかし、野生の昆虫の監視は、長い尾のデータの組み合わせ、非常に類似したクラス、大きな分布シフトなど、コンピュータビジョンの中でまだ解決されていない、ユニークな課題を生んでいる。
我々は、生態学者が直面している現実世界のタスクにマッチするように設計された、昆虫認識のための最初の大規模な機械学習ベンチマークを提供する。
私たちのコントリビューションには、市民科学プラットフォームや博物館からのイメージのキュレートされたデータセットや、複数の大陸にまたがる自動カメラトラップから抽出された専門家による注釈付きデータセットが含まれています。
各種ベースラインアルゴリズムを訓練,評価し,地理的およびハードウェア構成の一般化を促進するデータ拡張技術の組み合わせを導入する。
関連論文リスト
- Can-Do! A Dataset and Neuro-Symbolic Grounded Framework for Embodied Planning with Large Multimodal Models [85.55649666025926]
具体的計画能力を評価するために設計されたベンチマークデータセットであるCan-Doを紹介する。
私たちのデータセットには400のマルチモーダルサンプルが含まれており、それぞれが自然言語のユーザ指示、環境を描写した視覚イメージ、状態変化、対応するアクションプランで構成されています。
ニューログラウンド(NeuroGround)は、まず認識された環境状態において計画生成を基礎とし、次に象徴的な計画エンジンを活用してモデル生成計画を強化する、ニューログラウンド(NeuroGround)を提案する。
論文 参考訳(メタデータ) (2024-09-22T00:30:11Z) - A machine learning pipeline for automated insect monitoring [17.034158815607128]
カメラトラップは、これまでは地上の脊椎動物をモニタリングするために用いられていました。
われわれは、カメラトラップによるマウスの自動監視のための、完全なオープンソースの機械学習ベースのソフトウェアパイプラインについて説明する。
論文 参考訳(メタデータ) (2024-06-18T19:51:16Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - A Step Towards Worldwide Biodiversity Assessment: The BIOSCAN-1M Insect
Dataset [18.211840156134784]
本稿では,画像に基づく分類学的評価が可能なコンピュータビジョンモデルの訓練を目的とした,100万画像データセットを提案する。
このデータセットは魅力的な特徴も示しており、その研究はより広範な機械学習コミュニティにとって興味深いものとなるだろう。
論文 参考訳(メタデータ) (2023-07-19T20:54:08Z) - Machine Learning Challenges of Biological Factors in Insect Image Data [3.867363075280544]
BIOSCANプロジェクトは、世界規模での生物多様性の変化の研究を目指している。
プロジェクトの1つの構成要素は、すべての昆虫の種間相互作用と動学の研究である。
年間150万枚以上の画像が収集され、それぞれが分類学的な分類を必要とする。
論文 参考訳(メタデータ) (2022-11-04T15:58:20Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - Spatial Monitoring and Insect Behavioural Analysis Using Computer Vision
for Precision Pollination [6.2997667081978825]
昆虫は作物の最も重要な世界的な受粉者であり、自然生態系の持続可能性を維持する上で重要な役割を担っている。
現在のコンピュータビジョンは、複雑な屋外環境における昆虫追跡を空間的に制限している。
本稿では,昆虫数計測,昆虫の動き追跡,行動解析,受粉予測のためのマーカーレスデータキャプチャーシステムを紹介する。
論文 参考訳(メタデータ) (2022-05-10T05:11:28Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - Seeing biodiversity: perspectives in machine learning for wildlife
conservation [49.15793025634011]
機械学習は、野生生物種の理解、モニタリング能力、保存性を高めるために、この分析的な課題を満たすことができると我々は主張する。
本質的に、新しい機械学習アプローチとエコロジー分野の知識を組み合わせることで、動物生態学者は現代のセンサー技術が生み出すデータの豊富さを生かすことができる。
論文 参考訳(メタデータ) (2021-10-25T13:40:36Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。