論文の概要: Multispecies Animal Re-ID Using a Large Community-Curated Dataset
- arxiv url: http://arxiv.org/abs/2412.05602v1
- Date: Sat, 07 Dec 2024 09:56:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:55:20.661488
- Title: Multispecies Animal Re-ID Using a Large Community-Curated Dataset
- Title(参考訳): 大規模コミュニティキュレートデータセットを用いた多種動物Re-ID
- Authors: Lasha Otarashvili, Tamilselvan Subramanian, Jason Holmberg, J. J. Levenson, Charles V. Stewart,
- Abstract要約: 我々は、49種、37K個体、および225K画像を含むデータセットを構築し、このデータを用いて、すべての種に対して単一の埋め込みネットワークをトレーニングする。
我々のモデルは、各種で個別に訓練されたモデルより一貫して優れており、トップ1の精度で平均12.5%向上している。
このモデルは、大規模な野生生物モニタリングシステムですでに60種以上で生産されている。
- 参考スコア(独自算出の注目度): 0.19418036471925312
- License:
- Abstract: Recent work has established the ecological importance of developing algorithms for identifying animals individually from images. Typically, a separate algorithm is trained for each species, a natural step but one that creates significant barriers to wide-spread use: (1) each effort is expensive, requiring data collection, data curation, and model training, deployment, and maintenance, (2) there is little training data for many species, and (3) commonalities in appearance across species are not exploited. We propose an alternative approach focused on training multi-species individual identification (re-id) models. We construct a dataset that includes 49 species, 37K individual animals, and 225K images, using this data to train a single embedding network for all species. Our model employs an EfficientNetV2 backbone and a sub-center ArcFace loss function with dynamic margins. We evaluate the performance of this multispecies model in several ways. Most notably, we demonstrate that it consistently outperforms models trained separately on each species, achieving an average gain of 12.5% in top-1 accuracy. Furthermore, the model demonstrates strong zero-shot performance and fine-tuning capabilities for new species with limited training data, enabling effective curation of new species through both incremental addition of data to the training set and fine-tuning without the original data. Additionally, our model surpasses the recent MegaDescriptor on unseen species, averaging an 19.2% top-1 improvement per species and showing gains across all 33 species tested. The fully-featured code repository is publicly available on GitHub, and the feature extractor model can be accessed on HuggingFace for seamless integration with wildlife re-identification pipelines. The model is already in production use for 60+ species in a large-scale wildlife monitoring system.
- Abstract(参考訳): 近年の研究は、画像から動物を識別するアルゴリズムを開発することの生態学的重要性を確立している。
典型的には、個別のアルゴリズムは各種について訓練されるが、それは自然のステップであり、(1)データ収集、データキュレーション、モデルトレーニング、展開、保守を必要とする費用がかかること、(2)多くの種に対するトレーニングデータが少ないこと、(3)種間の外観の共通性は利用されないこと、である。
本稿では,多種個別識別(re-id)モデルの訓練に焦点をあてた代替手法を提案する。
我々は、49種、37K個体、および225K画像を含むデータセットを構築し、このデータを用いて、すべての種に対して単一の埋め込みネットワークをトレーニングする。
我々のモデルは、EfficientNetV2バックボーンと、ダイナミックマージンを持つサブセンタArcFace損失関数を採用している。
我々は,この多種多種モデルの性能をいくつかの点で評価した。
最も注目すべきは、各種で個別に訓練されたモデルよりも一貫して優れており、トップ1の精度で平均12.5%向上していることである。
さらに,本モデルでは,訓練データを限定した新種のゼロショット性能と微調整能力を示し,トレーニングセットへのデータのインクリメンタルな付加と,原データなしでの微調整を両立させることにより,新種の効果的なキュレーションを可能にする。
さらに、我々のモデルは、近年のMegaDescriptorを上回り、平均して1種あたり19.2%のTop-1の改善を達成し、テストされた33種すべてに利益をもたらしている。
フル機能のコードリポジトリはGitHubで公開されており、機能抽出モデルがHuggingFaceでアクセスでき、野生生物の再識別パイプラインとのシームレスな統合が可能になる。
このモデルは、大規模な野生生物モニタリングシステムですでに60種以上で生産されている。
関連論文リスト
- CKSP: Cross-species Knowledge Sharing and Preserving for Universal Animal Activity Recognition [7.012560255346829]
我々は,多種多様な動物種のセンサデータに基づいて,多種間知識共有保存(CKSP)と呼ばれる一対一のフレームワークを提案する。
一般的な特徴を学習するために、共有されたフルランクの畳み込み層を使用し、CKSPフレームワークは種間の相補性を学ぶことができる。
種間のデータ分布の相違から生じる訓練競合を考慮し,種別バッチ正規化(SBN)モジュールを考案した。
論文 参考訳(メタデータ) (2024-10-22T02:44:10Z) - Comparison of self-supervised in-domain and supervised out-domain transfer learning for bird species recognition [0.19183348587701113]
別のタスクを支援するために事前訓練されたモデルの重みを移すことは、現代のディープラーニングの重要な部分となっている。
本実験は,鳥種認識のためのドメイン内モデルとデータセットの有用性を実証するものである。
論文 参考訳(メタデータ) (2024-04-26T08:47:28Z) - Learning the 3D Fauna of the Web [70.01196719128912]
3D-Faunaは,100種以上の動物種を対象に,パンカテゴリーで変形可能な3D動物モデルを共同で学習する手法である。
動物モデリングにおける重要なボトルネックの1つは、トレーニングデータの可用性の制限である。
従来のカテゴリー固有の試みは,訓練画像に制限のある希少種への一般化に失敗することを示す。
論文 参考訳(メタデータ) (2024-01-04T18:32:48Z) - Species196: A One-Million Semi-supervised Dataset for Fine-grained
Species Recognition [30.327642724046903]
種196(英: species 196)は、196科の外来種の大規模な半教師付きデータセットである。
専門家レベルの正確なアノテーションである種196-Lと、侵入種196-Uの1.2M以上のラベルのない画像を集めている。
論文 参考訳(メタデータ) (2023-09-25T14:46:01Z) - On the Connection between Pre-training Data Diversity and Fine-tuning
Robustness [66.30369048726145]
下流の有効ロバスト性に影響を与える主な要因はデータ量である。
各種自然および合成データソースから抽出した事前学習分布について,本研究の成果を示す。
論文 参考訳(メタデータ) (2023-07-24T05:36:19Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - DINOv2: Learning Robust Visual Features without Supervision [75.42921276202522]
この研究は、既存の事前学習手法、特に自己教師付き手法が、多様なソースから十分なキュレートされたデータで訓練すれば、そのような特徴を生み出すことができることを示している。
技術的な貢献の多くは、大規模なトレーニングを加速し、安定化することを目的としています。
データの観点からは、自己組織化されていないデータではなく、専用で多様でキュレートされた画像データセットを構築するための自動パイプラインを提案する。
論文 参考訳(メタデータ) (2023-04-14T15:12:19Z) - Solutions for Fine-grained and Long-tailed Snake Species Recognition in
SnakeCLEF 2022 [30.8004334312293]
我々はSnakeCLEF 2022でヘビの種を認識できる方法を紹介した。
いくつかの異なるモデルのアンサンブルにより、3位にランクインしたプライベートスコア82.65%が最終リーダーボードで達成される。
論文 参考訳(メタデータ) (2022-07-04T05:55:58Z) - SuperAnimal pretrained pose estimation models for behavioral analysis [42.206265576708255]
行動の定量化は神経科学、獣医学、動物保護活動など様々な応用において重要である。
我々は、SuperAnimalと呼ばれる新しい手法で統一基盤モデルを開発するための一連の技術革新を提案する。
論文 参考訳(メタデータ) (2022-03-14T18:46:57Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。