論文の概要: OpenWildlife: Open-Vocabulary Multi-Species Wildlife Detector for Geographically-Diverse Aerial Imagery
- arxiv url: http://arxiv.org/abs/2506.19204v1
- Date: Tue, 24 Jun 2025 00:10:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.418885
- Title: OpenWildlife: Open-Vocabulary Multi-Species Wildlife Detector for Geographically-Diverse Aerial Imagery
- Title(参考訳): OpenWildlife: 地理的に多様な空中画像のためのオープン語彙多種野生生物検出器
- Authors: Muhammed Patel, Javier Noa Turnes, Jayden Hsiao, Linlin Xu, David Clausi,
- Abstract要約: 我々は,多種多様な航空画像の識別を目的としたオープン語彙野生生物検出器OpenWildlifeを紹介する。
OWは、言語を意識した埋め込みと、地上環境と海洋環境の両方で自然言語入力によって特定された種を識別するグラウンディング・ディノフレームワークの新たな適応を活用している。
OWは既存の手法よりも優れており、新しい種を含む7つのデータセットでtextbf0.981 mAP50を微調整し、textbf0.597 mAP50を達成している。
- 参考スコア(独自算出の注目度): 5.612783442210011
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce OpenWildlife (OW), an open-vocabulary wildlife detector designed for multi-species identification in diverse aerial imagery. While existing automated methods perform well in specific settings, they often struggle to generalize across different species and environments due to limited taxonomic coverage and rigid model architectures. In contrast, OW leverages language-aware embeddings and a novel adaptation of the Grounding-DINO framework, enabling it to identify species specified through natural language inputs across both terrestrial and marine environments. Trained on 15 datasets, OW outperforms most existing methods, achieving up to \textbf{0.981} mAP50 with fine-tuning and \textbf{0.597} mAP50 on seven datasets featuring novel species. Additionally, we introduce an efficient search algorithm that combines k-nearest neighbors and breadth-first search to prioritize areas where social species are likely to be found. This approach captures over \textbf{95\%} of species while exploring only \textbf{33\%} of the available images. To support reproducibility, we publicly release our source code and dataset splits, establishing OW as a flexible, cost-effective solution for global biodiversity assessments.
- Abstract(参考訳): 我々は,多種多様な航空画像の識別を目的としたオープン語彙野生生物検出器OpenWildlife (OW)を紹介した。
既存の自動化手法は特定の環境では良好に機能するが、分類学的カバレッジや厳密なモデルアーキテクチャのために、様々な種や環境をまたいだ一般化に苦慮することが多い。
対照的にOWは、言語を意識した埋め込みとグラウンディング・ディノフレームワークの新たな適応を活用し、地球環境と海洋環境の両方で自然言語入力によって特定された種を識別することができる。
15のデータセットで訓練され、OWは既存の手法よりも優れており、新しい種を特徴とする7つのデータセットに対して、微細チューニングで \textbf{0.981} mAP50と \textbf{0.597} mAP50を達成している。
さらに、k-アネレスト近傍と幅優先探索を組み合わせた効率的な探索アルゴリズムを導入し、社会種が見つかる可能性のある地域を優先順位付けする。
このアプローチは、利用可能な画像の \textbf{95\%} のみを探索しながら、種の \textbf{95\%} をキャプチャする。
再現性をサポートするため、我々はソースコードとデータセットの分割を公開し、OWをグローバルな生物多様性評価のためのフレキシブルで費用対効果の高いソリューションとして確立した。
関連論文リスト
- CrypticBio: A Large Multimodal Dataset for Visually Confusing Biodiversity [3.73232466691291]
我々はCrypticBioについて紹介する。
iNaturalistのコミュニティアノテーターの間では、実際の種誤認の傾向から批判され、CrypticBioは67K種にまたがる52Kの独特な暗号グループを含んでいる。
論文 参考訳(メタデータ) (2025-05-16T14:35:56Z) - VR-RAG: Open-vocabulary Species Recognition with RAG-Assisted Large Multi-Modal Models [33.346206174676794]
オープン・ボキャブラリ・バードの種認識に重点を置いており、その目的は、その記述に基づいて種を分類することである。
CUB-200-2011のような伝統的なベンチマークは、クローズド語彙パラダイムで評価されている。
設定条件下での評価における現在のシステムの性能は、オープン語彙のドロップと密接に一致していることが、大きなマージンで示されている。
論文 参考訳(メタデータ) (2025-05-08T20:33:31Z) - Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。
textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文 参考訳(メタデータ) (2025-04-16T09:57:23Z) - Feedforward Few-shot Species Range Estimation [61.60698161072356]
特定の種が地球上でどこで発見できるかを知ることは、生態学の研究と保全に不可欠である。
正確な射程推定は 知られている全ての種の 比較的小さな割合でしか 利用できない
我々は、限られたデータから種の範囲を正確に推定するという課題に対処するために、数発の種範囲推定の新しいアプローチを概説する。
論文 参考訳(メタデータ) (2025-02-20T19:13:29Z) - TaxaBind: A Unified Embedding Space for Ecological Applications [7.291750095728984]
興味のある種を識別するための統合埋め込み空間であるTaxaBindを提示する。
TaxaBindは、種の地上画像、地理的位置、衛星画像、テキスト、オーディオ、環境特徴の6つのモードにまたがるマルチモーダルな埋め込み空間である。
論文 参考訳(メタデータ) (2024-11-01T15:41:30Z) - Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - WildlifeDatasets: An open-source toolkit for animal re-identification [0.0]
WildlifeDatasetsは、生態学者とコンピュータビジョン/機械学習研究者のためのオープンソースのツールキットである。
WildlifeDatasetsはPythonで書かれており、公開されている野生生物データセットに簡単にアクセスできる。
我々は,MegaDescriptorという多種多様な種において,個人を再同定するための最初の基礎モデルを提供する。
論文 参考訳(メタデータ) (2023-11-15T17:08:09Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。