論文の概要: Democratising Camera Trap AI: An Open-Source Model for Detecting UK Mammals
- arxiv url: http://arxiv.org/abs/2606.10940v1
- Date: Tue, 09 Jun 2026 14:47:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.563473
- Title: Democratising Camera Trap AI: An Open-Source Model for Detecting UK Mammals
- Title(参考訳): カメラトラップAIの民主化:英国の乳房を検知するオープンソースモデル
- Authors: Paul Fergus, Philip Stephens, Russell A. Hill, Lee Oliver, Katie Appleby, Sarah Beatham, Naomi Davies Walsh, Stuart Nixon, Naomi Matthews, Chris Sutherland, Kelly Hitchcock,
- Abstract要約: 我々は,31クラス,英産哺乳類28種,鳥28種,人間用ユーティリティクラス,キャリブレーションポールおよび車両用のオープンソースオブジェクト検出モデルをリリースする。
このモデルは、ホールドアウト検証セット上で0.5 (0.956 at IoU 0.5-0.95)のIntersection over Union (IoU)における平均0.984の平均精度を達成する。
我々は、ONNXフォーマットで訓練された重量を非商用ライセンスでリリースし、ローカルデスクトップとリアルタイムカメラをサポートする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera traps have become a cornerstone of biodiversity monitoring, but the artificial intelligence that turns vast quantities of images into usable ecological data is often locked behind commercial platforms or trained on fauna that does not match that of the British Isles. In an attempt to remove barriers and increase uptake, we release an open-source object detection model for 31 classes, 28 common UK mammal and bird species, plus utility classes for humans, calibration poles, and vehicles, drawn from a curated dataset of 48,165 labelled instances assembled from multiple sites over a decade of operational deployment through Conservation AI and its successor, Trap Tracker. The model, a YOLO26x detector trained and tested on an 80/10/10 class-stratified split, achieves a mean Average Precision of 0.984 at Intersection over Union (IoU) of 0.5 (0.956 at IoU 0.5-0.95) on the held-out validation set, with precision 0.988 and recall 0.965. On an unseen held-out test split, mean per-species confidence ranged from 0.96 to 0.99 across the 31 classes, with a 0.17% false-negative rate concentrated in difficult night-time, distant, or occluded images. These metrics are from data from the same pool of sites and cameras as training, so performance at entirely new sites is left to future work. We release the trained weights in ONNX format under a non-commercial licence, with local desktop and real-time camera support, aimed explicitly at ecologists with no machine-learning experience. This release is a deliberate counterweight to the multiple paid for models that have developed over the last decade.
- Abstract(参考訳): カメラトラップは生物多様性監視の基盤となっているが、大量の画像を使用可能な生態データに変換する人工知能は、しばしば商業用プラットフォームの後ろに閉じ込められている。
バリアの除去と取り込み向上を目的として,我々は,Create AIとその後継であるTrap Trackerを通じて10年以上にわたり,複数のサイトから収集された48,165個のラベル付きデータセットから抽出された,31のクラス,28の英産哺乳類および鳥類のオープンソースオブジェクト検出モデルと,人間,キャリブレーションポール,車両のユーティリティクラスを公表した。
YOLO26x検出器は80/10/10の階層分割で訓練され、平均精度0.984(IoU 0.5-0.95で0.5(IoU 0.5-0.95で0.956)、精度0.988、リコール0.965)を達成する。
観察不能なテスト分割では、31のクラスで1種当たりの信頼度は0.96から0.99で、夜間、遠方、または隠蔽画像に0.17%の偽陰性率が集中していた。
これらの指標はトレーニングと同じサイトとカメラのプールから得られたデータなので、全く新しいサイトのパフォーマンスは将来の作業に委ねられている。
我々は、ローカルデスクトップとリアルタイムカメラをサポートする非商用ライセンスの下で、トレーニングされた重量をONNX形式でリリースし、機械学習経験のない生態学者を対象とする。
このリリースは、過去10年間に開発されたモデルの複数の有料モデルに対して、意図的に対抗するものだ。
関連論文リスト
- Weakly supervised framework for wildlife detection and counting in challenging Arctic environments: a case study on caribou (Rangifer tarandus) [0.0]
本稿では,検出ネットワークのアーキテクチャに基づく,弱教師付きパッチレベルの事前トレーニングを提案する。
このデータセットには、アラスカに分布する5つのカリブー群れが含まれている。
論文 参考訳(メタデータ) (2026-01-26T19:02:18Z) - Zero-Shot Wildlife Sorting Using Vision Transformers: Evaluating Clustering and Continuous Similarity Ordering [0.0]
カメラトラップは何百万もの野生生物の画像を生成するが、多くのデータセットには既存の分類器にはない種が含まれている。
本研究は、自己監督型視覚変換器を用いて、ラベルなし野生生物画像の整理のためのゼロショットアプローチを評価する。
論文 参考訳(メタデータ) (2025-10-16T11:59:18Z) - Improved detection of discarded fish species through BoxAL active learning [0.2544632696242629]
本研究では,より高速なR-CNNオブジェクト検出モデルの認識精度を推定する,BoxALという能動的学習手法を提案する。
この方法では、未ラベルのプールから最も不確実なトレーニングイメージを選択し、オブジェクト検出モデルのトレーニングに使用することができる。
また,本研究では,サンプル化した新データが,未ラベルデータよりもトレーニングに有用であることが確認された。
論文 参考訳(メタデータ) (2024-10-07T10:01:30Z) - Uncertainty-inspired Open Set Learning for Retinal Anomaly
Identification [71.06194656633447]
9つの網膜条件の基底像をトレーニングし,不確実性に着想を得たオープンセット(UIOS)モデルを構築した。
しきい値戦略を持つUIOSモデルはF1スコア99.55%、97.01%、91.91%を達成した。
UIOSは、高い不確実性スコアを正しく予測し、非ターゲットの網膜疾患、低品質の眼底画像、および非基本画像のデータセットを手動でチェックする必要があることを示唆した。
論文 参考訳(メタデータ) (2023-04-08T10:47:41Z) - Filtering Empty Camera Trap Images in Embedded Systems [0.0]
本稿では,動物認識モデルの比較研究を行い,エッジデバイス上での精度と推論遅延のトレードオフを解析する。
実験の結果、同じ画像をトレーニングに使用すると、検出器の性能が向上することがわかった。
検出問題のラベルを生成するコストが高いことを考えると、分類にラベル付けされた大量の画像が存在する場合、分類器は検出器に匹敵する結果が得られるが、半分のレイテンシを持つ。
論文 参考訳(メタデータ) (2021-04-18T13:56:22Z) - Intra-Inter Camera Similarity for Unsupervised Person Re-Identification [50.85048976506701]
擬似ラベル生成のための新しいカメラ内類似性について検討する。
re-idモデルをカメラ内およびカメラ間擬似ラベルを用いて2段階訓練した。
この単純なinter-inter cameraの類似性は、複数のデータセットで驚くほど優れたパフォーマンスを生み出す。
論文 参考訳(メタデータ) (2021-03-22T08:29:04Z) - A CNN Approach to Simultaneously Count Plants and Detect Plantation-Rows
from UAV Imagery [56.10033255997329]
畳み込みニューラルネットワーク(CNN)を用いた新しい深層学習手法を提案する。
高度に乾燥したプランテーション構成を考慮した植物を数えながら、同時にプランテーション・ロウを検出し、配置する。
提案手法は、異なる種類の作物のUAV画像において、植物と植物をカウントおよびジオロケートするための最先端の性能を達成した。
論文 参考訳(メタデータ) (2020-12-31T18:51:17Z) - An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation [80.02124918255059]
半教師付き学習は、ラベルなし画像の探索によってモデルの精度を高めることを目的としている。
私たちは相互に教え合うために2つのネットワークを学びます。
各ネットワーク内の容易なイメージに関するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
論文 参考訳(メタデータ) (2020-11-25T03:29:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。