論文の概要: A Dataset and Application for Facial Recognition of Individual Gorillas
in Zoo Environments
- arxiv url: http://arxiv.org/abs/2012.04689v2
- Date: Fri, 26 Mar 2021 17:38:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 01:01:20.093429
- Title: A Dataset and Application for Facial Recognition of Individual Gorillas
in Zoo Environments
- Title(参考訳): 動物園環境におけるゴリラの顔認識のためのデータセットと応用
- Authors: Otto Brookes, Tilo Burghardt
- Abstract要約: 我々はブリストル動物園の7つの低地ゴリラの部隊に5k以上の顔境界ボックスアノテーションを用いたビデオデータセットを提出した。
動物園環境における個々のゴリラを顔で認識する作業において,標準的なディープラーニングパイプラインを実装し,評価する。
YOLOv3ベースのアプリケーションは,1フレームのみを利用する場合,92% mAPで識別を行うことができることを示す。
- 参考スコア(独自算出の注目度): 1.914535189888288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We put forward a video dataset with 5k+ facial bounding box annotations
across a troop of 7 western lowland gorillas at Bristol Zoo Gardens. Training
on this dataset, we implement and evaluate a standard deep learning pipeline on
the task of facially recognising individual gorillas in a zoo environment. We
show that a basic YOLOv3-powered application is able to perform identifications
at 92% mAP when utilising single frames only. Tracking-by-detection-association
and identity voting across short tracklets yields an improved robust
performance of 97% mAP. To facilitate easy utilisation for enriching the
research capabilities of zoo environments, we publish the code, video dataset,
weights, and ground-truth annotations at data.bris.ac.uk.
- Abstract(参考訳): 我々はブリストル動物園の7つの低地ゴリラの部隊に5k以上の顔境界ボックスアノテーションを用いたビデオデータセットを提出した。
このデータセットのトレーニングでは、動物園環境で個々のゴリラを顔認識するタスクにおいて、標準的なディープラーニングパイプラインを実装し、評価する。
YOLOv3ベースのアプリケーションは,1フレームのみを利用する場合,92% mAPで識別を行うことができることを示す。
トラックレット間のトラッキング・バイ・アソシエーションとアイデンティティ投票により、97%のロバスト性が向上した。
動物園環境の研究能力を向上するための活用を容易にするため,我々は,Data.bris.ac.ukでコード,ビデオデータセット,ウェイト,接地木アノテーションを公開している。
関連論文リスト
- OpenAnimalTracks: A Dataset for Animal Track Recognition [2.3020018305241337]
動物足跡の自動分類と検出を容易にするために設計された,最初の公開ラベル付きデータセットであるOpenAnimalTracksデータセットを紹介する。
代表分類器と検出モデルを用いた自動フットプリント識別の可能性を示す。
われわれのデータセットは、動物の自動追跡技術の道を切り開き、生物多様性の保護と管理の能力を高めることを願っている。
論文 参考訳(メタデータ) (2024-06-14T00:37:17Z) - From Forest to Zoo: Great Ape Behavior Recognition with ChimpBehave [0.0]
ChimpBehaveは動物園で飼育されているチンパンジーの2時間以上のビデオ(約193,000フレーム)を特徴とする新しいデータセットだ。
ChimpBehaveは、アクション認識のためのバウンディングボックスやビヘイビアラベルに細心の注意を払ってアノテートする。
我々は、最先端のCNNベースの行動認識モデルを用いてデータセットをベンチマークする。
論文 参考訳(メタデータ) (2024-05-30T13:11:08Z) - PanAf20K: A Large Video Dataset for Wild Ape Detection and Behaviour
Recognition [15.272335338021419]
PanAf20Kデータセットは、その自然環境における偉大な類人猿の、最大かつ最も多様なオープンアクセスアノテートビデオデータセットである。
熱帯アフリカの14の畑で収集されたチンパンジーとゴリラのカメラトラップビデオ2万枚に700万枚以上のフレームが含まれている。
論文 参考訳(メタデータ) (2024-01-24T16:13:24Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - PointOdyssey: A Large-Scale Synthetic Dataset for Long-Term Point
Tracking [90.29143475328506]
本稿では,大規模合成データセットとデータ生成フレームワークであるPointOdysseyを紹介する。
私たちのゴールは、自然主義的な動きを持つ長いビデオに重点を置いて、最先端の技術を推し進めることです。
実世界のモーションキャプチャーデータを用いて変形可能なキャラクタをアニメーション化し、モーションキャプチャー環境に合わせて3Dシーンを構築し、リアルビデオ上で構造から抽出したトラジェクトリを用いてカメラ視点を描画する。
論文 参考訳(メタデータ) (2023-07-27T17:58:11Z) - Meerkat Behaviour Recognition Dataset [3.53348643468069]
本稿では,多彩なアノテーション付き行動認識ビデオデータセットについて紹介する。
このデータセットにはウェリントン動物園(ニュージーランドのウェリントン)のメアカットの囲いの2箇所のビデオが含まれている。
論文 参考訳(メタデータ) (2023-06-20T06:50:50Z) - EasyPortrait -- Face Parsing and Portrait Segmentation Dataset [79.16635054977068]
リアルタイムの背景除去や顔の美化といったコンピュータビジョンベースの機能を実現することで,ビデオ会議アプリが機能的になった。
これらのタスクを同時に行うために、新しいデータセット、EasyPortraitを作成します。
13,705人のユニークなユーザーと9つのクラスに分かれたきめ細かいセグメンテーションマスクを備えた、ビデオ会議のシナリオを繰り返す4万枚の屋内写真が含まれている。
論文 参考訳(メタデータ) (2023-04-26T12:51:34Z) - APT-36K: A Large-scale Benchmark for Animal Pose Estimation and Tracking [77.87449881852062]
APT-36Kは動物のポーズ推定と追跡のための最初の大規模ベンチマークである。
このビデオは、30種の動物から収集・フィルタリングされた2,400のビデオクリップと、各ビデオの15フレームで構成されており、合計で36,000フレームとなっている。
我々は,(1)ドメイン内およびドメイン間移動学習環境下での単一フレームでの動物ポーズ推定,(2)未確認動物に対する種間ドメイン一般化テスト,(3)動物追跡による動物ポーズ推定の3つのモデルについて,いくつかの代表的モデルをベンチマークした。
論文 参考訳(メタデータ) (2022-06-12T07:18:36Z) - Animal Kingdom: A Large and Diverse Dataset for Animal Behavior
Understanding [4.606145900630665]
大規模で多様なデータセットであるAnimal Kingdomを作成し、複数の注釈付きタスクを提供します。
私たちのデータセットには、関連する動物行動セグメントをローカライズする50時間のアノテーション付きビデオが含まれています。
本研究では,未確認新種動物を用いた行動認識の一般的な特徴と特定の特徴を学習する協調行動認識(CARe)モデルを提案する。
論文 参考訳(メタデータ) (2022-04-18T02:05:15Z) - AcinoSet: A 3D Pose Estimation Dataset and Baseline Models for Cheetahs
in the Wild [51.35013619649463]
我々はAcinoSetと呼ばれる野生のフリーランニングチーターの広範なデータセットを提示する。
データセットには、119,490フレームのマルチビュー同期高速ビデオ映像、カメラキャリブレーションファイル、7,588フレームが含まれている。
また、結果の3D軌道、人間チェックされた3D地上真実、およびデータを検査するインタラクティブツールも提供される。
論文 参考訳(メタデータ) (2021-03-24T15:54:11Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。