論文の概要: Visual WetlandBirds Dataset: Bird Species Identification and Behavior Recognition in Videos
- arxiv url: http://arxiv.org/abs/2501.08931v1
- Date: Wed, 15 Jan 2025 16:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:53:17.115062
- Title: Visual WetlandBirds Dataset: Bird Species Identification and Behavior Recognition in Videos
- Title(参考訳): Visual WetlandBirds Dataset: ビデオにおける鳥の識別と行動認識
- Authors: Javier Rodriguez-Juan, David Ortiz-Perez, Manuel Benavent-Lledo, David Mulero-Pérez, Pablo Ruiz-Ponce, Adrian Orihuela-Torres, Jose Garcia-Rodriguez, Esther Sebastián-González,
- Abstract要約: 本研究では,鳥の行動検出と種分類に特化して設計されたビデオデータセットについて紹介する。
提案したデータセットは、スペインの湿地で記録された178のビデオで構成され、13の異なる鳥種が7つの異なる行動クラスを実行している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The current biodiversity loss crisis makes animal monitoring a relevant field of study. In light of this, data collected through monitoring can provide essential insights, and information for decision-making aimed at preserving global biodiversity. Despite the importance of such data, there is a notable scarcity of datasets featuring videos of birds, and none of the existing datasets offer detailed annotations of bird behaviors in video format. In response to this gap, our study introduces the first fine-grained video dataset specifically designed for bird behavior detection and species classification. This dataset addresses the need for comprehensive bird video datasets and provides detailed data on bird actions, facilitating the development of deep learning models to recognize these, similar to the advancements made in human action recognition. The proposed dataset comprises 178 videos recorded in Spanish wetlands, capturing 13 different bird species performing 7 distinct behavior classes. In addition, we also present baseline results using state of the art models on two tasks: bird behavior recognition and species classification.
- Abstract(参考訳): 現在の生物多様性喪失の危機は、動物のモニタリングを関連する研究分野にしている。
これを踏まえ、モニタリングによって収集されたデータは、地球規模の生物多様性を維持することを目的とした決定のための重要な洞察と情報を提供することができる。
このようなデータの重要性にもかかわらず、鳥のビデオを含むデータセットは顕著に不足しており、既存のデータセットにはビデオ形式で鳥の行動の詳細なアノテーションが提供されていない。
このギャップに対応するために,鳥の行動検出と種分類に特化して設計された,最初のきめ細かいビデオデータセットを紹介した。
このデータセットは、包括的な鳥のビデオデータセットの必要性に対処し、鳥の行動に関する詳細なデータを提供し、人間の行動認識の進歩と同様に、これらを認識するためのディープラーニングモデルの開発を容易にする。
提案したデータセットは、スペインの湿地で記録された178のビデオで構成され、13の異なる鳥種が7つの異なる行動クラスを実行している。
また,鳥の行動認識と種分類という2つの課題に対して,最先端モデルを用いたベースライン結果も提示する。
関連論文リスト
- From Forest to Zoo: Great Ape Behavior Recognition with ChimpBehave [0.0]
ChimpBehaveは動物園で飼育されているチンパンジーの2時間以上のビデオ(約193,000フレーム)を特徴とする新しいデータセットだ。
ChimpBehaveは、アクション認識のためのバウンディングボックスやビヘイビアラベルに細心の注意を払ってアノテートする。
我々は、最先端のCNNベースの行動認識モデルを用いてデータセットをベンチマークする。
論文 参考訳(メタデータ) (2024-05-30T13:11:08Z) - Predicting Species Occurrence Patterns from Partial Observations [21.009271008147785]
本稿では,(a)衛星画像を用いた種発生パターンの予測と,(b)他の種の発生に関する既知の情報を紹介する。
この課題に対して,衛星画像,環境データ,蝶の観察データのデータセットであるSatButterflyを導入する。
そこで本研究では,見つからない部分的な観測データの利用を可能にする種発生パターンを予測するための一般モデルR-Tranを提案する。
論文 参考訳(メタデータ) (2024-03-26T18:29:39Z) - Leveraging Habitat Information for Fine-grained Bird Identification [4.392299539811761]
我々は鳥類学者によって鳥類を識別する4つの主要な方法の1つである生息地情報を現代の鳥類分類器に組み込むことを最初に検討した。
我々は、下流の鳥のデータセットに基づいて訓練されたCNNとViTと、オリジナルのマルチモーダルCLIPの2つの主要なモデルタイプに焦点を当てる。
CNNとViTを生息地データでトレーニングすると、NABirdsとCUB-200で最大0.83点、+0.23点が改善される。
論文 参考訳(メタデータ) (2023-12-22T16:23:22Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - BirdSAT: Cross-View Contrastive Masked Autoencoders for Bird Species
Classification and Mapping [22.30038765017189]
本稿では,世界中の鳥類の詳細な分類と生態地図作成に有用なメタデータ認識型自己教師型学習(SSL)フレームワークを提案する。
当社のフレームワークは,コントラスト学習(CL)とMasked Image Modeling(MIM)の2つのSSL戦略を統合するとともに,鳥の地上レベルの画像にメタデータを付加した埋め込み空間を充実させる。
本研究では,小粒度の視覚的分類(FGVC)とクロスモーダル検索(クロスモーダル検索)という2つの下流課題に基づいて,鳥の細粒度・地理的に条件付けられた特徴を学習できることを実証した。
論文 参考訳(メタデータ) (2023-10-29T22:08:00Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - Transfer Learning with Semi-Supervised Dataset Annotation for Birdcall
Classification [0.0]
本研究では,BirdCLEF 2023コンペティションのための半教師付きデータセットアノテーションを用いたトランスファー学習について検討する。
提案手法では,既存の市販モデルであるBirdNETとMixITを用いて,コンペティションにおける表現とラベル付けの課題に対処する。
論文 参考訳(メタデータ) (2023-06-29T07:56:27Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文 参考訳(メタデータ) (2021-04-17T18:39:22Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。