論文の概要: Zwitscherkasten -- DIY Audiovisual bird monitoring
- arxiv url: http://arxiv.org/abs/2602.13330v1
- Date: Wed, 11 Feb 2026 07:37:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:27.921934
- Title: Zwitscherkasten -- DIY Audiovisual bird monitoring
- Title(参考訳): Zwitscherkasten - DIYオーディオヴィジュアルバードモニタリング
- Authors: Dominik Blum, Elias Häring, Fabian Jirges, Martin Schäffer, David Schick, Florian Schulenberg, Torsten Schön,
- Abstract要約: Zwitscherkastenは、エッジデバイス上のオーディオおよび視覚データを使用して、鳥類種のモニタリングを行うためのDY、マルチモーダルシステムである。
バイオ音響および画像に基づく分類のためのディープラーニングモデルは、リソース制約のあるハードウェアにデプロイされる。
- 参考スコア(独自算出の注目度): 0.26385121748044166
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents Zwitscherkasten, a DiY, multimodal system for bird species monitoring using audio and visual data on edge devices. Deep learning models for bioacoustic and image-based classification are deployed on resource-constrained hardware, enabling real-time, non-invasive monitoring. An acoustic activity detector reduces energy consumption, while visual recognition is performed using fine-grained detection and classification pipelines. Results show that accurate bird species identification is feasible on embedded platforms, supporting scalable biodiversity monitoring and citizen science applications.
- Abstract(参考訳): 本稿では, エッジデバイス上での音声および視覚データを用いて, 鳥類種監視のための多モーダルシステムであるZwitscherkastenについて述べる。
バイオ音響および画像に基づく分類のためのディープラーニングモデルは、リソース制約のあるハードウェアにデプロイされ、リアルタイムで非侵襲的なモニタリングを可能にする。
音響活性検出器はエネルギー消費を低減し、微粒な検出と分類パイプラインを用いて視覚認識を行う。
以上の結果から, 鳥類の正確な識別が組込みプラットフォーム上で可能であり, スケーラブルな生物多様性モニタリングと市民科学の応用をサポートすることが示唆された。
関連論文リスト
- Investigating Target Class Influence on Neural Network Compressibility for Energy-Autonomous Avian Monitoring [36.85680419418593]
本研究では,マイクロコントローラユニット(MCU)を直接現場で動作させる機械学習モデルを提案する。
本研究は,複数種の鳥の発見を評価するために,様々な対象クラスのモデルを訓練し,圧縮した。
また、異なるハードウェアプラットフォームに対してベンチマーク結果を提供し、エネルギー自動デバイスをデプロイする可能性を評価する。
論文 参考訳(メタデータ) (2026-02-19T16:24:33Z) - Re-Identifying Kākā with AI-Automated Video Key Frame Extraction [0.0]
本研究では,k=ak=a(Nestor meridionalis)のビデオから高品質なキーフレームを抽出するためのユニークなパイプラインを提案する。
カスタムフィードの映像記録を用いて,キーフレームを抽出し,パイプラインの再同定性能を評価する。
その結果,提案手法では,k=ak=a再同定において高い精度で画像収集を行うことができた。
論文 参考訳(メタデータ) (2025-10-09T19:46:46Z) - A Bird Song Detector for improving bird identification through Deep Learning: a case study from Doñana [2.7924253850013416]
鳥類の種を識別する上で重要な課題は、多くの録音が対象の種を欠いているか、重複する発声を含んでいることである。
ドナ国立公園(西スペイン)における鳥声自動識別のための多段階パイプラインを開発した。
そこで,我々はまず,スペクトログラムによる画像処理を用いて鳥の発声を分離するために鳥の歌検出器を適用した。その後,局所的に訓練されたカスタムモデルを用いて種を分類した。
論文 参考訳(メタデータ) (2025-03-19T13:19:06Z) - NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0]
この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:55:45Z) - A noisy elephant in the room: Is your out-of-distribution detector robust to label noise? [49.88894124047644]
我々は、最先端のOOD検出方法20について詳しく検討する。
不正に分類されたIDサンプルとOODサンプルの分離が不十分であることを示す。
論文 参考訳(メタデータ) (2024-04-02T09:40:22Z) - AVTENet: A Human-Cognition-Inspired Audio-Visual Transformer-Based Ensemble Network for Video Deepfake Detection [49.81915942821647]
本研究では、ディープフェイクビデオを検出するために、オーディオ・ヴィジュアル・トランスフォーマー・ベースのアンサンブルネットワーク(AVTENet)を導入する。
評価には、最近リリースされたマルチモーダルオーディオビデオFakeAVCelebデータセットを使用する。
AVTENetとその変種およびいくつかの既存手法をFakeAVCelebデータセットの複数のテストセット上で評価する。
論文 参考訳(メタデータ) (2023-10-19T19:01:26Z) - Deep object detection for waterbird monitoring using aerial imagery [56.1262568293658]
本研究では,商用ドローンで収集した空中画像を用いて,水鳥の正確な検出,数え,監視に使用できる深層学習パイプラインを提案する。
畳み込み型ニューラルネットワークを用いた物体検出装置を用いて,テキサス沿岸の植民地性営巣島でよく見られる16種類の水鳥を検出できることを示す。
論文 参考訳(メタデータ) (2022-10-10T17:37:56Z) - Few-shot Long-Tailed Bird Audio Recognition [3.8073142980733]
本研究では,音環境記録を解析するための音響検出・分類パイプラインを提案する。
私たちのソリューションは、Kaggleで開催されたBirdCLEF 2022 Challengeで、807チームの18位を獲得しました。
論文 参考訳(メタデータ) (2022-06-22T04:14:25Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Modelling Animal Biodiversity Using Acoustic Monitoring and Deep
Learning [0.0]
本稿では,機械学習の最先端技術を用いて,時系列音声信号から特徴を自動的に抽出する手法について概説する。
得られた鳥の歌はメル周波数ケプストラム(MFC)を用いて処理され、後に多層パーセプトロン(MLP)を用いて分類される特徴を抽出する。
提案手法は感度0.74,特異度0.92,精度0.74で有望な結果を得た。
論文 参考訳(メタデータ) (2021-03-12T13:50:31Z) - Cross-Task Transfer for Geotagged Audiovisual Aerial Scene Recognition [61.54648991466747]
映像と音を入力として用いた視覚的空中シーン認識タスクについて検討する。
航空シーン認識のための音声情報を活用する利点を示す。
論文 参考訳(メタデータ) (2020-05-18T04:14:16Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。