論文の概要: pycnet-audio: A Python package to support bioacoustics data processing
- arxiv url: http://arxiv.org/abs/2506.14864v1
- Date: Tue, 17 Jun 2025 17:40:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.440717
- Title: pycnet-audio: A Python package to support bioacoustics data processing
- Title(参考訳): pycnet-audio: バイオ音響データ処理をサポートするPythonパッケージ
- Authors: Zachary J. Ruff, Damon B. Lesmeister,
- Abstract要約: pycnet-audioは、音響データのための実用的な処理ワークフローを提供することを目的としている。
pycnet-audioはもともとアメリカ合衆国森林局が北の斑点のあるフクロウの個体群モニタリングを支援するために開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Passive acoustic monitoring is an emerging approach in wildlife research that leverages recent improvements in purpose-made automated recording units (ARUs). The general approach is to deploy ARUs in the field to record on a programmed schedule for extended periods (weeks or months), after which the audio data are retrieved. These data must then be processed, typically either by measuring or analyzing characteristics of the audio itself (e.g. calculating acoustic indices), or by searching for some signal of interest within the recordings, e.g. vocalizations or other sounds produced by some target species, anthropogenic or environmental noise, etc. In the latter case, some method is required to locate the signal(s) of interest within the audio. While very small datasets can simply be searched manually, even modest projects can produce audio datasets on the order of 105 hours of recordings, making manual review impractical and necessitating some form of automated detection. pycnet-audio (Ruff 2024) is intended to provide a practical processing workflow for acoustic data, built around the PNW-Cnet model, which was initially developed by the U.S. Forest Service to support population monitoring of northern spotted owls (Strix occidentalis caurina) and other forest owls (Lesmeister and Jenkins 2022; Ruff et al. 2020). PNW-Cnet has been expanded to detect vocalizations of ca. 80 forest wildlife species and numerous forms of anthropogenic and environmental noise (Ruff et al. 2021, 2023).
- Abstract(参考訳): パッシブ・アコースティック・モニタリングは、最近のARUの改良を利用した野生生物研究の新たなアプローチである。
一般的なアプローチは、ARUをフィールドに配置して、プログラムされたスケジュール(数週間または数ヶ月)に記録し、その後にオーディオデータを取得することである。
これらのデータは、典型的には、音声自体の特性(例えば、音響指標の計算)を計測または分析することによって処理されるか、録音中の興味のある信号を探すか、目的の種、人為的または環境的な騒音によって生成される他の音を探索することによって処理されなければならない。
後者の場合、オーディオ内の興味ある信号を見つけるためにいくつかの方法が必要である。
非常に小さなデータセットは手動で検索できるが、控えめなプロジェクトでさえ、105時間の録音の順序でオーディオデータセットを生成することができ、手動によるレビューを非現実的にし、何らかの自動検出を必要とする。
pycnet-audio (Ruff 2024) はPNW-Cnetモデルを中心に開発された音響データのための実用的な処理ワークフローを提供することを目的としており、当初はアメリカ合衆国森林局が北の斑点のあるフクロウ(Strix occidentalis caurina)および他の森林フクロウ(Lesmeister and Jenkins 2022; Ruff et al 2020)の個体数モニタリングを支援するために開発した。
PNW-Cnetは、caの発声を検出するために拡張されている。
80種の森林野生生物と様々な形態の人為的・環境的騒音(Ruff et al 2021, 2023)。
関連論文リスト
- The iNaturalist Sounds Dataset [60.157076990024606]
iNatSoundsは、5500種以上の音をキャプチャする23万のオーディオファイルのコレクションで、世界中で27,000人以上のレコーダーが貢献している。
このデータセットは、鳥類、哺乳類、昆虫、虫類、両生類からの音を包含し、iNaturalistに提出された観察から得られたオーディオおよび種名を含む。
我々は、次世代の公的なエンゲージメントアプリケーションを支えるこのデータに基づいて訓練されたモデルを構想し、大規模なオーディオコレクションの処理において生物学者、生態学者、土地利用管理者を支援する。
論文 参考訳(メタデータ) (2025-05-31T02:07:37Z) - ECOSoundSet: a finely annotated dataset for the automated acoustic identification of Orthoptera and Cicadidae in North, Central and temperate Western Europe [51.82780272068934]
ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet) は,北欧,中央ヨーロッパ,温帯西ヨーロッパに分布する200種,24種(亜種を含む場合,それぞれ217種,26種)から10,653種を収録したデータセットである。
このデータセットは、北ヨーロッパ、中央ヨーロッパ、温帯ヨーロッパにおけるオルソプターとシカダの音響分類のための深層学習アルゴリズムの訓練のために、既にオンラインで入手可能な記録に意味のある補完となる可能性がある。
論文 参考訳(メタデータ) (2025-04-29T13:53:33Z) - Transferable Models for Bioacoustics with Human Language Supervision [0.0]
BioLingualは、対照的な言語-オーディオ事前学習に基づくバイオ音響学の新しいモデルである。
分類群にまたがる1000種以上の呼び出しを識別し、完全なバイオ音響タスクをゼロショットで実行し、自然のテキストクエリから動物の発声記録を検索する。
論文 参考訳(メタデータ) (2023-08-09T14:22:18Z) - Self-Supervised Visual Acoustic Matching [63.492168778869726]
音響マッチングは、ターゲットの音響環境に録音されたかのように、音声クリップを再合成することを目的としている。
そこで本研究では,対象のシーン画像と音声のみを含む,視覚的音響マッチングのための自己教師型アプローチを提案する。
提案手法は,条件付きGANフレームワークと新しいメトリクスを用いて,室内音響をアンタングル化し,音をターゲット環境に再合成する方法を共同で学習する。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - Detection and classification of vocal productions in large scale audio
recordings [0.12930503923129208]
大規模自然音声録音から発声音声を抽出する自動データ処理パイプラインを提案する。
パイプラインはディープニューラルネットワークに基づいており、両方の問題に同時に対処する。
1つは霊長類研究センターで記録されたギニアバブーンのグループで、もう1つは自宅で記録されたヒトの赤ちゃんです。
論文 参考訳(メタデータ) (2023-02-14T14:07:09Z) - ASiT: Local-Global Audio Spectrogram vIsion Transformer for Event
Classification [42.95038619688867]
ASiTは、グループマスク付きモデル学習と自己蒸留を用いて、局所的およびグローバルな文脈情報をキャプチャする、新しい自己教師型学習フレームワークである。
我々は、音声イベント分類、キーワードスポッティング、話者識別を含む音声および音声の分類タスクにおいて、事前訓練されたモデルを評価する。
論文 参考訳(メタデータ) (2022-11-23T18:21:09Z) - HEAR 2021: Holistic Evaluation of Audio Representations [55.324557862041985]
HEAR 2021 NeurIPSの課題は、学習の強力な基盤を提供する汎用オーディオ表現を開発することである。
HEAR 2021は、音声、環境音、音楽を含む様々な領域にわたるベンチマークスイートを用いて、音声表現を評価する。
16個のデータセットから抽出した19種類の下流タスクに対して,13の外部チームによる2つのモデルを評価した。
論文 参考訳(メタデータ) (2022-03-06T18:13:09Z) - Modelling Animal Biodiversity Using Acoustic Monitoring and Deep
Learning [0.0]
本稿では,機械学習の最先端技術を用いて,時系列音声信号から特徴を自動的に抽出する手法について概説する。
得られた鳥の歌はメル周波数ケプストラム(MFC)を用いて処理され、後に多層パーセプトロン(MLP)を用いて分類される特徴を抽出する。
提案手法は感度0.74,特異度0.92,精度0.74で有望な結果を得た。
論文 参考訳(メタデータ) (2021-03-12T13:50:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。