論文の概要: ECOSoundSet: a finely annotated dataset for the automated acoustic identification of Orthoptera and Cicadidae in North, Central and temperate Western Europe
- arxiv url: http://arxiv.org/abs/2504.20776v1
- Date: Tue, 29 Apr 2025 13:53:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.916227
- Title: ECOSoundSet: a finely annotated dataset for the automated acoustic identification of Orthoptera and Cicadidae in North, Central and temperate Western Europe
- Title(参考訳): ECOSoundSet:北・中部・温帯西ヨーロッパにおけるオルトプテリウム科とシカデ科の音響的自動識別のための微妙な注釈付きデータセット
- Authors: David Funosas, Elodie Massol, Yves Bas, Svenja Schmidt, Dominik Arend, Alexander Gebhard, Luc Barbaro, Sebastian König, Rafael Carbonell Font, David Sannier, Fernand Deroussen, Jérôme Sueur, Christian Roesti, Tomi Trilar, Wolfgang Forstmeier, Lucas Roger, Eloïsa Matheu, Piotr Guzik, Julien Barataud, Laurent Pelozuelo, Stéphane Puissant, Sandra Mueller, Björn Schuller, Jose M. Montoya, Andreas Triantafyllopoulos, Maxime Cauchoix,
- Abstract要約: ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet) は,北欧,中央ヨーロッパ,温帯西ヨーロッパに分布する200種,24種(亜種を含む場合,それぞれ217種,26種)から10,653種を収録したデータセットである。
このデータセットは、北ヨーロッパ、中央ヨーロッパ、温帯ヨーロッパにおけるオルソプターとシカダの音響分類のための深層学習アルゴリズムの訓練のために、既にオンラインで入手可能な記録に意味のある補完となる可能性がある。
- 参考スコア(独自算出の注目度): 51.82780272068934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Currently available tools for the automated acoustic recognition of European insects in natural soundscapes are limited in scope. Large and ecologically heterogeneous acoustic datasets are currently needed for these algorithms to cross-contextually recognize the subtle and complex acoustic signatures produced by each species, thus making the availability of such datasets a key requisite for their development. Here we present ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet), a dataset containing 10,653 recordings of 200 orthopteran and 24 cicada species (217 and 26 respective taxa when including subspecies) present in North, Central, and temperate Western Europe (Andorra, Belgium, Denmark, mainland France and Corsica, Germany, Ireland, Luxembourg, Monaco, Netherlands, United Kingdom, Switzerland), collected partly through targeted fieldwork in South France and Catalonia and partly through contributions from various European entomologists. The dataset is composed of a combination of coarsely labeled recordings, for which we can only infer the presence, at some point, of their target species (weak labeling), and finely annotated recordings, for which we know the specific time and frequency range of each insect sound present in the recording (strong labeling). We also provide a train/validation/test split of the strongly labeled recordings, with respective approximate proportions of 0.8, 0.1 and 0.1, in order to facilitate their incorporation in the training and evaluation of deep learning algorithms. This dataset could serve as a meaningful complement to recordings already available online for the training of deep learning algorithms for the acoustic classification of orthopterans and cicadas in North, Central, and temperate Western Europe.
- Abstract(参考訳): 現在、自然の音環境におけるヨーロッパの昆虫の自動音響認識のためのツールは、範囲が限られている。
大規模で生態学的に異質な音響データセットは、現在これらのアルゴリズムが各種が生み出す微妙で複雑な音響シグネチャを相互に認識するために必要である。
ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet) は,北・中央・温帯西ヨーロッパ(アンドラ,ベルギー,デンマーク,フランス・コルシカ,ドイツ,アイルランド,ルクセンブルク,モナコ,オランダ,イギリス,スイス)に分布する200種のオルソプテランと24種のシカダ (217および26の亜種を含む) の10,653種の記録を含むデータセットである。
このデータセットは粗いラベル付き記録と、ターゲット種の存在(弱ラベル付け)を推測できる部分と、記録に含まれる各昆虫音の特定の時間と周波数範囲(強ラベル付け)が組み合わさって構成されている。
また, 深層学習アルゴリズムの学習と評価を容易にするために, 0.8, 0.1, 0.1の近似比を持つ強ラベル記録の列車/検証/試験分割も提供する。
このデータセットは、北ヨーロッパ、中央ヨーロッパ、温帯ヨーロッパにおけるオルソプターとシカダの音響分類のための深層学習アルゴリズムの訓練のために、既にオンラインで入手可能な記録を補完する役割を果たしている。
関連論文リスト
- Semi-supervised classification of bird vocalizations [0.0]
鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。
時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。
平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文 参考訳(メタデータ) (2025-02-19T05:31:13Z) - NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0]
この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:55:45Z) - Automated Bioacoustic Monitoring for South African Bird Species on Unlabeled Data [1.3506669466260703]
このフレームワークは、選択された鳥類種の利用可能なプラットフォームからラベル付きデータを自動抽出する。
ラベル付きデータは、環境音やノイズを含む録音に埋め込まれ、畳み込みリカレントニューラルネットワーク(CRNN)モデルのトレーニングに使用された。
適応SED-CRNNモデルはF1スコア0.73に達し、ノイズの多い実世界の条件下で効率を実証した。
論文 参考訳(メタデータ) (2024-06-19T14:14:24Z) - BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics [2.2399415927517414]
textttBirdSetは、鳥のバイオ音響に焦点を当てたオーディオ分類のための大規模なベンチマークデータセットである。
textttBirdSetは、トレーニング用に1万近いクラス($uparrow!18times$)から6800以上の録音時間($uparrow!17%$)、強くラベル付けされた8つの評価データセットで400時間以上($uparrow!7times$)でAudioSetを上回っている。
論文 参考訳(メタデータ) (2024-03-15T15:10:40Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - Learning with Noisy Labels Revisited: A Study Using Real-World Human
Annotations [54.400167806154535]
ノイズラベルを用いた学習に関する既存の研究は、主に合成ラベルノイズに焦点を当てている。
本研究は2つの新しいベンチマークデータセット(CIFAR-10N, CIFAR-100N)を示す。
実世界のノイズラベルは古典的に採用されたクラス依存のラベルではなく、インスタンス依存のパターンに従うことを示す。
論文 参考訳(メタデータ) (2021-10-22T22:42:11Z) - HumBugDB: A Large-scale Acoustic Mosquito Dataset [15.108701811353097]
本稿では,蚊の飛行中を連続的に追跡した音響記録の大規模多種多様なデータセットについて述べる。
専門的にラベル付けされ、タグ付けされた20時間の音声記録を、正確に時間内に提示する。
18時間の録音には36種のアノテーションが含まれている。
論文 参考訳(メタデータ) (2021-10-14T14:18:17Z) - Training Classifiers that are Universally Robust to All Label Noise
Levels [91.13870793906968]
ディープニューラルネットワークは、ラベルノイズの存在下で過度に適合する傾向がある。
ポジティヴ・アンラベルラーニングの新たなサブカテゴリを取り入れた蒸留ベースのフレームワークを提案する。
我々の枠組みは概して中~高騒音レベルにおいて優れています。
論文 参考訳(メタデータ) (2021-05-27T13:49:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。