論文の概要: BeeVe: Unsupervised Acoustic State Discovery in Honey Bee Buzzing
- arxiv url: http://arxiv.org/abs/2605.07903v1
- Date: Fri, 08 May 2026 15:42:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.171407
- Title: BeeVe: Unsupervised Acoustic State Discovery in Honey Bee Buzzing
- Title(参考訳): BeeVe:ハニービーバズリングにおける教師なしアコースティックステートディスカバリ
- Authors: Hamze Hammami, Nidhal Abdulaziz,
- Abstract要約: この研究は、集合種における音響状態発見のための教師なしのセマンティックフレームワークであるBeeVeを紹介した。
BeeVeはPatchout Spectrogram Transformer (PaSST) を凍結した特徴抽出器として使用し、その埋め込みにラベルを付けずにVector-Quantized Variational Autoencoder (VQ-VAE) を訓練する。
既知のクイーン状態に対するポストホック評価では、学習されたトークンは、ジェンセン=シャノンの分岐値0.609から0.688でクイーンライトとクイーンレスの状態を分離し、クィーンレス状態はさらに3つの内部コヒーレントなサブ状態に分解されると仮定している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discovering structure in biological signals without supervision is a fundamental problem in computational intelligence, yet existing bioacoustic methods assume vocal production models or predefined semantic units, leaving non-vocal species poorly served. This work introduces BeeVe, an unsupervised framework for acoustic state discovery in collective honey bee buzzing. BeeVe uses the self-supervised Patchout Spectrogram Transformer (PaSST) as a frozen feature extractor, then trains a Vector-Quantized Variational Autoencoder (VQ-VAE) without labels on those embeddings, learning a finite discrete codebook of acoustic tokens directly from unlabelled hive audio. No labels, pretext tasks, or contrastive objectives are used at any stage. Post-hoc evaluation against known queen status reveals that the learned tokens separate queenright and queenless conditions with Jensen-Shannon Divergence values between 0.609 and 0.688, and that the queenless condition further decomposes into three internally coherent sub-states stable across experiments with different codebook sizes and random seeds. Token transition analysis confirms non-random sequential structure (p << 0.001) across all experiments. Generalisation to unseen recordings preserves both token overlap (Jaccard = 0.947) and global manifold topology. These results demonstrate that unsupervised discrete codebook learning can recover repeatable acoustic structure from a non-vocal biological signal without annotation, opening a path toward non-invasive acoustic hive health monitoring.
- Abstract(参考訳): 生物学的信号の構造を監督せずに発見することは、計算知能の基本的な問題であるが、既存のバイオ音響手法では、声質生産モデルや事前に定義された意味単位を仮定し、非声質種は役に立たないままである。
この研究は、ハチミツバチの群集の音響状態発見のための教師なしのフレームワークであるBeeVeを紹介した。
BeeVeは自己監督型Patchout Spectrogram Transformer (PaSST) をフリーズした特徴抽出器として使用し、次にVector-Quantized Variational Autoencoder (VQ-VAE) をそれらの埋め込みにラベルを付けずに訓練し、未ラベルのハイブオーディオから直接音響トークンの有限個の離散コードブックを学習する。
ラベル、プレテキストタスク、コントラストの目的は、どの段階でも使用されない。
既知のクイーン状態に対するポストホック評価では、学習されたトークンは、Jensen-Shannon Divergence値0.609から0.688でクイーンライトとクイーンレスの状態を分離し、クィーンレス状態はさらに、異なるコードブックサイズとランダムシードを持つ実験で安定な3つの内部コヒーレントなサブステートに分解される。
トークン遷移解析は、すべての実験において非ランダムシーケンシャル構造(p<< 0.001)を確認する。
見えない記録への一般化は、トークン重複(ジャカード=0.947)と大域多様体位相の両方を保存する。
これらの結果から, 教師なし離散コードブック学習は, 非侵襲的音響ハイブヘルスモニタリングへの道を開くことなく, 非声道生物学的信号から再現可能な音響構造を復元できることが示唆された。
関連論文リスト
- AGRI-Fidelity: Evaluating the Reliability of Listenable Explanations for Poultry Disease Detection [4.2983704620741685]
AGRI-Fidelityは,空間的根拠のない養鶏病検出における聴取可能な説明のための信頼性指向評価フレームワークである。
実データと制御されたデータセット全体で、AGRI-Fidelityは、マスキングベースのメトリクスに対して、すべてのデータポイントに対して信頼性に配慮した識別を効果的に提供する。
論文 参考訳(メタデータ) (2026-03-18T20:12:02Z) - Zero-Shot Detection of Elastic Transient Morphology Across Physical Systems [0.0]
干渉ひずみの過渡度から学習した表現は、未知のセンサのモルフォロジーに敏感な演算子として機能することを示す。
非ガウス楽器のグリッチを専門に訓練したニューラルエンコーダを用いて、圧延要素の軸受に対して厳密なゼロショット異常解析を行う。
論文 参考訳(メタデータ) (2026-01-16T16:35:07Z) - VocSim: A Training-free Benchmark for Zero-shot Content Identity in Single-source Audio [1.0791267046450075]
VocSimは、凍結埋め込みの固有の幾何学的アライメントを探索するトレーニング不要のベンチマークである。
VocSimは、人間のスピーチ、動物の発声、環境音にまたがる19のコーパスから125万のソースクリップを集約する。
論文 参考訳(メタデータ) (2025-12-10T22:13:12Z) - All Thresholds Barred: Direct Estimation of Call Density in Bioacoustic
Data [1.7916003204531015]
本研究では,データ単位の呼び出し密度を推定するための検証手法を提案する。
我々はこれらの分布を用いて、分布シフトの対象となるサイトレベルの密度を予測する。
論文 参考訳(メタデータ) (2024-02-23T14:52:44Z) - Confident Sinkhorn Allocation for Pseudo-Labeling [40.883130133661304]
半教師付き学習は、ラベル付きデータへの機械学習の依存を減らす重要なツールである。
本稿では,疑似ラベル作成における不確実性の役割を理論的に研究し,CSA(Confident Sinkhorn Allocation)を提案する。
CSAは、信頼度の高いサンプルのみへの最適な輸送を通して、最高の擬似ラベル割り当てを特定する。
論文 参考訳(メタデータ) (2022-06-13T02:16:26Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Vector-Quantized Timbre Representation [53.828476137089325]
本稿では, スペクトル特性の近似分解を生成的特徴の集合で学習することにより, 個々の音色をより柔軟に合成することを目的とする。
音量分布の量子化表現を学習するために、大音量から切り離された離散潜在空間を持つオートエンコーダを導入する。
オーケストラ楽器と歌唱音声間の音声の翻訳結果と、ボーカルの模倣音から楽器への変換結果について詳述する。
論文 参考訳(メタデータ) (2020-07-13T12:35:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。