論文の概要: First-of-its-kind AI model for bioacoustic detection using a lightweight associative memory Hopfield neural network
- arxiv url: http://arxiv.org/abs/2507.10642v1
- Date: Mon, 14 Jul 2025 16:37:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.808149
- Title: First-of-its-kind AI model for bioacoustic detection using a lightweight associative memory Hopfield neural network
- Title(参考訳): 軽量連想メモリホップフィールドニューラルネットワークを用いた生体音響検出のための第一種AIモデル
- Authors: Andrew Gascoyne, Wendy Lomas,
- Abstract要約: 生物音響学における課題は、受動的音響モニタリング装置から生成される膨大な量のデータを分析することである。
我々のモデル定式化は、生物音響解析に現在のAIモデルを使用する際に発生する重要な問題に対処する。
これは、透過的で説明可能なホップフィールドニューラルネットワークを介して連想メモリを使用して、信号を格納し、類似した信号を検知する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A growing issue within conservation bioacoustics is the task of analysing the vast amount of data generated from the use of passive acoustic monitoring devices. In this paper, we present an alternative AI model which has the potential to help alleviate this problem. Our model formulation addresses the key issues encountered when using current AI models for bioacoustic analysis, namely the: limited training data available; environmental impact, particularly in energy consumption and carbon footprint of training and implementing these models; and associated hardware requirements. The model developed in this work uses associative memory via a transparent, explainable Hopfield neural network to store signals and detect similar signals which can then be used to classify species. Training is rapid ($3$\,ms), as only one representative signal is required for each target sound within a dataset. The model is fast, taking only $5.4$\,s to pre-process and classify all $10384$ publicly available bat recordings, on a standard Apple MacBook Air. The model is also lightweight with a small memory footprint of $144.09$\,MB of RAM usage. Hence, the low computational demands make the model ideal for use on a variety of standard personal devices with potential for deployment in the field via edge-processing devices. It is also competitively accurate, with up to $86\%$ precision on the dataset used to evaluate the model. In fact, we could not find a single case of disagreement between model and manual identification via expert field guides. Although a dataset of bat echolocation calls was chosen to demo this first-of-its-kind AI model, trained on only two representative calls, the model is not species specific. In conclusion, we propose an equitable AI model that has the potential to be a game changer for fast, lightweight, sustainable, transparent, explainable and accurate bioacoustic analysis.
- Abstract(参考訳): 生物音響学における課題は、受動的音響モニタリング装置を用いて生成される膨大な量のデータを分析することである。
本稿では,この問題を緩和する可能性を持つ代替AIモデルを提案する。
我々のモデル定式化は、生物音響分析に現在のAIモデルを使用する際に発生する重要な問題、すなわち、限られたトレーニングデータ、特にエネルギー消費における環境影響、これらのモデルのトレーニングと実装における炭素フットプリント、および関連するハードウェア要件に対処する。
この研究で開発されたモデルは、透明で説明可能なホップフィールドニューラルネットワークを介して連想記憶を使用して、信号を保存し、類似した信号を検知し、種を分類することができる。
トレーニングは高速(3$\,ms)で、データセット内の各ターゲット音に対して1つの代表信号のみを必要とする。
このモデルは高速で、標準のApple MacBook Airで10384ドル(約1万2000円)のバット録音を前処理し、分類するのにわずか5.4ドル(約5万5000円)しかかからない。
モデルは軽量で、メモリフットプリントは144.09$\,MBである。
したがって、計算能力の低い要求は、エッジ処理デバイスを介してフィールドに展開する可能性がある様々な標準のパーソナルデバイスでの使用に理想的である。
また、モデルを評価するために使用されるデータセットに対して最大8,6\%の精度で競合的に正確である。
実際、モデルと手動の識別に専門家のフィールドガイドで不一致の事例は1つも見つからなかった。
コウモリのエコーロケーションコールのデータセットは、2つの代表的呼び出しだけで訓練されたこの第一種AIモデルをデモするために選ばれたが、モデルは種固有のものではない。
結論として、高速で軽量で、持続可能で、透明で、説明可能な、正確なバイオ音響分析のためのゲームチェンジャーになる可能性を持つ、公平なAIモデルを提案する。
関連論文リスト
- TinyChirp: Bird Song Recognition Using TinyML Models on Low-power Wireless Acoustic Sensors [1.0790796076947324]
大規模な生物多様性のモニタリングは難しい。
微細な粒度の種の検出と識別には、高度に正確な機械学習(ML)手法が必要である。
これらのモデルを低消費電力デバイスにデプロイするには、新しい圧縮技術とモデルアーキテクチャが必要である。
論文 参考訳(メタデータ) (2024-07-31T08:57:42Z) - Explainable AI for Comparative Analysis of Intrusion Detection Models [20.683181384051395]
本研究は,ネットワークトラフィックから侵入検出を行うために,各種機械学習モデルを二分分類および多クラス分類のタスクに解析する。
すべてのモデルをUNSW-NB15データセットで90%の精度でトレーニングしました。
また、Random Forestは正確さ、時間効率、堅牢性という点で最高のパフォーマンスを提供します。
論文 参考訳(メタデータ) (2024-06-14T03:11:01Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - Guaranteed Conformance of Neurosymbolic Models to Natural Constraints [4.598757178874836]
安全クリティカルな応用においては、データ駆動モデルは自然科学の確立した知識に適合することが重要である。
我々はこの適合性を保証する方法を提案する。
拘束されたニューロシンボリックモデルが特定のモデルに適合していることを実験的に示す。
論文 参考訳(メタデータ) (2022-12-02T18:03:37Z) - Knowledge Transfer For On-Device Speech Emotion Recognition with Neural
Structured Learning [19.220263739291685]
音声感情認識(SER)は、ヒューマン・コンピュータ・インタラクション(HCI)において人気のある研究トピックである。
合成グラフ構築によるニューラル構造化学習(NSL)フレームワークを提案する。
実験の結果,音声サンプルとグラフを用いた軽量SERモデルの訓練は,小さなSERモデルを生成するだけでなく,モデル性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-10-26T18:38:42Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Probing Model Signal-Awareness via Prediction-Preserving Input
Minimization [67.62847721118142]
モデルが正しい脆弱性信号を捕捉して予測する能力を評価する。
SAR(Signal-Aware Recall)と呼ばれる新しい指標を用いて,モデルの信号認識を計測する。
その結果,90年代以降のリコールから60年代以降のリコールは,新たな指標で大幅に減少した。
論文 参考訳(メタデータ) (2020-11-25T20:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。