論文の概要: State Space Models for Bioacoustics: A comparative Evaluation with Transformers
- arxiv url: http://arxiv.org/abs/2512.03563v1
- Date: Wed, 03 Dec 2025 08:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:55.200783
- Title: State Space Models for Bioacoustics: A comparative Evaluation with Transformers
- Title(参考訳): バイオアコースティックスのための状態空間モデル:トランスフォーマーとの比較評価
- Authors: Chengyu Tang, Sanjeev Baskiyar,
- Abstract要約: まず,マンバをベースとした音声大言語モデル(LLM)を,自己教師付き学習を用いて大規模コーパスで事前学習する。
我々はBEANSベンチマークでBioMambaを微調整し評価した。
その結果,BioMamba は AVES と同等の性能を示し,消費電力は VRAM よりも著しく少ないことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we evaluate the efficacy of the Mamba model in the field of bioacoustics. We first pretrain a Mamba-based audio large language model (LLM) on a large corpus of audio data using self-supervised learning. We fine-tune and evaluate BioMamba on the BEANS benchmark, a collection of diverse bioacoustic tasks including classification and detection, and compare its performance and efficiency with multiple baseline models, including AVES, a state-of-the-art Transformer-based model. The results show that BioMamba achieves comparable performance with AVES while consumption significantly less VRAM, demonstrating its potential in this domain.
- Abstract(参考訳): 本研究では,生体音響学分野におけるマンバモデルの有効性を評価する。
まず,マンバをベースとした音声大言語モデル(LLM)を,自己教師付き学習を用いて大規模コーパスで事前学習する。
我々はBEANSベンチマークでBioMambaを微調整し評価し、分類と検出を含む多様なバイオ音響タスクのコレクションを作成し、その性能と効率を、最先端のTransformerベースのモデルであるAVESを含む複数のベースラインモデルと比較した。
その結果,BioMamba は AVES と同等の性能を示したが,VRAM の消費は著しく減少し,この領域での可能性を示した。
関連論文リスト
- Crossing the Species Divide: Transfer Learning from Speech to Animal Sounds [24.203596224724848]
自己教師型音声モデルは,音声処理において顕著な性能を示したが,その非音声データに対する効果は未検討のままである。
我々は,HuBERT,WavLM,XEUSなどのモデルが,分類群全体にわたって動物の音の豊かな潜伏表現を生成可能であることを示す。
その結果, 微調整された生体音響事前学習モデルと競合し, ノイズローバスト事前学習装置の影響を示す。
論文 参考訳(メタデータ) (2025-09-04T12:39:05Z) - Foundation Models for Bioacoustics -- a Comparative Review [0.9109149174920012]
本稿では, 生体音響基礎モデルについて, モデルアーキテクチャ, 事前学習計画, 訓練パラダイムなどの設計決定を徹底的に分析して検討する。
BEANSおよびBirdSetベンチマークから,分類タスクの選択基盤モデルを評価する。
総合的な実験分析の結果,BirdSetベンチマークでは,大規模鳥の鳴き声データに基づく自己指導による学習が最高の成績を収めていることが明らかとなった。
論文 参考訳(メタデータ) (2025-08-02T09:15:16Z) - An Exploration of Mamba for Speech Self-Supervised Models [48.01992287080999]
我々はTransformerベースのSSLアーキテクチャに代わるものとして,MambaベースのHuBERTモデルを探求する。
HuBERTモデルは、計算量を大幅に削減した長文ASRの微調整を可能にする。
これらの結果から,マンバをベースとしたSSLは,時系列モデリング,リアルタイム音声モデリング,音声単位抽出において,有望かつ補完的な方向であることがわかった。
論文 参考訳(メタデータ) (2025-06-14T19:00:44Z) - MambaMoE: Mixture-of-Spectral-Spatial-Experts State Space Model for Hyperspectral Image Classification [46.67137351665963]
マンバをベースとしたモデルは、最近ハイパースペクトル画像(HSI)分類において有意な可能性を証明している。
我々は,HSI分類領域における最初のMoEに基づくアプローチである,スペクトル空間混合(MoE)フレームワークであるMambaMoEを提案する。
MambaMoEは、既存の高度な手法と比較して、分類精度と計算効率の両面で最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-04-29T07:50:36Z) - BioMamba: Leveraging Spectro-Temporal Embedding in Bidirectional Mamba for Enhanced Biosignal Classification [1.9414307529560617]
既存のバイオシグナル分類手法は、フィードフォワード層が密集した注意に基づくフレームワークに依存している。
これら3つの重要なコンポーネントを統合することで、BioMambaは既存のメソッドの制限を効果的に解決する。
大規模な実験により、BioMambaは最先端の手法を著しく上回り、分類性能が著しく向上していることが示された。
論文 参考訳(メタデータ) (2025-03-14T16:42:58Z) - ReMamba: Equip Mamba with Effective Long-Sequence Modeling [50.530839868893786]
本研究では,長い文脈の理解能力を高めるReMambaを提案する。
ReMambaは2段階のプロセスで選択的圧縮と適応のテクニックを取り入れている。
論文 参考訳(メタデータ) (2024-08-28T02:47:27Z) - MambaVision: A Hybrid Mamba-Transformer Vision Backbone [54.965143338206644]
視覚応用に適した新しいハイブリッド型Mamba-TransformerバックボーンMambaVisionを提案する。
最終層に自己アテンションブロックを付加したMambaアーキテクチャは,長距離空間依存性を捕捉する能力を大幅に向上することを示す。
ImageNet-1Kデータセットの分類において、MambaVisionの変種は、Top-1の精度とスループットの両方の観点から、最先端(SOTA)のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-10T23:02:45Z) - Vision Mamba for Classification of Breast Ultrasound Images [9.90112908284836]
MambaベースのモデルであるVMambaとVimは、最近のビジョンエンコーダのファミリーであり、多くのコンピュータビジョンタスクで有望なパフォーマンス改善を提供する。
本稿では,乳房超音波BUSIデータセットと乳房超音波Bデータセットを用いて,マンバモデルと従来の畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)を比較した。
論文 参考訳(メタデータ) (2024-07-04T00:21:47Z) - Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。
Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-05T18:58:11Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。