論文の概要: LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification
- arxiv url: http://arxiv.org/abs/2603.02245v1
- Date: Tue, 24 Feb 2026 23:44:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.454022
- Title: LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification
- Title(参考訳): 乳幼児の乳房横断分類のためのLMUに基づく逐次学習と後アンサンブル融合
- Authors: Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard,
- Abstract要約: マルチブランチCNNエンコーダにおいて, MFCC, STFT, ピッチ特徴を融合する小型音響フレームワークを提案する。
LSTMと比較すると、LMUバックボーンは、非常に少ないリカレントパラメータで安定したシーケンスモデリングを提供し、効率的なデプロイメントをサポートする。
- 参考スコア(独自算出の注目度): 0.4666493857924357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decoding infant cry causes remains challenging for healthcare monitoring due to short nonstationary signals, limited annotations, and strong domain shifts across infants and datasets. We propose a compact acoustic framework that fuses MFCC, STFT, and pitch features within a multi-branch CNN encoder and models temporal dynamics using an enhanced Legendre Memory Unit (LMU). Compared to LSTMs, the LMU backbone provides stable sequence modeling with substantially fewer recurrent parameters, supporting efficient deployment. To improve cross-dataset generalization, we introduce calibrated posterior ensemble fusion with entropy-gated weighting to preserve domain-specific expertise while mitigating dataset bias. Experiments on Baby2020 and Baby Crying demonstrate improved macro-F1 under cross-domain evaluation, along with leakageaware splits and real-time feasibility for on-device monitoring.
- Abstract(参考訳): 乳幼児の泣く原因の解読は、短い非定常的な信号、限られたアノテーション、幼児とデータセット間の強いドメインシフトによって、医療監視にとって依然として困難である。
本稿では,マルチブランチCNNエンコーダ内のMFCC,STFT,ピッチ特徴を融合したコンパクトな音響フレームワークを提案し,拡張レジェンダメモリユニット(LMU)を用いて時間ダイナミクスをモデル化する。
LSTMと比較すると、LMUバックボーンは、非常に少ないリカレントパラメータで安定したシーケンスモデリングを提供し、効率的なデプロイメントをサポートする。
データセット間の一般化を改善するため,データセットバイアスを緩和しながらドメイン固有の専門知識を維持するために,エントロピーゲート重み付けによるキャリブレーション後部アンサンブル融合を導入する。
Baby2020とBaby Cryingの実験では、クロスドメイン評価によるマクロF1の改善と、リークアウェアの分割とオンデバイス監視のリアルタイム実現性が実証された。
関連論文リスト
- MEMTS: Internalizing Domain Knowledge via Parameterized Memory for Retrieval-Free Domain Adaptation of Time Series Foundation Models [51.506429027626005]
Memory for Time Series (MEMTS) は、時系列予測における検索不要領域適応のための軽量かつプラグアンドプレイ方式である。
MEMTSの鍵となるコンポーネントは知識永続化モジュール(KPM)であり、ドメイン固有の時間力学を内部化する。
このパラダイムシフトにより、MEMTSは定数時間推論とニアゼロレイテンシによる正確なドメイン適応を実現することができる。
論文 参考訳(メタデータ) (2026-02-14T14:00:06Z) - Contextual and Seasonal LSTMs for Time Series Anomaly Detection [49.50689313712684]
CS-LSTM (Contextual and Seasonal LSTMs) という新しい予測型フレームワークを提案する。
CS-LSTMはノイズ分解戦略に基づいて構築され、コンテキスト依存と季節パターンを併用する。
彼らは一貫して最先端の手法を上回り、堅牢な時系列異常検出における有効性と実用的価値を強調した。
論文 参考訳(メタデータ) (2026-02-10T11:46:15Z) - MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction [7.015114232190396]
レーダエコーシークエンスからの正確な高分解能降水は、災害軽減と経済計画に不可欠である。
鍵となる課題は、複雑なマルチスケール進化のモデル化、変位に起因するフレーム間特徴の不整合、長距離コンテキストの効率的なキャプチャである。
本稿では,MFRF-Net(Multiscale Feature Communication Rectified Flow Network)を提案する。
論文 参考訳(メタデータ) (2026-01-07T06:24:26Z) - UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting [90.47915032778366]
マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
コアには統一的で並列な融合モジュールがあり、単一のクロスアテンション機構がタイムスタンプからの構造化情報とテキストからのセマンティックコンテキストを統合する。
8つの領域にわたる実世界のベンチマークデータセットの実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-12-08T05:36:14Z) - Parallel Delayed Memory Units for Enhanced Temporal Modeling in Biomedical and Bioacoustic Signal Analysis [17.73662095849247]
Parallel Delayed Memory Unit (PDMU) は、短期的クレジット割り当てのための遅延ゲート状態空間モジュールである。
PDMUは、ゲート遅延ライン機構を介して、短期的な時間的状態相互作用とメモリ効率を高める。
PDMUは並列トレーニングとシーケンシャル推論をサポートしており、既存の線形RNNフレームワークに簡単に統合できる。
論文 参考訳(メタデータ) (2025-12-01T12:46:56Z) - Morphing Through Time: Diffusion-Based Bridging of Temporal Gaps for Robust Alignment in Change Detection [51.56484100374058]
既存の変更検出ネットワークを変更することなく空間的・時間的ロバスト性を改善するモジュールパイプラインを導入する。
拡散モジュールは、大きな外観ギャップをブリッジする中間変形フレームを合成し、RoMaは段階的に対応を推定できる。
LEVIR-CD、WHU-CD、DSIFN-CDの実験は、登録精度と下流変化検出の両方において一貫した利得を示した。
論文 参考訳(メタデータ) (2025-11-11T08:40:28Z) - FaRMamba: Frequency-based learning and Reconstruction aided Mamba for Medical Segmentation [3.5790602918760586]
Vision Mambaは、グローバルな依存関係を効率的にモデル化するために、一次元の因果状態空間の再現を用いる。
パッチトークン化と1Dシリアライゼーションは、局所的なピクセル隣接性を阻害し、ローパスフィルタリング効果を課す。
2つの相補的なモジュールを通してLHICDと2D-SSDを明示的に扱う新しい拡張であるFaRMambaを提案する。
論文 参考訳(メタデータ) (2025-07-26T20:41:53Z) - Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。