論文の概要: PanLUNA: An Efficient and Robust Query-Unified Multimodal Model for Edge Biosignal Intelligence
- arxiv url: http://arxiv.org/abs/2604.04297v1
- Date: Sun, 05 Apr 2026 22:35:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.032373
- Title: PanLUNA: An Efficient and Robust Query-Unified Multimodal Model for Edge Biosignal Intelligence
- Title(参考訳): PanLUNA:エッジバイオシグナルインテリジェンスのための効率的でロバストなクエリ統一型マルチモーダルモデル
- Authors: Marija Zelic, Anna Tegon, Yawei Li, Thorir Mar Ingolfsson, Luca Benini,
- Abstract要約: PanLUNAは、単一の共有エンコーダ内でEEG、ECG、PSGを処理するコンパクトFMである。
TUAB異常脳波検出の精度は81.21%である。
- 参考スコア(独自算出の注目度): 14.663411219312827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physiological foundation models (FMs) have shown promise for biosignal representation learning, yet most remain confined to a single modality such as EEG, ECG, or PPG, largely because paired multimodal datasets are scarce. In this paper, we present PanLUNA, a compact 5.4M-parameter pan-modal FM that jointly processes EEG, ECG, and PPG within a single shared encoder. Extending LUNA's channel-unification module, PanLUNA treats multimodal channels as entries in a unified query set augmented with sensor-type embeddings, enabling efficient cross-modal early fusion while remaining inherently robust to missing modalities at inference time. Despite its small footprint, PanLUNA matches or exceeds models up to 57$\times$ larger: 81.21% balanced accuracy on TUAB abnormal EEG detection and state-of-the-art 0.7416 balanced accuracy on HMC multimodal sleep staging. Quantization-aware training with INT8 weights recovers $\geq$96% of full-precision performance, and deployment on the GAP9 ultra-low-power RISC-V microcontroller for wearables achieves 325.6 ms latency and 18.8 mJ per 10-second, 12-lead ECG inference, and 1.206 s latency at 68.65 mJ for multimodal 5-channel sleep staging over 30-second epochs.
- Abstract(参考訳): 生理学的基礎モデル(FM)は、生体信号表現学習の可能性を示しているが、ほとんどの場合、ペア化されたマルチモーダルデータセットが不足しているため、EEG、ECG、PSGのような単一のモダリティに限定されている。
本稿では,1つの共有エンコーダ内でEEG,ECG,PSGを共同処理する5.4Mパラメトリック・パンモーダルFMのPanLUNAについて述べる。
LUNAのチャネル統一モジュールを拡張して、PanLUNAはマルチモーダルチャネルをセンサータイプの埋め込みを付加した統合クエリセットのエントリとして扱う。
TUABの異常脳波検出の精度は81.21%、HMCのマルチモーダル睡眠ステージの精度は0.7416である。
INT8重み付き量子化対応トレーニングは、フル精度性能の96%$\geq$96%を回復し、GAP9超低消費電力のウェアラブル用RISC-Vマイクロコントローラへの展開は、30秒以上のマルチモーダル5チャンネル睡眠で325.6ms、10秒毎の18.8mJ、12リードのECG推論、1.206秒の遅延を68.65mJで達成している。
関連論文リスト
- Less is More in Semantic Space: Intrinsic Decoupling via Clifford-M for Fundus Image Classification [13.23226865033351]
フィードフォワード展開と周波数分割モジュールを疎幾何学的相互作用で置き換える軽量バックボーンであるClifford-Mを提案する。
プリトレーニングなしでは、Clifford-M は平均 AUC-ROC が 0.8142 で、平均マクロF1 が 0.5481 で、ODIR-5K は 0.85M のパラメータしか持たない。
論文 参考訳(メタデータ) (2026-03-21T13:00:05Z) - SHIELD8-UAV: Sequential 8-bit Hardware Implementation of a Precision-Aware 1D-F-CNN for Low-Energy UAV Acoustic Detection and Temporal Tracking [4.962717354668883]
ShiELD8-UAV (ShielD8-UAV) は、高精度1D機能駆動CNNアクセラレータのシーケンシャルな8ビットハードウェア実装である。
この設計は共有マルチ精度データパス上で層単位で実行し、複製された処理要素を不要にする。
その結果、逐次実行と高精度量子化とシリアライズ対応プルーニングを組み合わせることで、実用的な低エネルギーエッジ推論が可能となった。
論文 参考訳(メタデータ) (2026-03-01T12:09:15Z) - ULW-SleepNet: An Ultra-Lightweight Network for Multimodal Sleep Stage Scoring [28.352558247977168]
超軽量・マルチモーダル睡眠ステージスコアリングフレームワークULW-SleepNetを提案する。
新たなDual-Stream Separable Convolution (DSSC) Block、Deepwise Separable Convolutions、チャネルワイドパラメータ共有、グローバル平均プールなどが組み込まれている。
最先端手法と比較して,本モデルではパラメータを98.6%まで削減し,性能損失を極端に抑えた。
論文 参考訳(メタデータ) (2026-02-27T09:48:11Z) - STEP3-VL-10B Technical Report [115.89015065130127]
STEP3-VL-10Bは、コンパクト効率とフロンティアレベルのマルチモーダルインテリジェンスとのトレードオフを再定義する軽量基盤モデルである。
そこで我々はPallel Coordinated Reasoning(PaCoRe)を実装して,テスト時間計算をスケールし,リソースをスケーラブルな知覚推論に割り当てる。
MMBenchでは92.2%、MMMUでは80.11%、AIME2025では94.43%、MathVisionでは75.95%である。
論文 参考訳(メタデータ) (2026-01-14T17:58:24Z) - LFM2 Technical Report [87.58431408281973]
LFM2は、デバイス上での効率的なデプロイと強力なタスク機能を実現するために設計された、Liquid Foundation Modelsのファミリーである。
LFM2ファミリーは350M-8.3Bパラメータをカバーしており、密度の高いモデル(350M, 700M, 1.2B, 2.6B)と試験用混合物(合計8.3B, 1.5B)を含んでいる。
視覚遅延タスクのためのLFM2-VL,音声のためのLFM2-Audio,検索のためのLFM2-ColBERTを構築した。
論文 参考訳(メタデータ) (2025-11-28T17:56:35Z) - Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought [196.74837065805488]
Hunyuan-TurboSは、Transformer-Mamba Mixture of Expertsの大型ハイブリッドモデルである。
高いパフォーマンスと効率のバランスを保ち、推論コストを低く抑えている。
論文 参考訳(メタデータ) (2025-05-21T12:11:53Z) - Low-cost Embedded Breathing Rate Determination Using 802.15.4z IR-UWB Hardware for Remote Healthcare [2.6066253940276347]
本稿では,超広帯域(UWB)チャネルインパルス応答(CIR)データから呼吸速度を予測するための畳み込みニューラルネットワーク(CNN)を提案する。
46KBのメモリを必要とするnRF52840システムにアルゴリズムをデプロイし,192msの推論時間で動作可能であることを示す。
論文 参考訳(メタデータ) (2025-04-03T07:54:25Z) - Multi-Feature Fusion and Compressed Bi-LSTM for Memory-Efficient Heartbeat Classification on Wearable Devices [0.0]
多機能核融合と双方向長短期記憶(Bi-LSTM)を用いた心電図(ECG)を用いた心拍分類の資源効率向上手法を提案する。
このデータセットは、MIT-BIH Arrhythmia Database: Normal (N)、Left Bundle Branch Block (LBBB)、Right Bundle Branch Block (RBBB)、Premature Ventricular Contraction (PVC)、Paced Beat (PB)の5つのオリジナルクラスで構成されている。
論文 参考訳(メタデータ) (2024-05-24T07:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。