論文の概要: Edge-Efficient Two-Stream Multimodal Architecture for Non-Intrusive Bathroom Fall Detection
- arxiv url: http://arxiv.org/abs/2603.17069v1
- Date: Tue, 17 Mar 2026 18:54:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.361985
- Title: Edge-Efficient Two-Stream Multimodal Architecture for Non-Intrusive Bathroom Fall Detection
- Title(参考訳): 非侵入型浴室落下検知のためのエッジ効率2ストリームマルチモーダルアーキテクチャ
- Authors: Haitian Wang, Yiren Wang, Xinyu Wang, Sheldon Fung, Atif Mansoor,
- Abstract要約: 濡れた浴室環境の滝は、高齢者が一人で生活する大きな安全リスクである。
近年の研究では、mWaveのみ、振動のみ、および既存のマルチモーダルスキームがプライバシー保護、非侵襲的な転倒検出をサポートすることが示されている。
本研究では,長距離移動パターンと床振動の処理を行うMotion-Mambaブランチを用いて,レーダ信号を符号化する2ストリームアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 2.669350701173451
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Falls in wet bathroom environments are a major safety risk for seniors living alone. Recent work has shown that mmWave-only, vibration-only, and existing multimodal schemes, such as vibration-triggered radar activation, early feature concatenation, and decision-level score fusion, can support privacy-preserving, non-intrusive fall detection. However, these designs still treat motion and impact as loosely coupled streams, depending on coarse temporal alignment and amplitude thresholds, and do not explicitly encode the causal link between radar-observed collapse and floor impact or address timing drift, object drop confounders, and latency and energy constraints on low-power edge devices. To this end, we propose a two-stream architecture that encodes radar signals with a Motion--Mamba branch for long-range motion patterns and processes floor vibration with an Impact--Griffin branch that emphasizes impact transients and cross-axis coupling. Cross-conditioned fusion uses low-rank bilinear interaction and a Switch--MoE head to align motion and impact tokens and suppress object-drop confounders. The model keeps inference cost suitable for real-time execution on a Raspberry Pi 4B gateway. We construct a bathroom fall detection benchmark dataset with frame-level annotations, comprising more than 3~h of synchronized mmWave radar and triaxial vibration recordings across eight scenarios under running water, together with subject-independent training, validation, and test splits. On the test split, our model attains 96.1% accuracy, 94.8% precision, 88.0% recall, a 91.1% macro F1 score, and an AUC of 0.968. Compared with the strongest baseline, it improves accuracy by 2.0 percentage points and fall recall by 1.3 percentage points, while reducing latency from 35.9 ms to 15.8 ms and lowering energy per 2.56 s window from 14200 mJ to 10750 mJ on the Raspberry Pi 4B gateway.
- Abstract(参考訳): 濡れた浴室環境の滝は、高齢者が一人で生活する大きな安全リスクである。
近年の研究では、mmWaveのみ、振動のみ、および振動トリガーレーダーアクティベーション、早期特徴結合、決定レベルスコア融合といった既存のマルチモーダルスキームが、プライバシー保護、非侵襲的な転倒検出をサポートできることが示されている。
しかしながら、これらの設計は、粗い時間的アライメントと振幅しきい値に依存して、動きと衝撃を緩やかに結合したストリームとして扱い、レーダー観測された崩壊と床衝撃の因果関係を明示的にエンコードしていない。
そこで本研究では,長距離動パターンと床振動を処理するMotion-Mambaブランチでレーダ信号を符号化し,衝撃過渡性とクロス軸結合を強調するImpact-Griffinブランチで床振動を処理する2ストリームアーキテクチャを提案する。
クロスコンディショナー融合では、低ランクの双線形相互作用とSwitch-MoEヘッドを使用して、モーショントークンとインパクトトークンをアライメントし、オブジェクトドロップの共同設立者を抑制する。
このモデルはRaspberry Pi 4Bゲートウェイ上でのリアルタイム実行に適した推論コストを維持する。
我々は,流水環境下での3〜h以上の同期ミリ波レーダと3軸振動記録と,対象非依存のトレーニング,検証,テストスプリットを含む8つのシナリオからなる,フレームレベルのアノテーションを用いた浴室落下検出ベンチマークデータセットを構築した。
テスト分割では,96.1%の精度,94.8%の精度,88.0%のリコール,91.1%のマクロF1スコア,0.968のAUCが得られた。
最強のベースラインと比較すると、精度を2.0ポイント、フォールリコールを1.3%向上させ、レイテンシを35.9msから15.8msに下げ、Raspberry Pi 4Bゲートウェイの2.56sウィンドウあたりのエネルギーを14200mJから10750mJに下げる。
関連論文リスト
- OmniForcing: Unleashing Real-time Joint Audio-Visual Generation [51.031726911410594]
最近のジョイントオーディオ・視覚拡散モデルは、優れた生成品質を実現するが、高いレイテンシーに悩まされる。
OmniForcingは、オフラインの双方向拡散モデルを高忠実度ストリーミングオートレジェネレータに蒸留する最初のフレームワークである。
論文 参考訳(メタデータ) (2026-03-12T08:17:36Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - Time-Series at the Edge: Tiny Separable CNNs for Wearable Gait Detection and Optimal Sensor Placement [3.7765281299298015]
我々は,3軸加速度の短い窓から発生するパーキンソン病(PD)の歩行検出のためのデバイス上での時系列解析について検討した。
1つの文献ベースライン(分離可能な畳み込み)と2つのウルトラライトモデル(純粋に分離可能なもの)である。
論文 参考訳(メタデータ) (2025-11-29T08:52:41Z) - Multi-Modal Sensor Fusion for Proactive Blockage Prediction in mmWave Vehicular Networks [10.4860429348784]
本稿では,カメラ,GPS,LiDAR,レーダ入力などのマルチモーダルセンシングを利用したプロアクティブなブロック予測フレームワークを提案する。
このアプローチでは、モーダリティ固有のディープラーニングモデルを使用して、各センサストリームを独立に処理し、出力を融合する。
本研究は,ミリ波遮断予測におけるマルチモーダルセンシングの有効性と有効性を示し,動的環境におけるプロアクティブ無線通信の経路を提供する。
論文 参考訳(メタデータ) (2025-07-21T16:25:44Z) - Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving [23.83773255227831]
DejaVuは車載ネットワークを利用して、センサストリーム間の遅延を誘導し、微妙な時間的ミスアライメントを生成する攻撃である。
包括的攻撃分析により,センサのタスク特異的な不均衡感が明らかになった。
シングルフレームのLiDAR遅延では、攻撃者は車検出のmAPを最大88.5%削減し、3フレームのカメラ遅延、車滴の多重物体追跡精度(MOTA)を73%削減できる。
論文 参考訳(メタデータ) (2025-07-12T00:44:26Z) - A novel fast short-time root music method for vibration monitoring of high-speed spindles [5.048369760845484]
本稿では,FFT高速化したLaczosの対角化を利用して計算複雑性を低減する高速短時間ルートMUMU (fSTrM) を提案する。
本研究では,fSTrMが1.2Hzの周波数分解能(vs.12.5 Hz),93%の検知レートを5dB SNRで達成し,高調波コンテンツ解析により欠陥重大度を定量化することを示した。
論文 参考訳(メタデータ) (2025-06-21T05:35:38Z) - Fast Information Streaming Handler (FisH): A Unified Seismic Neural Network for Single Station Real-Time Earthquake Early Warning [56.45067876391473]
既存のEEWアプローチは、フェーズの選択、位置推定、大きさ推定を独立したタスクとして扱い、統一されたフレームワークを欠いている。
我々は高速情報ストリーミングハンドラー(FisH)と呼ばれる新しい統合型地震波ニューラルネットワークを提案する。
FisHは、リアルタイムストリーミング地震データを処理し、位相選択、位置推定、大きさ推定をエンドツーエンドで同時生成するように設計されている。
論文 参考訳(メタデータ) (2024-08-13T04:33:23Z) - Optimal baseline exploitation in vertical dark-matter detectors based on
atom interferometry [50.06952271801328]
長基線原子干渉計に基づく重力波やダークマターの地上検出器は、現在、最終計画段階にあるか、既に建設中である。
マルチダイアモンド噴水グレーディメータを用いた共振モード検出器は,その高さが利用可能なベースラインの20%を占める場合,最適なショットノイズ制限を達成できることを示す。
論文 参考訳(メタデータ) (2023-09-08T08:38:24Z) - Enhancing Reliability in Federated mmWave Networks: A Practical and
Scalable Solution using Radar-Aided Dynamic Blockage Recognition [14.18507067281377]
本稿では,ミリ波(mmWave)およびテラヘルツ(THz)ネットワークサービスの動的屋外環境における信頼性向上のための新しい手法を提案する。
これらの設定では、人や車などの障害物を動かすことで、視線接続(LoS)が簡単に中断される。
提案手法はRadar-Aided Blockage Dynamic Recognition (RaDaR)と呼ばれ、レーダー計測とフェデレートラーニング(FL)を活用して、二重出力ニューラルネットワーク(NN)モデルをトレーニングする。
論文 参考訳(メタデータ) (2023-06-22T10:10:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。