論文の概要: Development of ML model for triboelectric nanogenerator based sign language detection system
- arxiv url: http://arxiv.org/abs/2604.06220v1
- Date: Thu, 26 Mar 2026 08:35:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.651323
- Title: Development of ML model for triboelectric nanogenerator based sign language detection system
- Title(参考訳): トリボ誘電体ナノジェネレータを用いた手話検出システムのためのMLモデルの開発
- Authors: Meshv Patel, Bikash Baro, Sayan Bayan, Mohendra Roy,
- Abstract要約: 聴覚と聴覚のコミュニケーションギャップを埋めるためには手話認識が不可欠である。
本研究は、カスタムトライボ誘電体ナノジェネレータ(TENG)を用いたセンサグローブにおける機械学習(ML)とディープラーニングモデルの比較を示す。
提案したMFCC CNN-LSTMアーキテクチャは、融合前の独立した畳み込み枝を通じて各センサから周波数領域の特徴を処理する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sign language recognition (SLR) is vital for bridging communication gaps between deaf and hearing communities. Vision-based approaches suffer from occlusion, computational costs, and physical constraints. This work presents a comparison of machine learning (ML) and deep learning models for a custom triboelectric nanogenerator (TENG)-based sensor glove. Utilizing multivariate time-series data from five flex sensors, the study benchmarks traditional ML algorithms, feedforward neural networks, LSTM-based temporal models, and a multi-sensor MFCC CNN-LSTM architecture across 11 sign classes (digits 1-5, letters A-F). The proposed MFCC CNN-LSTM architecture processes frequency-domain features from each sensor through independent convolutional branches before fusion. It achieves 93.33% accuracy and 95.56% precision, a 23-point improvement over the best ML algorithm (Random Forest: 70.38%). Ablation studies reveal 50-timestep windows offer a tradeoff between temporal context and training data volume, yielding 84.13% accuracy compared to 58.06% with 100-timestep windows. MFCC feature extraction maps temporal variations to execution-speed-invariant spectral representations, and data augmentation methods (time warping, noise injection) are essential for generalization. Results demonstrate that frequency-domain feature representations combined with parallel multi-sensor processing architectures offer enhancement over classical algorithms and time-domain deep learning for wearable sensor-based gesture recognition. This aids assistive technology development.
- Abstract(参考訳): 手話認識(SLR)は聴覚と聴覚のコミュニケーションギャップを埋めるのに不可欠である。
視覚に基づくアプローチは、排他的、計算コスト、物理的制約に悩まされる。
本研究は、カスタムトライボ誘電体ナノジェネレータ(TENG)を用いたセンサグローブにおける機械学習(ML)とディープラーニングモデルの比較を示す。
従来のMLアルゴリズム、フィードフォワードニューラルネットワーク、LSTMベースの時間モデル、11のシグネチャクラス(桁1-5,文字A-F)にわたるマルチセンサーのMFCC CNN-LSTMアーキテクチャをベンチマークする。
提案したMFCC CNN-LSTMアーキテクチャは、融合前の独立した畳み込み枝を通じて各センサから周波数領域の特徴を処理する。
精度は93.33%、精度は95.56%で、最高のMLアルゴリズムよりも23ポイント向上している(Random Forest: 70.38%)。
アブレーション研究によると、50タイムステップのウィンドウは、時間的コンテキストとトレーニングデータボリュームのトレードオフを提供し、その精度は84.13%、100タイムステップのウィンドウは58.06%である。
MFCCの特徴抽出は、時間的変動を実行速度不変のスペクトル表現にマッピングし、一般化にはデータ拡張法(時間ゆらぎ、ノイズ注入)が不可欠である。
その結果,周波数領域の特徴表現と並列マルチセンサ処理アーキテクチャが組み合わさって,従来のアルゴリズムの強化や,ウェアラブルセンサによるジェスチャー認識のための時間領域ディープラーニングを実現していることがわかった。
これは補助技術開発に役立ちます。
関連論文リスト
- Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。
FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。
推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文 参考訳(メタデータ) (2026-02-12T18:54:57Z) - DNN-Based Precoding in RIS-Aided mmWave MIMO Systems With Practical Phase Shift [43.56429251312585]
本稿では、直接通信路を妨害したミリ波マルチインプット多重出力(MIMO)システムのスループットを最大化する。
リコンフィギュアブルインテリジェントサーフェス(RIS)は、視線(LoS)とマルチパス効果に関連するmmWave特性を考慮して伝送性を高めるために使用される。
ディープニューラルネットワーク(DNN)は、より高速なコードワード選択を容易にするために開発された。
論文 参考訳(メタデータ) (2025-07-03T17:35:06Z) - Neuromorphic Wireless Split Computing with Resonate-and-Fire Neurons [69.73249913506042]
本稿では、共振器(RF)ニューロンを用いて時間領域信号を直接処理する無線スプリットコンピューティングアーキテクチャについて検討する。
可変周波数で共鳴することにより、RFニューロンは低スパイク活性を維持しながら時間局在スペクトル特徴を抽出する。
実験の結果,提案したRF-SNNアーキテクチャは従来のLIF-SNNやANNと同等の精度を達成できることがわかった。
論文 参考訳(メタデータ) (2025-06-24T21:14:59Z) - Exploring FMCW Radars and Feature Maps for Activity Recognition: A Benchmark Study [2.251010251400407]
本研究では、人間の活動認識のための周波数変調連続波レーダに基づくフレームワークを提案する。
特徴写像を画像として処理する従来の手法とは異なり、本研究では多次元特徴写像をデータベクトルとして与える。
ConvLSTMモデルは従来の機械学習およびディープラーニングモデルよりも優れ、精度は90.51%に達した。
論文 参考訳(メタデータ) (2025-03-07T17:53:29Z) - Reservoir Network with Structural Plasticity for Human Activity Recognition [2.355460994057843]
Echo State Network(ESN)は、時系列データのユニークなパターンを特定し、将来のイベントを予測するために使用できる、リカレントニューラルネットワークのクラスである。
本研究では,ESNターゲットエッジデバイスに基づくカスタム設計ニューロモルフィックチップを提案する。
提案システムは, 構造的可塑性, シナプス的可塑性, 局所的オンチップなど, 様々な学習メカニズムをサポートする。
論文 参考訳(メタデータ) (2025-03-01T07:57:22Z) - Hyperdimensional Computing Empowered Federated Foundation Model over Wireless Networks for Metaverse [56.384390765357004]
本稿では,新しい基礎モデルのための統合型分割学習と超次元計算フレームワークを提案する。
この新しいアプローチは通信コスト、計算負荷、プライバシーリスクを低減し、Metaverseのリソース制約されたエッジデバイスに適している。
論文 参考訳(メタデータ) (2024-08-26T17:03:14Z) - SMORE: Similarity-based Hyperdimensional Domain Adaptation for
Multi-Sensor Time Series Classification [17.052624039805856]
マルチセンサ時系列分類のための新しい資源効率ドメイン適応(DA)アルゴリズムであるSMOREを提案する。
SMOREは、最先端(SOTA)のDNNベースのDAアルゴリズムよりも平均1.98%高い精度で18.81倍高速トレーニングと4.63倍高速推論を実現している。
論文 参考訳(メタデータ) (2024-02-20T18:48:49Z) - Decoding ECoG signal into 3D hand translation using deep learning [3.20238141000059]
運動脳-コンピュータインターフェース(Motor Brain-Computer Interface、BCI)は、運動障害者が環境と対話できる技術である。
連続手の動きを予測するために使用されるほとんどのECoG信号デコーダは線形モデルである。
多くの問題において最先端のディープラーニングモデルは、この関係をよりよく捉えるための解決策になり得る。
論文 参考訳(メタデータ) (2021-10-05T15:41:04Z) - Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network [68.43026108936029]
雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-07T08:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。