論文の概要: Skeleton-Based Intake Gesture Detection With Spatial-Temporal Graph Convolutional Networks
- arxiv url: http://arxiv.org/abs/2504.10635v1
- Date: Mon, 14 Apr 2025 18:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:10:12.210303
- Title: Skeleton-Based Intake Gesture Detection With Spatial-Temporal Graph Convolutional Networks
- Title(参考訳): 空間時間グラフ畳み込みネットワークを用いた骨格型吸気ジェスチャー検出
- Authors: Chunzhuo Wang, Zhewen Xue, T. Sunil Kumar, Guido Camps, Hans Hallez, Bart Vanrumste,
- Abstract要約: 本研究では,拡張時空間グラフ畳み込みネットワーク (ST-GCN) と双方向長短メモリ (BiLSTM) を組み合わせ,インテークジェスチャーを検出するモデルを用いたスケルトンベースのアプローチを提案する。
その結果,スケルトンデータを用いた摂取ジェスチャー検出の実現可能性を確認し,クロスデータセット検証における提案手法の堅牢性を強調した。
- 参考スコア(独自算出の注目度): 1.5228527154365612
- License:
- Abstract: Overweight and obesity have emerged as widespread societal challenges, frequently linked to unhealthy eating patterns. A promising approach to enhance dietary monitoring in everyday life involves automated detection of food intake gestures. This study introduces a skeleton based approach using a model that combines a dilated spatial-temporal graph convolutional network (ST-GCN) with a bidirectional long-short-term memory (BiLSTM) framework, as called ST-GCN-BiLSTM, to detect intake gestures. The skeleton-based method provides key benefits, including environmental robustness, reduced data dependency, and enhanced privacy preservation. Two datasets were employed for model validation. The OREBA dataset, which consists of laboratory-recorded videos, achieved segmental F1-scores of 86.18% and 74.84% for identifying eating and drinking gestures. Additionally, a self-collected dataset using smartphone recordings in more adaptable experimental conditions was evaluated with the model trained on OREBA, yielding F1-scores of 85.40% and 67.80% for detecting eating and drinking gestures. The results not only confirm the feasibility of utilizing skeleton data for intake gesture detection but also highlight the robustness of the proposed approach in cross-dataset validation.
- Abstract(参考訳): 過体重と肥満は、しばしば不健康な食事パターンと結びついている、広範な社会的課題として現れている。
日常生活における食事監視を強化するための有望なアプローチは、食物摂取のジェスチャーを自動的に検出することである。
本研究では,拡張時空間グラフ畳み込みネットワーク (ST-GCN) と双方向長短メモリ (BiLSTM) を併用した,ST-GCN-BiLSTM を用いたスケルトンベースのアプローチを提案する。
このスケルトンベースの手法は、環境の堅牢性、データ依存の低減、プライバシー保護の強化など、重要なメリットを提供する。
2つのデータセットがモデル検証に使用された。
OREBAデータセットは実験室で記録されたビデオで構成され、86.18%と74.84%のセグメントF1スコアを達成した。
さらに,OREBAで訓練したモデルを用いて,スマートフォン記録を用いた自己収集データセットを評価し,摂食行動検出のためのF1スコア85.40%と67.80%を得た。
その結果, 骨格データを用いた入力ジェスチャー検出の実現可能性だけでなく, クロスデータセット検証における提案手法の堅牢性も確認できた。
関連論文リスト
- SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - Hand Gesture Classification on Praxis Dataset: Trading Accuracy for
Expense [0.6390468088226495]
ボディージョイント座標で表される「骨格」データに、Praxデータセットから焦点を当てる。
PRAXISデータセットには、アルツハイマー病などの皮質病患者の記録が含まれている。
リカレントニューラルネットワーク(RNN)のような深層学習アーキテクチャとウィンドウニング手法を組み合わせることで,全体的な精度は70.8%に達した。
論文 参考訳(メタデータ) (2023-11-01T18:18:09Z) - A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。
アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。
データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文 参考訳(メタデータ) (2023-10-30T11:13:40Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Beyond Individual Input for Deep Anomaly Detection on Tabular Data [0.0]
異常検出は、金融、医療、サイバーセキュリティなど、多くの領域において不可欠である。
私たちの知る限りでは、この機能機能とサンプルサンプル依存関係をうまく組み合わせる最初の作業です。
提案手法は,F1スコアとAUROCをそれぞれ2.4%,AUROCを1.2%上回り,最先端性能を実現している。
論文 参考訳(メタデータ) (2023-05-24T13:13:26Z) - A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-11-01T14:12:58Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Joint-bone Fusion Graph Convolutional Network for Semi-supervised
Skeleton Action Recognition [65.78703941973183]
本稿では,CD-JBF-GCNをエンコーダとし,ポーズ予測ヘッドをデコーダとして使用する新しい相関駆動型ジョイントボーン・フュージョングラフ畳み込みネットワークを提案する。
具体的には、CD-JBF-GCは、関節ストリームと骨ストリームの間の運動伝達を探索することができる。
自己教師型トレーニング段階におけるポーズ予測に基づくオートエンコーダにより、未ラベルデータから動作表現を学習することができる。
論文 参考訳(メタデータ) (2022-02-08T16:03:15Z) - A Data Driven End-to-end Approach for In-the-wild Monitoring of Eating
Behavior Using Smartwatches [8.257740966456172]
本稿では, 食事中の食行動の自動化と, 食事の時間的局在のモデル化に向けて, 完全な枠組みを提案する。
食物摂取事象(すなわち噛み跡)を検出するエンドツーエンドニューラルネットワークを提案する。
食事の開始点と終了点を信号処理アルゴリズムを用いて推定するために,検出した噛み跡の1日を通して分布を推定する方法を示す。
論文 参考訳(メタデータ) (2020-10-12T12:35:56Z) - Proximity-Based Active Learning on Streaming Data: A Personalized Eating
Moment Recognition [17.961752949636306]
本稿では,身近な身近な身近な行動認識モデルである,ストリーミングデータに基づくプロクシミティベースのアクティブラーニングを提案する。
制御および制御されていない設定の両方で収集されたデータから、PLASのFスコアは10から60のクエリの予算に対して22%から39%の範囲であることが示された。
論文 参考訳(メタデータ) (2020-03-29T18:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。