論文の概要: Towards LLM-Powered Ambient Sensor Based Multi-Person Human Activity Recognition
- arxiv url: http://arxiv.org/abs/2407.09529v1
- Date: Tue, 25 Jun 2024 07:41:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 13:18:53.355274
- Title: Towards LLM-Powered Ambient Sensor Based Multi-Person Human Activity Recognition
- Title(参考訳): LLMを用いたマルチパーソン・ヒューマン・アクティビティ認識に向けて
- Authors: Xi Chen, Julien Cumin, Fano Ramparany, Dominique Vaufreydaz,
- Abstract要約: HAR(Human Activity Recognition)は、在宅医療、高齢者介護、ホームセキュリティなどの分野における中心的な問題の一つである。
本稿では,大規模言語モデルに基づくLAHARというシステムフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.187145402358247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human Activity Recognition (HAR) is one of the central problems in fields such as healthcare, elderly care, and security at home. However, traditional HAR approaches face challenges including data scarcity, difficulties in model generalization, and the complexity of recognizing activities in multi-person scenarios. This paper proposes a system framework called LAHAR, based on large language models. Utilizing prompt engineering techniques, LAHAR addresses HAR in multi-person scenarios by enabling subject separation and action-level descriptions of events occurring in the environment. We validated our approach on the ARAS dataset, and the results demonstrate that LAHAR achieves comparable accuracy to the state-of-the-art method at higher resolutions and maintains robustness in multi-person scenarios.
- Abstract(参考訳): HAR(Human Activity Recognition)は、在宅医療、高齢者介護、ホームセキュリティなどの分野における中心的な問題の一つである。
しかし、従来のHARアプローチでは、データの不足、モデルの一般化の困難、マルチパーソンシナリオにおけるアクティビティ認識の複雑さといった課題に直面している。
本稿では,大規模言語モデルに基づくLAHARというシステムフレームワークを提案する。
LAHARは、素早いエンジニアリング技術を活用することで、マルチパーソンシナリオにおけるHARに対処する。
我々はARASデータセットに対するアプローチを検証するとともに,LAHARが高解像度で最先端手法に匹敵する精度を達成し,マルチパーソンシナリオにおけるロバスト性を維持することを実証した。
関連論文リスト
- HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.80423207808076]
効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。
これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。
本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。
また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Multidimensional Human Activity Recognition With Large Language Model: A Conceptual Framework [0.0]
緊急対応や高齢者ケアのような高リスク環境では、大きな言語モデル(LLM)の統合がリスクアセスメント、リソースアロケーション、緊急対応に革命をもたらします。
本稿では,HAR(Human Activity Recognition)システムにおける多次元学習を支援するために,様々なウェアラブルデバイスを1次元と見なす概念的枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T21:36:23Z) - A Comprehensive Methodological Survey of Human Activity Recognition Across Divers Data Modalities [2.916558661202724]
人間活動認識(HAR)システムは、人間の行動を理解し、それぞれの行動にラベルを割り当てることを目的としている。
HARは、RGB画像やビデオ、スケルトン、深度、赤外線、ポイントクラウド、イベントストリーム、オーディオ、アクセラレーション、レーダー信号など、さまざまなデータモダリティを利用することができる。
本稿は,2014年から2024年までのHARの最新の進歩に関する包括的調査である。
論文 参考訳(メタデータ) (2024-09-15T10:04:44Z) - FFAA: Multimodal Large Language Model based Explainable Open-World Face Forgery Analysis Assistant [59.2438504610849]
FFAA: Face Forgery Analysis Assistant(MLLM)とMIDS(Multi-Awer Intelligent Decision System)について紹介する。
提案手法は,ユーザフレンドリで説明可能な結果を提供するだけでなく,従来の手法に比べて精度と堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-08-19T15:15:20Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - FGAHOI: Fine-Grained Anchors for Human-Object Interaction Detection [4.534713782093219]
上記の問題を緩和するために、新しいエンドツーエンドトランスフォーマーベースフレームワーク(FGAHOI)を提案する。
FGAHOIは、マルチスケールサンプリング(MSS)、階層空間認識マージ(HSAM)、タスク認識マージ機構(TAM)の3つの専用コンポーネントから構成される。
論文 参考訳(メタデータ) (2023-01-08T03:53:50Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Seeing Differently, Acting Similarly: Imitation Learning with
Heterogeneous Observations [126.78199124026398]
多くの実世界の模倣学習タスクでは、デモレーターと学習者は異なるが完全な観察空間で行動しなければならない。
本研究では、上記の学習問題を異種観察学習(HOIL)としてモデル化する。
本稿では,重要度重み付け,拒否学習,アクティブクエリに基づくIWREアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-17T05:44:04Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Personalized Semi-Supervised Federated Learning for Human Activity
Recognition [1.9014535120129343]
人間活動認識のための新しいハイブリッド手法であるFedHARを提案する。
FedHARは半教師付きとフェデレーション学習を組み合わせたものです。
我々は、FedHARが最新のFL監督アプローチに類似した認識率とパーソナライゼーション能力に達することを示しています。
論文 参考訳(メタデータ) (2021-04-15T10:24:18Z) - B-HAR: an open-source baseline framework for in depth study of human
activity recognition datasets and workflows [1.7639472693362923]
本稿では,ベースラインフレームワークの定義,標準化,開発のためのオープンソースフレームワークであるB-HARを提案する。
データ準備のための最も一般的なデータ処理方法と、最も一般的な機械学習およびディープラーニングパターン認識モデルを実装している。
論文 参考訳(メタデータ) (2021-01-23T12:42:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。