論文の概要: Generative Pretrained Embedding and Hierarchical Irregular Time Series Representation for Daily Living Activity Recognition
- arxiv url: http://arxiv.org/abs/2412.19732v1
- Date: Fri, 27 Dec 2024 16:43:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:25:25.291633
- Title: Generative Pretrained Embedding and Hierarchical Irregular Time Series Representation for Daily Living Activity Recognition
- Title(参考訳): 生活行動認識のための事前学習型埋め込みと階層的不規則時系列表現
- Authors: Damien Bouchabou, Sao Mai Nguyen,
- Abstract要約: 本稿では,環境センサアクティベーションに適した2つの異なる事前学習型埋め込みの評価により,既存のアルゴリズムを活性化することを目的とする。
我々は、Transformer Decoderベースの事前トレーニングされた埋め込みアーキテクチャを探索し、GPT設計を思い起こさせる。
結論として、GPTにインスパイアされた階層的アプローチは、時間的洞察によって注入され、SOTA ELMoベンチマークより優れている。
- 参考スコア(独自算出の注目度): 0.4604003661048266
- License:
- Abstract: Within the evolving landscape of smart homes, the precise recognition of daily living activities using ambient sensor data stands paramount. This paper not only aims to bolster existing algorithms by evaluating two distinct pretrained embeddings suited for ambient sensor activations but also introduces a novel hierarchical architecture. We delve into an architecture anchored on Transformer Decoder-based pre-trained embeddings, reminiscent of the GPT design, and contrast it with the previously established state-of-the-art (SOTA) ELMo embeddings for ambient sensors. Our proposed hierarchical structure leverages the strengths of each pre-trained embedding, enabling the discernment of activity dependencies and sequence order, thereby enhancing classification precision. To further refine recognition, we incorporate into our proposed architecture an hour-of-the-day embedding. Empirical evaluations underscore the preeminence of the Transformer Decoder embedding in classification endeavors. Additionally, our innovative hierarchical design significantly bolsters the efficacy of both pre-trained embeddings, notably in capturing inter-activity nuances. The integration of temporal aspects subtly but distinctively augments classification, especially for time-sensitive activities. In conclusion, our GPT-inspired hierarchical approach, infused with temporal insights, outshines the SOTA ELMo benchmark.
- Abstract(参考訳): スマートホームの進化する風景の中では、環境センサデータを用いた日常生活活動の正確な認識が最重要である。
本論文は,環境センサアクティベーションに適した2つの事前学習済み埋め込みを評価することによって,既存のアルゴリズムを活性化するだけでなく,新しい階層型アーキテクチャも導入する。
トランスフォーマーデコーダをベースとした事前学習型埋め込みに固定されたアーキテクチャを探索し,GPT設計を思い出させるとともに,従来確立されていた環境センサ用ELMOと対比した。
提案する階層構造は,各事前学習した埋め込みの強度を利用して,アクティビティ依存性とシーケンス順序の識別を可能にし,分類精度を向上する。
認識をさらに洗練するために,提案したアーキテクチャを1日の組込みで組み込む。
分類作業におけるトランスフォーマーデコーダの優位性の実証評価
さらに、我々の革新的な階層型設計は、両方の事前訓練された埋め込みの有効性を著しく向上させ、特に活動間のニュアンスを捕捉する。
時間的側面の統合は、特に時間に敏感な活動に対する分類を微妙に、しかし顕著に増強する。
結論として、GPTにインスパイアされた階層的アプローチは、時間的洞察によって注入され、SOTA ELMoベンチマークより優れている。
関連論文リスト
- DynST: Dynamic Sparse Training for Resource-Constrained Spatio-Temporal Forecasting [31.398965880415492]
地球科学システムは、センサーの広範な展開に大きく依存している。
従来のセンサー配置アプローチでは、特定のアルゴリズムを使用してセンサーを設計および展開する。
本稿では,スパース時間データダイナミックスパーストレーニングの概念を初めて紹介し,適応的かつ動的に重要な分布センサをフィルタリングすることにコミットする。
論文 参考訳(メタデータ) (2024-03-05T12:31:24Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - Self-Supervised Representation Learning from Temporal Ordering of
Automated Driving Sequences [49.91741677556553]
本研究では、認識タスクのための地域レベルの特徴表現を事前学習するための時間順述前文タスクであるTempOを提案する。
我々は各フレームを、オブジェクト検出やトラッキングシステムにとって自然な表現である、未順序な特徴ベクトルのセットで埋め込む。
BDD100K、nu Images、MOT17データセットの大規模な評価は、私たちのTempO事前学習アプローチがシングルフレームの自己教師型学習方法よりも優れていることを示している。
論文 参考訳(メタデータ) (2023-02-17T18:18:27Z) - Learning from Mistakes: Self-Regularizing Hierarchical Representations
in Point Cloud Semantic Segmentation [15.353256018248103]
LiDARセマンティックセマンティックセマンティクスは、きめ細かいシーン理解を実現するために注目を集めている。
本稿では、標準モデルから派生した分類ミスタケス(LEAK)からLEArnを分離する粗大な設定を提案する。
我々のLEAKアプローチは非常に一般的で、どんなセグメンテーションアーキテクチャにもシームレスに適用できます。
論文 参考訳(メタデータ) (2023-01-26T14:52:30Z) - ViTs for SITS: Vision Transformers for Satellite Image Time Series [52.012084080257544]
ビジョン変換器(ViT)に基づく一般衛星画像時系列(SITS)処理のための完全アテンショナルモデルを提案する。
TSViTはSITSレコードを空間と時間で重複しないパッチに分割し、トークン化し、分解されたテンポロ空間エンコーダで処理する。
論文 参考訳(メタデータ) (2023-01-12T11:33:07Z) - Spatio-temporal Relation Modeling for Few-shot Action Recognition [100.3999454780478]
本稿では,高次時間表現を同時に学習しながら,クラス固有の特徴の識別性を向上する数ショットアクション認識フレームワークSTRMを提案する。
本手法は,本研究でもっとも優れた手法に比べて,分類精度が3.5%向上した。
論文 参考訳(メタデータ) (2021-12-09T18:59:14Z) - Encoders and Ensembles for Task-Free Continual Learning [15.831773437720429]
本稿では,タスク境界が存在しない,あるいは不明な,特に要求の多い環境での継続的な学習に有効なアーキテクチャを提案する。
このアーキテクチャで訓練されたモデルは、標準画像分類連続学習ベンチマークにおけるタスクフリー設定の最先端であることを示す。
また、アーキテクチャは、一度に1つのクラスが学習される完全にインクリメンタルな環境でよく学習され、最大100のクラスでその効果を示す。
論文 参考訳(メタデータ) (2021-05-27T17:34:31Z) - A Tree-structure Convolutional Neural Network for Temporal Features
Exaction on Sensor-based Multi-resident Activity Recognition [4.619245607612873]
マルチレジデント活動認識(TSC-MRAR)のためのエンドツーエンド木構造畳み込みニューラルネットワークフレームワークを提案する。
まず、各サンプルをイベントとして扱い、スライディングウインドウに過去のセンサの読み取りを埋め込んだ現在のイベントを得る。
そして、時間的特徴を自動的に生成するために、木構造ネットワークを設計し、近くの読み物の時間的依存を導出する。
論文 参考訳(メタデータ) (2020-11-05T14:31:00Z) - Target-Embedding Autoencoders for Supervised Representation Learning [111.07204912245841]
本稿では,対象空間が高次元な純粋教師付き環境における一般化の枠組みを解析する。
我々は、教師付き予測のための目標埋め込みオートエンコーダ(TEA)の一般的なフレームワークのモチベーションと形式化を行い、特徴とターゲットの予測の両方から予測可能なように最適化された中間潜在表現を学習する。
論文 参考訳(メタデータ) (2020-01-23T02:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。