論文の概要: A Multi-Task Deep Learning Approach for Sensor-based Human Activity
Recognition and Segmentation
- arxiv url: http://arxiv.org/abs/2303.11100v1
- Date: Mon, 20 Mar 2023 13:34:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 15:27:56.392471
- Title: A Multi-Task Deep Learning Approach for Sensor-based Human Activity
Recognition and Segmentation
- Title(参考訳): センサを用いたヒューマンアクティビティ認識とセグメンテーションのためのマルチタスク深層学習手法
- Authors: Furong Duan, Tao Zhu, Jinqiang Wang, Liming Chen, Huansheng Ning,
Yaping Wan
- Abstract要約: 本稿では,この2つの課題を同時に解くために,新しいディープニューラルネットワークを提案する。
提案するネットワークは,選択的畳み込みを採用し,長時間ないし短時間の動作を分割するマルチスケールウィンドウを備えている。
提案手法は,アクティビティ認識とセグメンテーションの両方において,最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 4.987833356397567
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sensor-based human activity segmentation and recognition are two important
and challenging problems in many real-world applications and they have drawn
increasing attention from the deep learning community in recent years. Most of
the existing deep learning works were designed based on pre-segmented sensor
streams and they have treated activity segmentation and recognition as two
separate tasks. In practice, performing data stream segmentation is very
challenging. We believe that both activity segmentation and recognition may
convey unique information which can complement each other to improve the
performance of the two tasks. In this paper, we firstly proposes a new
multitask deep neural network to solve the two tasks simultaneously. The
proposed neural network adopts selective convolution and features multiscale
windows to segment activities of long or short time durations. First, multiple
windows of different scales are generated to center on each unit of the feature
sequence. Then, the model is trained to predict, for each window, the activity
class and the offset to the true activity boundaries. Finally, overlapping
windows are filtered out by non-maximum suppression, and adjacent windows of
the same activity are concatenated to complete the segmentation task. Extensive
experiments were conducted on eight popular benchmarking datasets, and the
results show that our proposed method outperforms the state-of-the-art methods
both for activity recognition and segmentation.
- Abstract(参考訳): センサに基づく人間の活動のセグメンテーションと認識は、多くの現実世界のアプリケーションにおいて重要かつ困難な問題であり、近年、深層学習コミュニティから注目を集めている。
既存のディープラーニングの作業の多くは、事前にセグメンテーションされたセンサーストリームに基づいて設計されており、アクティビティセグメンテーションと認識を2つの別々のタスクとして扱っている。
実際、データストリームセグメンテーションの実行は非常に困難です。
アクティビティセグメンテーションと認識の両方が,2つのタスクの性能向上のために相互補完可能なユニークな情報を伝達できると考えている。
本稿では,まず2つのタスクを同時に解くための,新しいマルチタスク深層ニューラルネットワークを提案する。
提案したニューラルネットワークは選択的畳み込みを採用し、長期または短期の動作を分割するマルチスケールウィンドウを備えている。
まず、異なるスケールの複数のウィンドウが生成され、特徴系列の各ユニットに集中する。
次に、モデルは各ウィンドウに対して、アクティビティクラスと真のアクティビティ境界へのオフセットを予測するようにトレーニングされる。
最後に、重なり合うウィンドウを非最大抑制によりフィルタリングし、同じアクティビティの隣接ウィンドウを連結してセグメント化タスクを完了させる。
その結果,提案手法は,活動認識とセグメンテーションの両方において,最先端の手法よりも優れていることがわかった。
関連論文リスト
- Frequency-based Matcher for Long-tailed Semantic Segmentation [22.199174076366003]
我々は、比較的未探索なタスク設定、長い尾のセマンティックセマンティックセグメンテーション(LTSS)に焦点を当てる。
本稿では,セマンティックセグメンテーション手法と長鎖解の性能を示すために,二値評価システムを提案し,LTSSベンチマークを構築した。
また,1対1のマッチングによって過剰な圧縮問題を解決する周波数ベースのマーカであるLTSSを改善するトランスフォーマーベースのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-06T09:57:56Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - Remote Task-oriented Grasp Area Teaching By Non-Experts through
Interactive Segmentation and Few-Shot Learning [0.0]
ロボットは、将来的な操作タスクに応じて、異なる把握スタイルを区別できなければならない。
この目的に向けて,新しい2段階の枠組みを提案する。
対話型セグメンテーションによる新しいタスクの把握領域のデモンストレーションを受信する。
これらのいくつかの実演から学習し、与えられたタスクの目に見えないシーンにおいて、必要な把握領域を推定する。
論文 参考訳(メタデータ) (2023-03-17T18:09:01Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - Multi-level Contrast Network for Wearables-based Joint Activity
Segmentation and Recognition [10.828099015828693]
ウェアラブルを用いたヒューマンアクティビティ認識(HAR)は、多くのスマートヘルスケアアプリケーションで広く採用可能な、有望な研究である。
ほとんどのHARアルゴリズムは、必要不可欠なが滅多に悪用されないマルチクラスウィンドウ問題の影響を受けやすい。
我々は,HARにセグメンテーション技術を導入し,共同活動セグメンテーションと認識を実現した。
論文 参考訳(メタデータ) (2022-08-16T05:39:02Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - A Tree-structure Convolutional Neural Network for Temporal Features
Exaction on Sensor-based Multi-resident Activity Recognition [4.619245607612873]
マルチレジデント活動認識(TSC-MRAR)のためのエンドツーエンド木構造畳み込みニューラルネットワークフレームワークを提案する。
まず、各サンプルをイベントとして扱い、スライディングウインドウに過去のセンサの読み取りを埋め込んだ現在のイベントを得る。
そして、時間的特徴を自動的に生成するために、木構造ネットワークを設計し、近くの読み物の時間的依存を導出する。
論文 参考訳(メタデータ) (2020-11-05T14:31:00Z) - Sequential Weakly Labeled Multi-Activity Localization and Recognition on
Wearable Sensors using Recurrent Attention Networks [13.64024154785943]
本稿では,逐次的にラベル付けされたマルチアクティビティ認識と位置情報タスクを処理するために,RAN(Recurrent attention network)を提案する。
我々のRANモデルは、粗粒度シーケンシャルな弱いラベルからマルチアクティビティータイプを同時に推測することができる。
手動ラベリングの負担を大幅に軽減する。
論文 参考訳(メタデータ) (2020-04-13T04:57:09Z) - ZSTAD: Zero-Shot Temporal Activity Detection [107.63759089583382]
本研究では,ゼロショット時間的活動検出(ZSTAD)と呼ばれる新たなタスク設定を提案する。
このソリューションのアーキテクチャとして,R-C3Dに基づくエンドツーエンドのディープネットワークを設計する。
THUMOS14とCharadesデータセットの両方の実験は、目に見えない活動を検出するという点で有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-03-12T02:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。