論文の概要: Modeling Label Semantics Improves Activity Recognition
- arxiv url: http://arxiv.org/abs/2301.03462v1
- Date: Sun, 1 Jan 2023 22:50:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-15 23:07:51.544821
- Title: Modeling Label Semantics Improves Activity Recognition
- Title(参考訳): ラベルセマンティクスのモデリングによる活動認識の改善
- Authors: Xiyuan Zhang, Ranak Roy Chowdhury, Dezhi Hong, Rajesh K. Gupta, Jingbo
Shang
- Abstract要約: 人間活動認識(HAR)は、感覚時系列を異なる活動に分類することを目的としている。
ラベルを整数IDとして分類するのではなく,ラベル名の意味を復号化するためのシーケンス・ツー・シーケンス・フレームワークを設計する。
提案手法は,学習活動を共有トークン(オープン),ウォーク)の学習に分解し,共同分布(オープン冷蔵庫),ウォークアップフロア(ウォークアップフロア)の学習よりも容易であり,データサンプルが不十分なアクティビティへの学習の伝達を支援する。
- 参考スコア(独自算出の注目度): 24.877578738079524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human activity recognition (HAR) aims to classify sensory time series into
different activities, with wide applications in activity tracking, healthcare,
human computer interaction, etc. Existing HAR works improve recognition
performance by designing more complicated feature extraction methods, but they
neglect the label semantics by simply treating labels as integer IDs. We find
that many activities in the current HAR datasets have shared label names, e.g.,
"open door" and "open fridge", "walk upstairs" and "walk downstairs". Through
some exploratory analysis, we find that such shared structure in activity names
also maps to similarity in the input features. To this end, we design a
sequence-to-sequence framework to decode the label name semantics rather than
classifying labels as integer IDs. Our proposed method decomposes learning
activities into learning shared tokens ("open", "walk"), which is easier than
learning the joint distribution ("open fridge", "walk upstairs") and helps
transfer learning to activities with insufficient data samples. For datasets
originally without shared tokens in label names, we also offer an automated
method, using OpenAI's ChatGPT, to generate shared actions and objects.
Extensive experiments on seven HAR benchmark datasets demonstrate the
state-of-the-art performance of our method. We also show better performance in
the long-tail activity distribution settings and few-shot settings.
- Abstract(参考訳): HAR(Human Activity Recognition)は、感覚時系列をさまざまなアクティビティに分類することを目的としており、アクティビティトラッキング、ヘルスケア、ヒューマンコンピュータインタラクションなど幅広い用途に応用されている。
既存のharはより複雑な特徴抽出法を設計して認識性能を向上させるが、ラベルを整数idとして扱うだけでラベルの意味を無視する。
現在のHARデータセットの多くのアクティビティが、"オープンドア"や"オープン冷蔵庫"、"2階のウォークアップ"、"2階のウォークダウン"といったラベル名を共有しています。
探索分析の結果,アクティビティ名の共有構造は入力特徴の類似性にもマップできることがわかった。
この目的のために,ラベルを整数idとして分類するのではなく,ラベル名のセマンティクスをデコードするシーケンシャル・ツー・シーケンス・フレームワークを設計する。
提案手法では,共有トークン(「オープン」,「ウォーク」)の学習に学習活動を分割し,共同分布(「オープン冷蔵庫」,「ウォークアップ階」)の学習よりも学習が容易であり,データサンプルが不十分な活動への学習の伝達を支援する。
ラベル名に共有トークンを含まないデータセットに対しては、OpenAIのChatGPTを使用して、共有アクションとオブジェクトを生成する自動メソッドも提供しています。
7つのHARベンチマークデータセットに対する大規模な実験により,本手法の最先端性能が示された。
また、長時間の活動分布設定と数ショット設定でもパフォーマンスが向上した。
関連論文リスト
- CoA: Chain-of-Action for Generative Semantic Labels [5.016605351534376]
CoA(Chain-of-Action)メソッドは、画像の文脈的に関連する特徴に沿ったラベルを生成する。
CoAは、豊かで価値のある文脈情報が推論時の生成性能を改善するという観察に基づいて設計されている。
論文 参考訳(メタデータ) (2024-11-26T13:09:14Z) - Multi-grained Label Refinement Network with Dependency Structures for
Joint Intent Detection and Slot Filling [13.963083174197164]
発話の意図と意味的構成要素は、文の構文的要素に依存する。
本稿では,依存性構造とラベルセマンティック埋め込みを利用した多層ラベル精細ネットワークについて検討する。
構文表現の強化を考慮し,グラフアテンション層による文の係り受け構造をモデルに導入する。
論文 参考訳(メタデータ) (2022-09-09T07:27:38Z) - Disentangled Action Recognition with Knowledge Bases [77.77482846456478]
本研究では,新規な動詞や新規な名詞に対する合成行動認識モデルの一般化能力の向上を目指す。
従来の作業では、知識グラフ内の動詞-名詞合成アクションノードを使用しており、スケールを非効率にしている。
本提案手法は, 行動の固有な構成性を活用する, 知識ベースを用いた不整合行動認識(DARK)である。
論文 参考訳(メタデータ) (2022-07-04T20:19:13Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - BABEL: Bodies, Action and Behavior with English Labels [53.83774092560076]
モーキャップシーケンスで実行される動作を記述した言語ラベル付き大規模データセットであるBABELを提案する。
BABELには28k以上のシーケンスラベルと63kのフレームラベルがあり、250以上のユニークなアクションカテゴリに属している。
ベンチマークとしてBABELの価値を実証し、3次元動作認識におけるモデルの性能を評価する。
論文 参考訳(メタデータ) (2021-06-17T17:51:14Z) - Generate, Annotate, and Learn: Generative Models Advance Self-Training
and Knowledge Distillation [58.64720318755764]
Semi-Supervised Learning (SSL)は多くのアプリケーションドメインで成功している。
知識蒸留(KD)により、深層ネットワークとアンサンブルの圧縮が可能となり、新しいタスク固有の未ラベルの例について知識を蒸留する際に最良の結果が得られる。
我々は、非条件生成モデルを用いて、ドメイン内の未ラベルデータを合成する「生成、注釈、学習(GAL)」と呼ばれる一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T05:01:24Z) - FineGym: A Hierarchical Video Dataset for Fine-grained Action
Understanding [118.32912239230272]
FineGymは体操ビデオの上に構築された新しいアクション認識データセットだ。
アクションレベルとサブアクションレベルの両方で3レベルのセマンティック階層を持つテンポラリアノテーションを提供する。
この新たな粒度レベルは、行動認識に重大な課題をもたらす。
論文 参考訳(メタデータ) (2020-04-14T17:55:21Z) - ActiLabel: A Combinatorial Transfer Learning Framework for Activity
Recognition [14.605223647792862]
ActiLabelは任意のドメインのイベントと異なるドメインのイベントの間の構造的類似性を学ぶフレームワークである。
3つの公開データセットに基づく実験は、最先端のトランスファー学習やディープラーニング手法よりもActiLabelの方が優れていることを示す。
論文 参考訳(メタデータ) (2020-03-16T19:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。