論文の概要: Human Activity Recognition in an Open World
- arxiv url: http://arxiv.org/abs/2212.12141v1
- Date: Fri, 23 Dec 2022 04:31:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 16:54:33.998950
- Title: Human Activity Recognition in an Open World
- Title(参考訳): オープンワールドにおける人間の活動認識
- Authors: Derek S. Prijatelj (1), Samuel Grieggs (1), Jin Huang (1), Dawei Du
(2), Ameya Shringi (2), Christopher Funk (2), Adam Kaufman (3), Eric
Robertson (3), Walter J. Scheirer (1) ((1) University of Notre Dame, (2)
Kitware, (3) PAR Government)
- Abstract要約: 認識に基づく人間行動認識(HAR)における新規性の管理は、現実的な環境において重要である。
HARを最適に実行するには、アルゴリズム的な解はニュアンス・ノベルティに寛容でなければならない。
本稿では,HARにおける新規性の定義を,分類タスクにおける新規性の定義に基づいて定式化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Managing novelty in perception-based human activity recognition (HAR) is
critical in realistic settings to improve task performance over time and ensure
solution generalization outside of prior seen samples. Novelty manifests in HAR
as unseen samples, activities, objects, environments, and sensor changes, among
other ways. Novelty may be task-relevant, such as a new class or new features,
or task-irrelevant resulting in nuisance novelty, such as never before seen
noise, blur, or distorted video recordings. To perform HAR optimally,
algorithmic solutions must be tolerant to nuisance novelty, and learn over time
in the face of novelty. This paper 1) formalizes the definition of novelty in
HAR building upon the prior definition of novelty in classification tasks, 2)
proposes an incremental open world learning (OWL) protocol and applies it to
the Kinetics datasets to generate a new benchmark KOWL-718, 3) analyzes the
performance of current state-of-the-art HAR models when novelty is introduced
over time, 4) provides a containerized and packaged pipeline for reproducing
the OWL protocol and for modifying for any future updates to Kinetics. The
experimental analysis includes an ablation study of how the different models
perform under various conditions as annotated by Kinetics-AVA. The protocol as
an algorithm for reproducing experiments using the KOWL-718 benchmark will be
publicly released with code and containers at
https://github.com/prijatelj/human-activity-recognition-in-an-open-world. The
code may be used to analyze different annotations and subsets of the Kinetics
datasets in an incremental open world fashion, as well as be extended as
further updates to Kinetics are released.
- Abstract(参考訳): 認識に基づくヒューマンアクティビティ認識(HAR)における新規性の管理は、時間とともにタスクパフォーマンスを改善し、先行したサンプル以外のソリューションの一般化を保証するために、現実的な設定において重要である。
HARの新規性は、未確認サンプル、アクティビティ、オブジェクト、環境、センサーの変更などとして現れます。
新規性は、新しいクラスや新しい機能のようなタスク関連性や、ノイズやぼやけ、歪んだビデオ記録のようなニュアンスな新規性をもたらすタスク関連性がある。
HARを最適に実行するには、アルゴリズム的解法はニュアンス・ノベルティに寛容でなければならない。
本論文
1)HARにおける新規性の定義を分類タスクにおける新規性の定義に基づいて定式化する。
2は、インクリメンタルなオープンワールドラーニング(OWL)プロトコルを提案し、それをKineeticsデータセットに適用し、新しいベンチマークKOWL-718を生成する。
3)新奇性導入時の最新のharモデルの性能について分析する。
OWLプロトコルを再現し、今後のKineticsのアップデートを変更するためのコンテナ化およびパッケージ化されたパイプラインを提供する。
実験解析では, 様々な条件下で異なるモデルがどのように振る舞うかについて, 速度論的-avaでアノテートしたアブレーション研究を含む。
KOWL-718ベンチマークを使って実験を再現するためのアルゴリズムとしてのこのプロトコルは、https://github.com/prijatelj/ Human-active-recognition-an-open-worldでコードとコンテナとともに公開される。
コードは、Kineticsデータセットのさまざまなアノテーションとサブセットをインクリメンタルなオープンワールドな方法で分析するために使用され、Kineticsのさらなるアップデートがリリースされるにつれて拡張される。
関連論文リスト
- CLAN: A Contrastive Learning based Novelty Detection Framework for Human
Activity Recognition [3.0108863071498035]
CLANは、人間の活動認識のための2段階のコントラスト学習に基づく新規性検出フレームワークである。
それは、時間的および周波数的特徴の重要さを含む、人間の活動特性に関する課題に合わせたものである。
4つの実世界の人間活動データセットの実験により、CLANは既存の新規性検出手法の最高の性能を上回っていることが示された。
論文 参考訳(メタデータ) (2024-01-17T03:57:36Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - Activate and Reject: Towards Safe Domain Generalization under Category
Shift [71.95548187205736]
カテゴリーシフト(DGCS)下における領域一般化の実践的問題について検討する。
未知のクラスサンプルを同時に検出し、ターゲットドメイン内の既知のクラスサンプルを分類することを目的としている。
従来のDGと比較すると,1)ソースクラスのみを用いたトレーニングにおいて,未知の概念を学習する方法,2)ソーストレーニングされたモデルを未知の環境に適応する方法,の2つの新しい課題に直面している。
論文 参考訳(メタデータ) (2023-10-07T07:53:12Z) - Event-based Simultaneous Localization and Mapping: A Comprehensive Survey [52.73728442921428]
ローカライゼーションとマッピングタスクのための非同期および不規則なイベントストリームの利点を利用する、イベントベースのvSLAMアルゴリズムのレビュー。
Paperは、イベントベースのvSLAMメソッドを、特徴ベース、ダイレクト、モーション補償、ディープラーニングの4つのカテゴリに分類する。
論文 参考訳(メタデータ) (2023-04-19T16:21:14Z) - Taming Contrast Maximization for Learning Sequential, Low-latency,
Event-based Optical Flow [18.335337530059867]
イベントカメラは、複雑なコンピュータビジョン問題に対する低レイテンシで低消費電力のソリューションのための新しい道を開くことで、大きな注目を集めている。
これらのソリューションをアンロックするには、イベントデータのユニークな性質を活用するアルゴリズムを開発する必要がある。
本研究では,イベントベース光フロー推定のための自己教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2023-03-09T12:37:33Z) - Multimodal Generation of Novel Action Appearances for Synthetic-to-Real
Recognition of Activities of Daily Living [25.04517296731092]
外見の変化のようなドメインシフトは、アクティビティ認識モデルの現実的な応用において重要な課題である。
本稿では,既存の活動モダリティから新たなADLの出現を生成するアクティビティドメイン生成フレームワークを提案する。
本フレームワークは,人間のポーズ,体継手のヒートマップ,光フローマップを計算し,元のRGBビデオと併用してソースドメインの本質を学習する。
論文 参考訳(メタデータ) (2022-08-03T08:28:33Z) - NovelCraft: A Dataset for Novelty Detection and Discovery in Open Worlds [14.265615838391703]
NovelCraftデータセットには、修正されたMinecraft環境内のpogoスティックアセンブリタスクを完了したエージェントが見るイメージと象徴的な世界状態のエピソードデータが含まれている。
我々のビジュアルノベルティ検出ベンチマークは、一般的な領域内測定値で最上位の手法は、より単純な代替手段により性能が向上する可能性があることを見出した。
さらにマルチモーダルなノベルティ検出実験により、視覚情報とシンボル情報を融合する手法は、検出までの時間と全体的な識別を改善することが示唆された。
論文 参考訳(メタデータ) (2022-06-23T14:31:33Z) - Exploring the Open World Using Incremental Extreme Value Machines [11.3660790934494]
オープンワールド認識は、私たちの知る限りでは、いくつかの方法によってのみ対処される、要求の多いタスクです。
この研究は、広く知られているExtreme Value Machineの修正を導入し、オープンワールドの認識を可能にした。
提案手法は,画像分類と顔認識のタスクにおいて,約12%の精度と計算効率を向上する。
論文 参考訳(メタデータ) (2022-05-30T07:21:13Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - Learn to cycle: Time-consistent feature discovery for action recognition [83.43682368129072]
時間的変動を一般化することは、ビデオにおける効果的な行動認識の前提条件である。
Squeeze Re Temporal Gates (SRTG) を導入する。
SRTPGブロックを使用する場合,GFLOの数は最小限に抑えられ,一貫した改善が見られた。
論文 参考訳(メタデータ) (2020-06-15T09:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。