論文の概要: ETRI-Activity3D: A Large-Scale RGB-D Dataset for Robots to Recognize
Daily Activities of the Elderly
- arxiv url: http://arxiv.org/abs/2003.01920v2
- Date: Wed, 11 Mar 2020 05:01:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 13:36:09.825443
- Title: ETRI-Activity3D: A Large-Scale RGB-D Dataset for Robots to Recognize
Daily Activities of the Elderly
- Title(参考訳): ETRI-Activity3D:高齢者の日常活動を認識するロボットのための大規模RGB-Dデータセット
- Authors: Jinhyeok Jang, Dohyung Kim, Cheonshu Park, Minsu Jang, Jaeyeon Lee,
Jaehong Kim
- Abstract要約: ETRI-Activity3Dと呼ばれる新しいデータセットを導入し,ロボットビューにおける高齢者の日常活動に着目した。
提案したデータセットには、RGBビデオ、深さマップ、骨格配列を含む112,620のサンプルが含まれている。
また,4ストリーム適応CNN(FSA-CNN)と呼ばれる新しいネットワークを提案する。
- 参考スコア(独自算出の注目度): 6.597705088139007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning, based on which many modern algorithms operate, is well known
to be data-hungry. In particular, the datasets appropriate for the intended
application are difficult to obtain. To cope with this situation, we introduce
a new dataset called ETRI-Activity3D, focusing on the daily activities of the
elderly in robot-view. The major characteristics of the new dataset are as
follows: 1) practical action categories that are selected from the close
observation of the daily lives of the elderly; 2) realistic data collection,
which reflects the robot's working environment and service situations; and 3) a
large-scale dataset that overcomes the limitations of the current 3D activity
analysis benchmark datasets. The proposed dataset contains 112,620 samples
including RGB videos, depth maps, and skeleton sequences. During the data
acquisition, 100 subjects were asked to perform 55 daily activities.
Additionally, we propose a novel network called four-stream adaptive CNN
(FSA-CNN). The proposed FSA-CNN has three main properties: robustness to
spatio-temporal variations, input-adaptive activation function, and extension
of the conventional two-stream approach. In the experiment section, we
confirmed the superiority of the proposed FSA-CNN using NTU RGB+D and
ETRI-Activity3D. Further, the domain difference between both groups of age was
verified experimentally. Finally, the extension of FSA-CNN to deal with the
multimodal data was investigated.
- Abstract(参考訳): ディープラーニングは、多くの現代的なアルゴリズムに基づいており、データハングリーとして知られている。
特に、対象とするアプリケーションに適したデータセットを得るのが困難である。
この状況に対処するため,ロボットビューにおける高齢者の日常活動に着目したETRI-Activity3Dという新しいデータセットを導入する。
新しいデータセットの主な特徴は次のとおりである。
1)高齢者の日常生活の密接な観察から選択された実践的行動カテゴリー
2) ロボットの作業環境やサービス状況を反映した現実的なデータ収集
3) 現在の3Dアクティビティ分析ベンチマークデータセットの限界を克服する大規模なデータセット。
提案したデータセットには、RGBビデオ、深さマップ、骨格配列を含む112,620のサンプルが含まれている。
データ取得中、100名の被験者に55の日常活動の実施を依頼した。
さらに,4ストリーム適応CNN(FSA-CNN)と呼ばれる新しいネットワークを提案する。
提案するFSA-CNNは,時空間変動に対するロバスト性,入力適応型アクティベーション関数,従来の2ストリームアプローチの拡張の3つの特性を持つ。
実験では,NTU RGB+D と ETRI-Activity3D を用いて提案した FSA-CNN の優位性を確認した。
さらに,両年齢群間のドメイン差を実験的に検証した。
最後に,マルチモーダルデータを扱うためのFSA-CNNの拡張について検討した。
関連論文リスト
- Dynamic Data Pruning for Automatic Speech Recognition [58.95758272440217]
ASR(DDP-ASR)のダイナミック・データ・プルーニング(Dynamic Data Pruning for ASR)を導入し,音声関連データセットに特化して微細なプルーニングの粒度を提供する。
実験の結果,DDP-ASRは最大1.6倍のトレーニング時間を節約できることがわかった。
論文 参考訳(メタデータ) (2024-06-26T14:17:36Z) - ActiveAnno3D -- An Active Learning Framework for Multi-Modal 3D Object
Detection [15.885344033374393]
ラベル付けのためのデータサンプルを選択するためのアクティブラーニングフレームワークであるActiveAnno3Dを提案する。
我々は nuScenes と TUM Traffic Intersection データセット上で BEVFusion と PV-RCNN を用いて実験およびアブレーション研究を行った。
アクティブな学習フレームワークをproAnnoラベリングツールに統合し、AIによるデータ選択とラベリングを可能にします。
論文 参考訳(メタデータ) (2024-02-05T17:52:58Z) - Towards More Practical Group Activity Detection: A New Benchmark and Model [61.39427407758131]
グループアクティビティ検出(グループアクティビティ検出、英: Group Activity Detection、GAD)は、ビデオにおいて、各グループのメンバを特定し、同時にグループのアクティビティを分類するタスクである。
私たちはCaf'eと呼ばれる新しいデータセットを提示し、より実用的なシナリオとメトリクスを提示します。
また、未知数のグループと潜在グループメンバーを効率的に効率的に扱う新しいGADモデルを提案する。
論文 参考訳(メタデータ) (2023-12-05T16:48:17Z) - Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。
我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。
我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文 参考訳(メタデータ) (2023-07-28T16:03:28Z) - TADIL: Task-Agnostic Domain-Incremental Learning through Task-ID
Inference using Transformer Nearest-Centroid Embeddings [0.0]
ドメイン・インクリメンタル・ラーニングのシナリオにおいて,教師なしのタスクを識別するための新しいパイプラインを提案する。
我々は、パイプラインの軽量な計算要求を活用して、新しいタスクをいつ学習するかをオンラインで決定するアルゴリズムを考案する。
論文 参考訳(メタデータ) (2023-06-21T00:55:02Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Feature Extraction for Machine Learning-based Intrusion Detection in IoT
Networks [6.6147550436077776]
本稿では, 特徴量削減 (FR) と機械学習 (ML) の手法が, 様々なデータセットにまたがって一般化できるかどうかを明らかにすることを目的とする。
主成分分析(PCA)、自動エンコーダ(AE)、線形識別分析(LDA)の3つの特徴抽出(FE)アルゴリズムの検出精度を評価する。
論文 参考訳(メタデータ) (2021-08-28T23:52:18Z) - Diminishing Uncertainty within the Training Pool: Active Learning for
Medical Image Segmentation [6.3858225352615285]
医用画像データセットのセグメンテーション作業におけるアクティブラーニングについて検討する。
トレーニングデータセットをバイアスする不確実データの頻度の増大、入力画像間の相互情報を正規化として利用すること、およびスタイン変動勾配降下(SVGD)のためのダイスログの類似性(Dice log-likelihood)の適応という3つの新しいアクティブ学習戦略を提案する。
その結果、データセット毎に利用可能なデータの22.69 %と48.85 %をそれぞれ使用しながら、完全な精度を達成することで、データ削減の観点での改善が示された。
論文 参考訳(メタデータ) (2021-01-07T01:55:48Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。