論文の概要: A context model for collecting diversity-aware data
- arxiv url: http://arxiv.org/abs/2306.09753v1
- Date: Fri, 16 Jun 2023 10:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 14:09:17.375217
- Title: A context model for collecting diversity-aware data
- Title(参考訳): 多様性を考慮したデータ収集のためのコンテキストモデル
- Authors: Matteo Busso and Xiaoyue Li
- Abstract要約: データセットには158人の参加者のサンプルがあり、iLogスマートフォンアプリケーション経由で収集される。
主観的および客観的なデータは170GBを超えており、27個のスマートフォンセンサーから取得されている。
データセットは、多種多様なアプリケーションで示されるように、非常に再利用性が高い。
- 参考スコア(独自算出の注目度): 2.1701691499017812
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diversity-aware data are essential for a robust modeling of human behavior in
context. In addition, being the human behavior of interest for numerous
applications, data must also be reusable across domain, to ensure diversity of
interpretations. Current data collection techniques allow only a partial
representation of the diversity of people and often generate data that is
difficult to reuse. To fill this gap, we propose a data collection methodology,
within a hybrid machine-artificial intelligence approach, and its related
dataset, based on a comprehensive ontological notion of context which enables
data reusability. The dataset has a sample of 158 participants and is collected
via the iLog smartphone application. It contains more than 170 GB of subjective
and objective data, which comes from 27 smartphone sensors that are associated
with 168,095 self-reported annotations on the participants context. The dataset
is highly reusable, as demonstrated by its diverse applications.
- Abstract(参考訳): 多様性を意識したデータは、コンテキストにおける人間の行動の堅牢なモデリングに不可欠である。
加えて、多くのアプリケーションに対する人間の振る舞いとして、データは解釈の多様性を保証するために、ドメイン全体で再利用されなければならない。
現在のデータ収集技術は、人々の多様性の部分的な表現のみを可能にし、再利用が難しいデータを生成することが多い。
このギャップを埋めるため,我々は,データ再利用性を実現する包括的オントロジなコンテキスト概念に基づく,ハイブリッドマシン・人工知能アプローチとその関連データセットを用いたデータ収集手法を提案する。
データセットには158人の参加者のサンプルがあり、iLogスマートフォンアプリケーション経由で収集される。
このデバイスには170GB以上の主観的および客観的なデータが含まれており、27個のスマートフォンセンサーが参加者のコンテキストに168,095個の自己申告されたアノテーションに関連付けられている。
データセットは、さまざまなアプリケーションで示されるように、非常に再利用性が高い。
関連論文リスト
- Flexible inference in heterogeneous and attributed multilayer networks [21.349513661012498]
我々は任意の種類の情報を持つ多層ネットワークで推論を行う確率的生成モデルを開発した。
インド農村部における社会支援ネットワークにおける様々なパターンを明らかにする能力を示す。
論文 参考訳(メタデータ) (2024-05-31T15:21:59Z) - A Comprehensive Survey on Data Augmentation [55.355273602421384]
データ拡張(Data augmentation)は、既存のデータサンプルを操作することによって高品質な人工データを生成する技術である。
既存の文献調査では、特定のモダリティデータにのみ焦点が当てられている。
本稿では,異なる共通データモダリティのためのデータ拡張技術を含む,より啓蒙的な分類法を提案する。
論文 参考訳(メタデータ) (2024-05-15T11:58:08Z) - Weakly Supervised Multi-Task Representation Learning for Human Activity
Analysis Using Wearables [2.398608007786179]
本稿では,データを複数の表現空間にマッピングする方法を学習する,弱教師付きマルチ出力シムネットワークを提案する。
データサンプルの表現は、そのアスペクトで同じ意味を持つデータが互いに密接な位置にあるような空間に配置される。
論文 参考訳(メタデータ) (2023-08-06T08:20:07Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Self-supervised Activity Representation Learning with Incremental Data:
An Empirical Study [7.782045150068569]
本研究では,時系列分類タスクにおける自己教師付き表現学習モデルの利用が及ぼす影響について検討する。
4つの公開データセットにおいて,ラベル付きデータのサイズ,分布,ソースが最終分類性能に与える影響を解析した。
論文 参考訳(メタデータ) (2023-05-01T01:39:55Z) - SGED: A Benchmark dataset for Performance Evaluation of Spiking Gesture
Emotion Recognition [12.396844568607522]
我々は、既存のデータセットの分析に基づいて、新しい同質なマルチモーダルジェスチャー感情認識データセットをラベル付けする。
本稿では,このデータセットに基づく擬似二重フローネットワークを提案し,このデータセットの適用可能性を検証する。
論文 参考訳(メタデータ) (2023-04-28T09:32:09Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Representation Matters: Assessing the Importance of Subgroup Allocations
in Training Data [85.43008636875345]
訓練データにおける多様な表現は,サブグループのパフォーマンス向上と集団レベルの目標達成の鍵である。
分析と実験は、データセット構成がパフォーマンスにどのように影響するかを説明し、既存のデータにおけるトレンドとドメイン知識を用いて、意図的かつ客観的なデータセット設計を導くのに役立つ構成結果を提供する。
論文 参考訳(メタデータ) (2021-03-05T00:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。