論文の概要: Synthetic Data in Human Analysis: A Survey
- arxiv url: http://arxiv.org/abs/2208.09191v1
- Date: Fri, 19 Aug 2022 07:32:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-22 17:05:38.000273
- Title: Synthetic Data in Human Analysis: A Survey
- Title(参考訳): 人間の分析における合成データ:調査
- Authors: Indu Joshi, Marcel Grimmer, Christian Rathgeb, Christoph Busch,
Francois Bremond, Antitza Dantcheva
- Abstract要約: 調査は、人間分析の分野の研究者や実践者を対象としている。
我々は,現在最先端の手法と合成データの利用の主な利点を要約した調査を行う。
また、利用可能な合成データセットと生成モデルの概要も提供する。
- 参考スコア(独自算出の注目度): 16.562921709882865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks have become prevalent in human analysis, boosting the
performance of applications, such as biometric recognition, action recognition,
as well as person re-identification. However, the performance of such networks
scales with the available training data. In human analysis, the demand for
large-scale datasets poses a severe challenge, as data collection is tedious,
time-expensive, costly and must comply with data protection laws. Current
research investigates the generation of \textit{synthetic data} as an efficient
and privacy-ensuring alternative to collecting real data in the field. This
survey introduces the basic definitions and methodologies, essential when
generating and employing synthetic data for human analysis. We conduct a survey
that summarises current state-of-the-art methods and the main benefits of using
synthetic data. We also provide an overview of publicly available synthetic
datasets and generation models. Finally, we discuss limitations, as well as
open research problems in this field. This survey is intended for researchers
and practitioners in the field of human analysis.
- Abstract(参考訳): ディープニューラルネットワークは、人間の分析において普及し、生体認証、行動認識、人物の再識別などのアプリケーションの性能を高めている。
しかし、そのようなネットワークの性能は、利用可能なトレーニングデータと共にスケールする。
人間の分析では、データ収集は退屈で時間のかかる、費用がかかり、データ保護法に従わなければならないため、大規模なデータセットの需要は厳しい課題となる。
現在の研究は、現場で実データを集めるための効率的でプライバシーを侵害する代替手段として、 \textit{synthetic data} の生成を調査している。
本研究は,人間分析のための合成データの生成と活用に不可欠な基本的定義と方法論を紹介する。
我々は,現在最先端の手法と合成データの利用の主な利点を要約した調査を行う。
また、利用可能な合成データセットと生成モデルの概観も提供する。
最後に、この分野でのオープンな研究課題と同様に、制限についても論じる。
この調査は、人間分析の分野の研究者や実践者を対象としている。
関連論文リスト
- Exploring the Impact of Synthetic Data for Aerial-view Human Detection [17.41001388151408]
航空ビューによる人間の検出は、より多様な人間の外観を捉えるために、大規模なデータに対する大きな需要がある。
合成データはデータを拡張するのに十分なリソースだが、実際のデータとのドメインギャップは、トレーニングで使用する上で最大の障害である。
論文 参考訳(メタデータ) (2024-05-24T04:19:48Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - The Real Deal Behind the Artificial Appeal: Inferential Utility of Tabular Synthetic Data [40.165159490379146]
評価値が不偏であっても, 偽陽性の発見率(タイプ1の誤り)は不可避的に高いことが示唆された。
以前提案された補正係数が使用されているにもかかわらず、この問題は深層生成モデルに対して持続する。
論文 参考訳(メタデータ) (2023-12-13T02:04:41Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Exploring the Potential of AI-Generated Synthetic Datasets: A Case Study
on Telematics Data with ChatGPT [0.0]
この研究は、OpenAIの強力な言語モデルであるChatGPTを活用して、特にテレマティクス分野における合成データセットの構築と利用に力を入れている。
このデータ作成プロセスを説明するために、合成テレマティクスデータセットの生成に焦点を当てたハンズオンケーススタディが実施されている。
論文 参考訳(メタデータ) (2023-06-23T15:15:13Z) - Synthetic data generation for a longitudinal cohort study -- Evaluation,
method extension and reproduction of published data analysis results [0.32593385688760446]
医療分野では、プライバシー上の懸念から個人レベルのデータへのアクセスは困難であることが多い。
有望な代替手段は、完全な合成データの生成である。
本研究では,最先端の合成データ生成手法を用いる。
論文 参考訳(メタデータ) (2023-05-12T13:13:55Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Measuring Utility and Privacy of Synthetic Genomic Data [3.635321290763711]
人工ゲノムデータを生成するための5つの最先端モデルの実用性とプライバシ保護を最初に評価する。
全体として、ボード全体でうまく機能する合成ゲノムデータを生成するための単一のアプローチは存在しない。
論文 参考訳(メタデータ) (2021-02-05T17:41:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。