論文の概要: Synthcity: facilitating innovative use cases of synthetic data in
different data modalities
- arxiv url: http://arxiv.org/abs/2301.07573v1
- Date: Wed, 18 Jan 2023 14:49:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-19 15:32:14.977966
- Title: Synthcity: facilitating innovative use cases of synthetic data in
different data modalities
- Title(参考訳): Synthcity: 異なるデータモダリティにおける合成データの革新的利用を促進する
- Authors: Zhaozhi Qian, Bogdan-Constantin Cebere, Mihaela van der Schaar
- Abstract要約: Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
- 参考スコア(独自算出の注目度): 86.52703093858631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthcity is an open-source software package for innovative use cases of
synthetic data in ML fairness, privacy and augmentation across diverse tabular
data modalities, including static data, regular and irregular time series, data
with censoring, multi-source data, composite data, and more. Synthcity provides
the practitioners with a single access point to cutting edge research and tools
in synthetic data. It also offers the community a playground for rapid
experimentation and prototyping, a one-stop-shop for SOTA benchmarks, and an
opportunity for extending research impact. The library can be accessed on
GitHub (https://github.com/vanderschaarlab/synthcity) and pip
(https://pypi.org/project/synthcity/). We warmly invite the community to join
the development effort by providing feedback, reporting bugs, and contributing
code.
- Abstract(参考訳): Synthcityは、静的データ、正規および不規則な時系列、検閲付きデータ、マルチソースデータ、複合データなど、さまざまな表データモダリティにまたがるMLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのためのオープンソースソフトウェアパッケージである。
Synthcityは、人工データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
また、コミュニティに迅速な実験とプロトタイピングの場、SOTAベンチマークのワンストップショップ、そして研究効果を拡大する機会を提供する。
ライブラリはgithub(https://github.com/vanderschaarlab/synthcity)とpip(https://pypi.org/project/synthcity/)からアクセスできる。
フィードバックを提供し、バグを報告し、コードをコントリビュートすることで、コミュニティを温かく開発活動に参加させます。
関連論文リスト
- Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Statistical Keystroke Synthesis for Improved Bot Detection [63.447493500066045]
本研究はキーストローク生体データ合成のための2つの統計的アプローチを提案する。
実験には168,000人の被験者から1億3600万件のキーストロークイベントのデータセットが含まれている。
その結果,提案手法により,リアルなヒト様合成キーストロークのサンプルを生成できることがわかった。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - TabSynDex: A Universal Metric for Robust Evaluation of Synthetic Tabular
Data [11.567919812777713]
合成データのロバストな評価のための新しい普遍計量TabSynDexを提案する。
シングルスコアメトリックであるTabSynDexは、ニューラルネットワークベースのアプローチのトレーニングを観察および評価するためにも使用できる。
論文 参考訳(メタデータ) (2022-07-12T04:08:11Z) - Enabling Synthetic Data adoption in regulated domains [1.9512796489908306]
Model-CentricからData-Centricへの転換は、アルゴリズムよりもデータとその品質に重点を置いている。
特に、高度に規制されたシナリオにおける情報のセンシティブな性質を考慮する必要がある。
このようなコンウンドラムをバイパスする巧妙な方法は、生成プロセスから得られたデータであるSynthetic Dataに依存し、実際のデータプロパティを学習する。
論文 参考訳(メタデータ) (2022-04-13T10:53:54Z) - FedSyn: Synthetic Data Generation using Federated Learning [0.0]
現在の機械学習のプラクティスは、既存のデータセットから合成データを生成するために利用することができる。
データプライバシは、一部の機関が満足できないかもしれないことを懸念している。
本稿では,合成データを生成する新しい手法であるFedSynを提案する。
論文 参考訳(メタデータ) (2022-03-11T14:05:37Z) - Less is More: Learning from Synthetic Data with Fine-grained Attributes
for Person Re-Identification [16.107661617441327]
人物の再識別(re-ID)は、公共のセキュリティやビデオ監視などのアプリケーションにおいて重要な役割を果たす。
近年、合成データから学ぶことは、学術と公衆の目の両方から注目を集めている。
我々は,微粒な属性分布を持つファインGPRという大規模合成人データセットを構築し,ラベル付けする。
論文 参考訳(メタデータ) (2021-09-22T03:12:32Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。
ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文 参考訳(メタデータ) (2020-11-16T21:49:17Z) - Shape of synth to come: Why we should use synthetic data for English
surface realization [72.62356061765976]
2018年の共有タスクでは、追加で合成されたデータを使用してトレーニングされたシステムの絶対的なパフォーマンスにはほとんど差がなかった。
我々は、2018年の英語データセットの実験において、合成データの使用はかなりの効果があることを示した。
我々は、こうしたデータを活用するシステムについて、今後の研究努力が引き続き探求されるよう、禁止されるのではなく、その使用を奨励すべきであると主張している。
論文 参考訳(メタデータ) (2020-05-06T10:00:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。