Fugu-MT 論文翻訳(概要): Synthetic Data: Opening the data floodgates to enable faster, more directed development of machine learning methods

論文の概要: Synthetic Data: Opening the data floodgates to enable faster, more directed development of machine learning methods

arxiv url: http://arxiv.org/abs/2012.04580v1
Date: Tue, 8 Dec 2020 17:26:10 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-16 20:50:34.376040
Title: Synthetic Data: Opening the data floodgates to enable faster, more directed development of machine learning methods
Title（参考訳）: 合成データ: より高速でより有向な機械学習手法の開発を可能にするデータフラッドゲートのオープン
Authors: James Jordon, Alan Wilson and Mihaela van der Schaar
Abstract要約: 機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
参考スコア（独自算出の注目度）: 96.92041573661407
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Many ground-breaking advancements in machine learning can be attributed to the availability of a large volume of rich data. Unfortunately, many large-scale datasets are highly sensitive, such as healthcare data, and are not widely available to the machine learning community. Generating synthetic data with privacy guarantees provides one such solution, allowing meaningful research to be carried out "at scale" - by allowing the entirety of the machine learning community to potentially accelerate progress within a given field. In this article, we provide a high-level view of synthetic data: what it means, how we might evaluate it and how we might use it.
Abstract（参考訳）: 機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。残念ながら、多くの大規模データセットは、医療データなど非常に敏感であり、機械学習コミュニティでは広く利用できない。プライバシ保証による合成データの生成は、そのようなソリューションのひとつを提供し、マシンラーニングコミュニティ全体が特定の分野の進捗を加速させることで、有意義な調査を"大規模"に実施可能にする。この記事では、合成データの高レベルなビューを提供する。それは何を意味するのか、どのように評価するか、どのように使用するのか。

関連論文リスト

Spatial Knowledge Graph-Guided Multimodal Synthesis [78.11669780958657]
本稿では,空間知識グラフによって導かれる新しいマルチモーダル合成手法を提案する。実験では、方向や距離を含む多様な空間知識から合成されたデータにより、MLLMの空間知覚と推論能力が著しく向上する。知識に基づくデータ合成のアイデアが空間知性の発展を促進することを願っている。
論文参考訳（メタデータ） (2025-05-28T17:50:21Z)
Making Sense of Data in the Wild: Data Analysis Automation at Scale [0.1747623282473278]
本稿では,インテリジェントエージェントと検索拡張生成を組み合わせることで,データ解析,データセットキュレーション,インデックス作成を大規模に自動化する手法を提案する。提案手法により,より詳細なデータセット記述,より高いヒット率,データセット検索タスクの多様性が得られた。
論文参考訳（メタデータ） (2025-01-27T10:04:10Z)
A spectrum of physics-informed Gaussian processes for regression in engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文参考訳（メタデータ） (2023-09-19T14:39:03Z)
Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文参考訳（メタデータ） (2023-04-07T16:38:40Z)
A Vision for Semantically Enriched Data Science [19.604667287258724]
ドメイン知識の活用やデータセマンティクスといった重要な分野は、ほとんど自動化されていない分野です。データサイエンスの自動化のための新しいツールと組み合わせて、データに対する“セマンティック”な理解と推論を活用することが、一貫性と説明可能なデータ拡張と変換にどのように役立つか、私たちは考えています。
論文参考訳（メタデータ） (2023-03-02T16:03:12Z)
Machine Learning for Synthetic Data Generation: A Review [23.073056971997715]
本稿では,合成データの生成を目的とした機械学習モデルを用いた既存研究についてレビューする。このレビューは、合成データ生成、コンピュータビジョン、スピーチ、自然言語処理、ヘルスケア、ビジネスドメインの応用から始まる様々な視点を網羅している。この論文は、合成データ生成に関するプライバシーと公平性に関する重要な側面についても論じている。
論文参考訳（メタデータ） (2023-02-08T13:59:31Z)
A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。ディープラーニング技術はこの10年で前例のない発展を遂げた。本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文参考訳（メタデータ） (2023-01-13T15:11:38Z)
TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文参考訳（メタデータ） (2022-08-16T20:46:08Z)
Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文参考訳（メタデータ） (2021-10-24T22:33:52Z)
Auto-encoder based Model for High-dimensional Imbalanced Industrial Data [6.339700878842761]
分散重み付きマルチヘッドオートエンコーダ分類モデルを導入し,高次元および高不均衡なデータによく適合する。また、出力制御された表現学習とマルチタスク重み付けを利用して、複数の出力を同時に予測する。
論文参考訳（メタデータ） (2021-08-04T14:34:59Z)
Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文参考訳（メタデータ） (2020-12-15T20:41:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。