論文の概要: Synthetic data: How could it be used for infectious disease research?
- arxiv url: http://arxiv.org/abs/2407.06211v1
- Date: Wed, 3 Jul 2024 17:13:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-10 22:32:40.854558
- Title: Synthetic data: How could it be used for infectious disease research?
- Title(参考訳): 合成データ:伝染病研究にどのように使用できるか?
- Authors: Styliani-Christina Fragkouli, Dhwani Solanki, Leyla J Castro, Fotis E Psomopoulos, Núria Queralt-Rosinach, Davide Cirillo, Lisa C Crossman,
- Abstract要約: 人工データセット生成の可能性に関連する潜在的な負の要因について懸念が高まっている。
これには、サイバー犯罪のような分野における生成的人工知能の潜在的な誤用が含まれる。
合成データは、特にデータプライバシ、研究、データセットのバランシングと機械学習モデルのバイアス低減において、大きなメリットを提供する。
- 参考スコア(独自算出の注目度): 0.16752458252726457
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the last three to five years, it has become possible to generate machine learning synthetic data for healthcare-related uses. However, concerns have been raised about potential negative factors associated with the possibilities of artificial dataset generation. These include the potential misuse of generative artificial intelligence (AI) in fields such as cybercrime, the use of deepfakes and fake news to deceive or manipulate, and displacement of human jobs across various market sectors. Here, we consider both current and future positive advances and possibilities with synthetic datasets. Synthetic data offers significant benefits, particularly in data privacy, research, in balancing datasets and reducing bias in machine learning models. Generative AI is an artificial intelligence genre capable of creating text, images, video or other data using generative models. The recent explosion of interest in GenAI was heralded by the invention and speedy move to use of large language models (LLM). These computational models are able to achieve general-purpose language generation and other natural language processing tasks and are based on transformer architectures, which made an evolutionary leap from previous neural network architectures. Fuelled by the advent of improved GenAI techniques and wide scale usage, this is surely the time to consider how synthetic data can be used to advance infectious disease research. In this commentary we aim to create an overview of the current and future position of synthetic data in infectious disease research.
- Abstract(参考訳): 過去3~5年間で、医療関連用途のために機械学習合成データを生成することが可能になった。
しかし、人工データセット生成の可能性に関連する潜在的な負の要因について懸念が高まっている。
これには、サイバー犯罪のような分野における生成的人工知能(AI)の潜在的誤用、ディープフェイクとフェイクニュースの使用による騙しや操作、および様々な市場セクターにおける人間の仕事の移動が含まれる。
ここでは、合成データセットの現在および将来的な進歩と可能性について考察する。
合成データは、特にデータプライバシ、研究、データセットのバランシングと機械学習モデルのバイアス低減において、大きなメリットを提供する。
生成AI(Generative AI)は、生成モデルを用いてテキスト、画像、ビデオ、その他のデータを作成することができる人工知能のジャンルである。
最近のGenAIへの関心の爆発は、大型言語モデル(LLM)の使用への発明と迅速な動きに支えられた。
これらの計算モデルは汎用言語生成やその他の自然言語処理タスクを達成することができ、トランスフォーマーアーキテクチャに基づいており、従来のニューラルネットワークアーキテクチャから進化的な飛躍を遂げた。
改良されたGenAI技術と大規模利用の出現により、今こそ感染症研究の進展に人工データをどのように活用できるかを考える時だ。
本解説では,感染症研究における合成データの現状と今後の動向について概説する。
関連論文リスト
- When AI Eats Itself: On the Caveats of AI Autophagy [18.641925577551557]
AIオートファジー現象は、生成的AIシステムが認識せずに自分たちのアウトプットを消費する未来を示唆している。
本研究では、既存の文献を調査し、AIオートファジーの結果を掘り下げ、関連するリスクを分析し、その影響を軽減するための戦略を探求する。
論文 参考訳(メタデータ) (2024-05-15T13:50:23Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - Synthetic Demographic Data Generation for Card Fraud Detection Using
GANs [4.651915393462367]
我々は、人口統計データ生成に使用されるDGGANと呼ばれるディープラーニングジェネレーティブ・アドバイサル・ネットワーク(GAN)を構築している。
本モデルでは,モデルトレーニング中にサンプルを生成し,クラス不均衡問題を克服することの重要性を見出した。
論文 参考訳(メタデータ) (2023-06-29T17:08:57Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Synthetic Data in Healthcare [10.555189948915492]
本稿では,データ作成のための物理・統計シミュレーションの事例と医療・医療への応用について述べる。
人工物は、プライバシ、エクイティ、安全性、継続的な、因果学習を促進することができるが、欠陥や盲点を導入し、バイアスを伝播または誇張するリスクも負う。
論文 参考訳(メタデータ) (2023-04-06T17:23:39Z) - Machine Learning for Synthetic Data Generation: A Review [23.073056971997715]
本稿では,合成データの生成を目的とした機械学習モデルを用いた既存研究についてレビューする。
このレビューは、合成データ生成、コンピュータビジョン、スピーチ、自然言語処理、ヘルスケア、ビジネスドメインの応用から始まる様々な視点を網羅している。
この論文は、合成データ生成に関するプライバシーと公平性に関する重要な側面についても論じている。
論文 参考訳(メタデータ) (2023-02-08T13:59:31Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。