論文の概要: Forecasting-Based Biomedical Time-series Data Synthesis for Open Data and Robust AI
- arxiv url: http://arxiv.org/abs/2510.04622v1
- Date: Mon, 06 Oct 2025 09:32:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.775763
- Title: Forecasting-Based Biomedical Time-series Data Synthesis for Open Data and Robust AI
- Title(参考訳): 予測に基づくオープンデータとロバストAIのためのバイオメディカル時系列データ合成
- Authors: Youngjoon Lee, Seongmin Cho, Yehhyun Jo, Jinu Gong, Hyunjoo Jenny Lee, Joonhyuk Kang,
- Abstract要約: 本稿では,先進的な予測モデルに基づく生医学的時系列データ生成のためのフレームワークを提案する。
これらの合成データセットは、実データの本質的時間的およびスペクトル的特性を保存している。
- 参考スコア(独自算出の注目度): 0.841508985473488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The limited data availability due to strict privacy regulations and significant resource demands severely constrains biomedical time-series AI development, which creates a critical gap between data requirements and accessibility. Synthetic data generation presents a promising solution by producing artificial datasets that maintain the statistical properties of real biomedical time-series data without compromising patient confidentiality. We propose a framework for synthetic biomedical time-series data generation based on advanced forecasting models that accurately replicates complex electrophysiological signals such as EEG and EMG with high fidelity. These synthetic datasets preserve essential temporal and spectral properties of real data, which enables robust analysis while effectively addressing data scarcity and privacy challenges. Our evaluations across multiple subjects demonstrate that the generated synthetic data can serve as an effective substitute for real data and also significantly boost AI model performance. The approach maintains critical biomedical features while provides high scalability for various applications and integrates seamlessly into open-source repositories, substantially expanding resources for AI-driven biomedical research.
- Abstract(参考訳): 厳格なプライバシー規制と重要なリソース要求によるデータ可用性の制限は、バイオメディカルな時系列AI開発を厳しく制約する。
合成データ生成は、患者の機密性を損なうことなく、実際の生体医学的時系列データの統計特性を維持する人工データセットを作成することによって、有望なソリューションを提供する。
本稿では,脳波や筋電図などの複雑な電気生理学的信号を高精度に再現する,高度な予測モデルに基づく生医学的時系列データ生成のためのフレームワークを提案する。
これらの合成データセットは、データ不足とプライバシの課題に効果的に対処しながら、ロバストな分析を可能にする、実データの本質的時間的およびスペクトル的特性を保存する。
複数の被験者にまたがって評価を行った結果,生成した合成データが実データに有効な代用となり,AIモデルの性能が著しく向上することが示された。
このアプローチは、重要なバイオメディカル機能を維持しながら、さまざまなアプリケーションに高いスケーラビリティを提供し、オープンソースリポジトリにシームレスに統合し、AI駆動のバイオメディカルリサーチのためのリソースを大幅に拡張する。
関連論文リスト
- Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - Using Imperfect Synthetic Data in Downstream Inference Tasks [50.40949503799331]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を改善することができる。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - A text-to-tabular approach to generate synthetic patient data using LLMs [0.3628457733531155]
そこで本研究では,患者データへのアクセスを必要としない人工的な患者データを生成する手法を提案する。
我々は,大言語モデルの先行医療知識とコンテキスト内学習能力を活用して,現実的な患者データを生成する。
論文 参考訳(メタデータ) (2024-12-06T16:10:40Z) - Synthetic Data in Radiological Imaging: Current State and Future Outlook [3.047958668050099]
放射線学における人工知能(AI)ソリューションの開発と展開の鍵となる課題は、関連するデータ制限を解決することである。
サイリコデータでは、患者の損害の低減、コストの削減、データ取得の簡略化、スケーラビリティ、品質保証テストの改善、データ不均衡に対する緩和アプローチなど、患者のデータに潜在的なメリットがいくつか提供されている。
論文 参考訳(メタデータ) (2024-05-08T18:35:47Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Synthetic data generation for a longitudinal cohort study -- Evaluation,
method extension and reproduction of published data analysis results [0.32593385688760446]
医療分野では、プライバシー上の懸念から個人レベルのデータへのアクセスは困難であることが多い。
有望な代替手段は、完全な合成データの生成である。
本研究では,最先端の合成データ生成手法を用いる。
論文 参考訳(メタデータ) (2023-05-12T13:13:55Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Generating synthetic multi-dimensional molecular-mediator time series
data for artificial intelligence-based disease trajectory forecasting and
drug development digital twins: Considerations [0.0]
合成データの利用は、ニューラルネットワークベースの人工知能(AI)システムの開発における重要なステップとして認識されている。
このタイプの合成データを生成する統計的およびデータ中心の機械学習手段の欠如は、要因の組み合わせによるものである。
多次元時系列データの特定因子を考慮に入れた合成データの生成は、仲介者・バイオマーカーに基づくAI予測システムの開発に欠かせない能力である。
論文 参考訳(メタデータ) (2023-03-16T03:13:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。