論文の概要: Imputation of Longitudinal Data Using GANs: Challenges and Implications for Classification
- arxiv url: http://arxiv.org/abs/2506.18007v1
- Date: Sun, 22 Jun 2025 12:09:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.693305
- Title: Imputation of Longitudinal Data Using GANs: Challenges and Implications for Classification
- Title(参考訳): GANを用いた縦断データの計算--分類の課題と意義
- Authors: Sharon Torao Pingi, Md Abul Bashar, Richi Nayak,
- Abstract要約: 本稿では,GAN(Generative Adrial Networks)が縦断データ分類(LDC)にどのように適用されたのかを概観する。
GANに基づくLDIの主なアプローチの分類を提案し、手法の強みと限界を強調し、主要な研究動向を特定し、将来有望な方向性を提供する。
GANは,LDCのようなタスクにおける長手データの利用性や品質を向上させる上で大きな可能性を秘めているものの,長手データと欠落した値の幅広い課題に対処できる,より汎用的なアプローチの必要性が示唆された。
- 参考スコア(独自算出の注目度): 0.6827423171182153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Longitudinal data is commonly utilised across various domains, such as health, biomedical, education and survey studies. This ubiquity has led to a rise in statistical, machine and deep learning-based methods for Longitudinal Data Classification (LDC). However, the intricate nature of the data, characterised by its multi-dimensionality, causes instance-level heterogeneity and temporal correlations that add to the complexity of longitudinal data analysis. Additionally, LDC accuracy is often hampered by the pervasiveness of missing values in longitudinal data. Despite ongoing research that draw on the generative power and utility of Generative Adversarial Networks (GANs) to address the missing data problem, critical considerations include statistical assumptions surrounding longitudinal data and missingness within it, as well as other data-level challenges like class imbalance and mixed data types that impact longitudinal data imputation (LDI) and the subsequent LDC process in GANs. This paper provides a comprehensive overview of how GANs have been applied in LDI, with a focus whether GANS have adequately addressed fundamental assumptions about the data from a LDC perspective. We propose a categorisation of main approaches to GAN-based LDI, highlight strengths and limitations of methods, identify key research trends, and provide promising future directions. Our findings indicate that while GANs show great potential for LDI to improve usability and quality of longitudinal data for tasks like LDC, there is need for more versatile approaches that can handle the wider spectrum of challenges presented by longitudinal data with missing values. By synthesising current knowledge and identifying critical research gaps, this survey aims to guide future research efforts in developing more effective GAN-based solutions to address LDC challenges.
- Abstract(参考訳): 縦断データは、健康、生物医学、教育、調査研究など、様々な領域で一般的に利用されている。
このユビキティは、時間的データ分類(LDC)の統計的、機械的、そしてディープラーニングに基づく手法の台頭につながっている。
しかし、その多次元性によって特徴づけられるデータの複雑な性質は、時系列データ解析の複雑さを増すような、インスタンスレベルの不均一性と時間的相関を引き起こす。
さらに、LCCの精度は、長手データの欠落値の広範性によって妨げられることが多い。
データ不足問題に対処するためのGAN(Generative Adversarial Networks)の生成力と有用性に関する継続的な研究にもかかわらず、批判的な考察には、長手データを取り巻く統計的仮定や、その内部の欠如、および、長手データ計算(LDI)に影響を及ぼすクラス不均衡や混合データタイプなど、その他のデータレベルの課題が含まれる。
本稿では, GANS が LDC の観点からデータに関する基本的な前提を適切に解決したかどうかに着目し, GANS が LDI に適用された経緯を概観する。
GANに基づくLDIの主なアプローチの分類を提案し、手法の強みと限界を強調し、主要な研究動向を特定し、将来有望な方向性を提供する。
GANは,LDCのようなタスクにおける長手データの利用性や品質を向上させる上で大きな可能性を秘めているものの,長手データと欠落した値の幅広い課題に対処できる,より汎用的なアプローチの必要性が示唆された。
本調査は,現在の知識を合成し,重要な研究ギャップを同定することにより,LCDの課題に対処するより効果的なGANベースのソリューション開発に向けた今後の研究の取り組みを導くことを目的とする。
関連論文リスト
- Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - A Survey on Unlearnable Data [27.329292606400685]
Unlearnable Data(ULD)は、機械学習モデルが特定のデータから意味のあるパターンを学ぶのを防ぐ革新的な防御技術として登場した。
我々は、異なるUDLアプローチを比較し、比較し、その強み、制限、および非学習性、不受容性、効率、堅牢性に関連するトレードオフを分析します。
本稿では, モデル劣化に伴う摂動不感のバランスや, ULD生成の計算複雑性など, 重要な課題について論じる。
論文 参考訳(メタデータ) (2025-03-30T17:41:30Z) - Leveraging Language Models for Analyzing Longitudinal Experiential Data in Education [0.8026406775824594]
本研究では,STEM学生の学術的軌跡の早期予測に事前学習言語モデル(LM)を活用する新しい手法を提案する。
このようなデータを扱う上で重要な課題は、欠落した値の高頻度、コストのかかるデータ収集によるデータセットサイズ制限、モダリティ間の複雑な時間的変動である。
論文 参考訳(メタデータ) (2025-03-27T15:37:23Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - A Survey on Data Synthesis and Augmentation for Large Language Models [35.59526251210408]
本稿では,大規模言語モデルのライフサイクルを通じてデータ生成手法をレビューし,要約する。
これらの手法が直面する現在の制約について考察し,今後の開発・研究の道筋について考察する。
論文 参考訳(メタデータ) (2024-10-16T16:12:39Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Discovery of the Hidden World with Large Language Models [95.58823685009727]
本稿では,大きな言語モデル(LLM)を導入してギャップを埋めるCausal representatiOn AssistanT(COAT)を提案する。
LLMは世界中の大規模な観測に基づいて訓練されており、構造化されていないデータから重要な情報を抽出する優れた能力を示している。
COATはまた、特定変数間の因果関係を見つけるためにCDを採用し、提案された要因を反復的に洗練するためにLSMにフィードバックを提供する。
論文 参考訳(メタデータ) (2024-02-06T12:18:54Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - Towards Handling Uncertainty-at-Source in AI -- A Review and Next Steps
for Interval Regression [6.166295570030645]
本稿では,近年の成長領域である区間値データの線形回帰に着目した。
我々は,最先端手法の詳細な分析を行い,特性の異なるデータセットに適用した場合の動作,利点,落とし穴を明らかにする。
論文 参考訳(メタデータ) (2021-04-15T05:31:10Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。