論文の概要: Causal-Aware Generative Adversarial Networks with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2510.24046v1
- Date: Tue, 28 Oct 2025 04:02:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.749807
- Title: Causal-Aware Generative Adversarial Networks with Reinforcement Learning
- Title(参考訳): 強化学習を用いた因果認識型生成対向ネットワーク
- Authors: Tu Anh Hoang Nguyen, Dang Nguyen, Tri-Nhan Vo, Thuc Duy Le, Sunil Gupta,
- Abstract要約: 実世界のデータセットに対するこれらの課題に対処するために特別に設計された新しい生成フレームワークであるCA-GANを紹介する。
提案手法は,高品質でプライバシに適合した合成データセットを作成しようとするデータエンジニアに対して,実用的な高性能なソリューションを提供する。
- 参考スコア(独自算出の注目度): 17.222261383589732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The utility of tabular data for tasks ranging from model training to large-scale data analysis is often constrained by privacy concerns or regulatory hurdles. While existing data generation methods, particularly those based on Generative Adversarial Networks (GANs), have shown promise, they frequently struggle with capturing complex causal relationship, maintaining data utility, and providing provable privacy guarantees suitable for enterprise deployment. We introduce CA-GAN, a novel generative framework specifically engineered to address these challenges for real-world tabular datasets. CA-GAN utilizes a two-step approach: causal graph extraction to learn a robust, comprehensive causal relationship in the data's manifold, followed by a custom Conditional WGAN-GP (Wasserstein GAN with Gradient Penalty) that operates exclusively as per the structure of nodes in the causal graph. More importantly, the generator is trained with a new Reinforcement Learning-based objective that aligns the causal graphs constructed from real and fake data, ensuring the causal awareness in both training and sampling phases. We demonstrate CA-GAN superiority over six SOTA methods across 14 tabular datasets. Our evaluations, focused on core data engineering metrics: causal preservation, utility preservation, and privacy preservation. Our method offers a practical, high-performance solution for data engineers seeking to create high-quality, privacy-compliant synthetic datasets to benchmark database systems, accelerate software development, and facilitate secure data-driven research.
- Abstract(参考訳): モデルトレーニングから大規模データ分析まで、タスクのための表形式のデータの有用性は、プライバシの懸念や規制上のハードルによって制約されることが多い。
既存のデータ生成手法、特にGAN(Generative Adversarial Networks)に基づく手法は、将来性を示しているが、複雑な因果関係の取得、データユーティリティの維持、エンタープライズデプロイメントに適した証明可能なプライバシ保証の提供にしばしば苦労している。
本稿では,これらの課題に対処するための新しい生成フレームワークであるCA-GANを紹介する。
CA-GANは2段階のアプローチを用いる: 因果グラフ抽出により、データの多様体における堅牢で包括的な因果関係を学習し、続いて、因果グラフのノード構造に対してのみ動作する独自の条件付きWGAN-GP(Wasserstein GAN with Gradient Penalty)を使用する。
さらに重要なのは、このジェネレータは、実データと偽データから構築された因果グラフを整列して、トレーニングとサンプリングフェーズの両方において因果認識を保証する、新しい強化学習ベースの目標でトレーニングされていることだ。
14個のグラフデータセットにまたがる6つのSOTA法よりもCA-GANの方が優れていることを示す。
コアデータエンジニアリングの指標である因果保存、ユーティリティ保存、プライバシ保護に焦点をあてた評価を行った。
本手法は,データベースシステムをベンチマークし,ソフトウェア開発を加速し,セキュアなデータ駆動型研究を促進するために,高品質でプライバシに適合した合成データセットを作成しようとするデータ技術者に対して,実用的で高性能なソリューションを提供する。
関連論文リスト
- Privacy-Preserving Methods for Bug Severity Prediction [0.0]
ソースコードメトリクスと大規模言語モデルを用いたメソッドレベルのバグ重大度予測について検討する。
集中学習,フェデレート学習,合成データ生成を用いて学習したモデルの性能を比較した。
我々の発見は、産業環境で効果的なバグの深刻度予測を可能にするために、プライバシー保護アプローチの可能性を強調している。
論文 参考訳(メタデータ) (2025-06-28T04:40:51Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - Synthetic Network Traffic Data Generation: A Comparative Study [0.0]
既存の合成データ生成法は, 統計的忠実性, 分類タスクの実用性, クラスバランスの維持能力に大きく違いがある。
本研究では、非AI(統計)、古典AI、生成AI技術を含む12種類の合成ネットワークトラフィックデータ生成手法の比較分析を行った。
GANモデル,特にCTGANとCopulaGANは,高品質な合成データ生成に最適であることを示す。
論文 参考訳(メタデータ) (2024-10-18T14:19:25Z) - Putting Data at the Centre of Offline Multi-Agent Reinforcement Learning [3.623224034411137]
オフラインマルチエージェント強化学習(英語: offline multi-agent reinforcement learning, MARL)は、静的データセットを用いてマルチエージェントシステムの最適制御ポリシーを見つける研究のエキサイティングな方向である。
この分野は定義上はデータ駆動型だが、これまでのところ、最先端の結果を達成するための努力は、データを無視してきた。
研究の大部分は、一貫した方法論を使わずに独自のデータセットを生成し、これらのデータセットの特徴に関するまばらな情報を提供する。
論文 参考訳(メタデータ) (2024-09-18T14:13:24Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - GAN-based Tabular Data Generator for Constructing Synopsis in
Approximate Query Processing: Challenges and Solutions [0.0]
Approximate Query Processing (AQP) は、データ(シノプシス)の要約に基づいて、集約されたクエリに近似した回答を提供する技術である。
本研究では,AQPを用いて合成構築を行うことのできる表データ生成におけるGAN(Generative Adversarial Networks)の新規活用について検討する。
以上の結果から,データ駆動システムにおけるAQPの効率と有効性に変化をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2022-12-18T05:11:04Z) - Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。
ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。
合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T08:04:12Z) - GS-WGAN: A Gradient-Sanitized Approach for Learning Differentially
Private Generators [74.16405337436213]
我々は、GS-WGAN(Gradient-sanitized Wasserstein Generative Adrial Networks)を提案する。
GS-WGANは、厳格なプライバシー保証を備えた機密データの衛生的な形式での公開を可能にする。
このアプローチは、複数のメトリクスにわたる最先端のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2020-06-15T10:01:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。