論文の概要: FairFinGAN: Fairness-aware Synthetic Financial Data Generation
- arxiv url: http://arxiv.org/abs/2603.05327v1
- Date: Thu, 05 Mar 2026 16:09:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.313034
- Title: FairFinGAN: Fairness-aware Synthetic Financial Data Generation
- Title(参考訳): FairFinGAN:Fairness-aware Synthetic Financial Data Generation
- Authors: Tai Le Quy, Dung Nguyen Tuan, Trung Nguyen Thanh, Duy Tran Cong, Huyen Giang Thi Thu, Frank Hopfgartner,
- Abstract要約: 保護属性に対するバイアスを緩和しつつ、合成財務データを生成するために設計されたWGANベースのフレームワークであるFairFinGANを提案する。
提案手法を実世界の5つの財務データセット上で評価し,既存のGANベースのデータ生成手法と比較した。
実験結果から,本手法はデータの有用性を著しく損なうことなく,優れた公正度を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 0.3544442162078764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Financial datasets often suffer from bias that can lead to unfair decision-making in automated systems. In this work, we propose FairFinGAN, a WGAN-based framework designed to generate synthetic financial data while mitigating bias with respect to the protected attribute. Our approach incorporates fairness constraints directly into the training process through a classifier, ensuring that the synthetic data is both fair and preserves utility for downstream predictive tasks. We evaluate our proposed model on five real-world financial datasets and compare it with existing GAN-based data generation methods. Experimental results show that our approach achieves superior fairness metrics without significant loss in data utility, demonstrating its potential as a tool for bias-aware data generation in financial applications.
- Abstract(参考訳): 金融データセットは、しばしば、自動システムの不公平な意思決定につながるバイアスに悩まされる。
本研究では,WGANベースのフレームワークであるFairFinGANを提案する。
提案手法では, 整合性制約を直接学習プロセスに組み込んで, 合成データが公平であり, 下流予測タスクに有効であることを保証する。
提案手法を実世界の5つの財務データセット上で評価し,既存のGANベースのデータ生成手法と比較した。
実験結果から,本手法はデータユーティリティを著しく損なうことなく,優れた公正度測定値を実現し,金融アプリケーションにおけるバイアス対応データ生成ツールとしての可能性を示す。
関連論文リスト
- Synthetic Financial Data Generation for Enhanced Financial Modelling [0.0]
本稿では,合成財務データのための統合型マルチ基準評価フレームワークを提案する。
過去のSとP500の日次データを用いて、下流タスクにおける忠実度(最大平均離散性、MD)、時間構造(自己相関とボラティリティクラスタリング)、実用性を評価する。
アプリケーションのニーズや計算制約に応じて生成モデルを選択するための実践的ガイドラインを明確に述べる。
論文 参考訳(メタデータ) (2025-12-25T21:43:16Z) - Reliable and Reproducible Demographic Inference for Fairness in Face Analysis [63.46525489354455]
本稿では、従来のエンドツーエンドトレーニングをモジュラートランスファー学習アプローチで置き換える、完全に再現可能なDAIパイプラインを提案する。
このパイプラインは、正確性、公正性、そしてアイデンティティ内整合性によって定義される、新たに導入された堅牢性の概念の3つの次元にわたって監査する。
以上の結果から,提案手法は特に民族性において,強い基準線を上回り,その特性はより困難であることが示唆された。
論文 参考訳(メタデータ) (2025-10-23T12:22:02Z) - TABFAIRGDT: A Fast Fair Tabular Data Generator using Autoregressive Decision Trees [11.0044761900691]
本稿では,自己回帰決定木を用いた公正な合成データ生成手法であるTABFAIRGDTを紹介する。
ベンチマークフェアネスデータセット上でTABFAIRGDTを評価し,SOTA(State-of-the-art)深部生成モデルよりも優れていることを示す。
注目すべきなのは、TABFAIRGDTは、さまざまなデータセットサイズで、最速のSOTAベースラインよりも平均72%のスピードアップを実現していることだ。
論文 参考訳(メタデータ) (2025-09-24T09:35:52Z) - FairTabGen: Unifying Counterfactual and Causal Fairness in Synthetic Tabular Data Generation [4.044506553590468]
合成データ生成のためのフェアネス対応大規模言語モデルベースフレームワークであるFairTabGenを提案する。
我々は、公正さとユーティリティのバランスをとるために、文脈内学習、即時改善、公正さを意識したデータキュレーションを使用します。
論文 参考訳(メタデータ) (2025-08-15T21:36:07Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - FairCauseSyn: Towards Causally Fair LLM-Augmented Synthetic Data Generation [4.392938909804638]
合成データ生成は、生成モデルを用いて実世界のデータに基づいてデータを生成する。
実世界の健康データを用いて因果フェアネスを高めるために,初めてLLMを付加した合成データ生成法を開発した。
因果的公正予測器で訓練すると、合成データは実際のデータと比較して感度属性のバイアスを70%削減する。
論文 参考訳(メタデータ) (2025-06-23T19:59:26Z) - Targeted Learning for Data Fairness [52.59573714151884]
データ生成プロセス自体の公平性を評価することにより、公平性推論を拡張する。
我々は、人口統計学的平等、平等機会、条件付き相互情報から推定する。
提案手法を検証するため,いくつかのシミュレーションを行い,実データに適用する。
論文 参考訳(メタデータ) (2025-02-06T18:51:28Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - FinDiff: Diffusion Models for Financial Tabular Data Generation [5.824064631226058]
FinDiffは、さまざまな規制下流タスクのための現実世界の財務データを生成するために設計された拡散モデルである。
3つの実世界の財務データセットを用いて、最先端のベースラインモデルに対して評価される。
論文 参考訳(メタデータ) (2023-09-04T09:30:15Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - DECAF: Generating Fair Synthetic Data Using Causally-Aware Generative
Networks [71.6879432974126]
本稿では,GANに基づく表型データのための公正な合成データ生成装置であるDECAFを紹介する。
DeCAFは望ましくないバイアスを除去し,高品質な合成データを生成可能であることを示す。
下流モデルの収束と公平性に関する理論的保証を提供する。
論文 参考訳(メタデータ) (2021-10-25T12:39:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。