論文の概要: Generative Adversarial Networks for Bitcoin Data Augmentation
- arxiv url: http://arxiv.org/abs/2005.13369v1
- Date: Wed, 27 May 2020 13:58:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 08:21:50.337537
- Title: Generative Adversarial Networks for Bitcoin Data Augmentation
- Title(参考訳): Bitcoinデータ拡張のためのジェネレータネットワーク
- Authors: Francesco Zola, Jan Lukas Bruse, Xabier Etxeberria Barrio, Mikel
Galar, Raul Orduna Urrutia
- Abstract要約: 我々は,Bitcoinデータ拡張にGAN(Generative Adversarial Networks)を用いることを提案する。
データセットのサイズや選択されたバッチサイズなどのGANパラメータが、表現不足のエンティティクラスに対するGANの実装にどのように影響するかを示す。
これは、Bitcoinエンティティ分類におけるデータ拡張のための合成アドレスデータを生成する有効なツールとして、GANを提示する最初の研究である。
- 参考スコア(独自算出の注目度): 0.587978226098469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Bitcoin entity classification, results are strongly conditioned by the
ground-truth dataset, especially when applying supervised machine learning
approaches. However, these ground-truth datasets are frequently affected by
significant class imbalance as generally they contain much more information
regarding legal services (Exchange, Gambling), than regarding services that may
be related to illicit activities (Mixer, Service). Class imbalance increases
the complexity of applying machine learning techniques and reduces the quality
of classification results, especially for underrepresented, but critical
classes.
In this paper, we propose to address this problem by using Generative
Adversarial Networks (GANs) for Bitcoin data augmentation as GANs recently have
shown promising results in the domain of image classification. However, there
is no "one-fits-all" GAN solution that works for every scenario. In fact,
setting GAN training parameters is non-trivial and heavily affects the quality
of the generated synthetic data. We therefore evaluate how GAN parameters such
as the optimization function, the size of the dataset and the chosen batch size
affect GAN implementation for one underrepresented entity class (Mining Pool)
and demonstrate how a "good" GAN configuration can be obtained that achieves
high similarity between synthetically generated and real Bitcoin address data.
To the best of our knowledge, this is the first study presenting GANs as a
valid tool for generating synthetic address data for data augmentation in
Bitcoin entity classification.
- Abstract(参考訳): Bitcoinエンティティ分類では、特に教師付き機械学習アプローチを適用する場合、結果が基調データセットによって強く条件付けられます。
しかし、これらの真正なデータセットは、違法な活動(ミキサー、サービス)に関連するサービスよりも法的なサービス(交換、ギャンブル)に関する多くの情報を含んでいるため、重要なクラスの不均衡によってしばしば影響を受ける。
クラス不均衡は、機械学習技術を適用する複雑さを増大させ、特に表現不足のクラスにおいて、分類結果の品質を低下させる。
本稿では,GAN(Generative Adversarial Networks, GAN)を用いてビットコインのデータ拡張を行い, 画像分類における有望な結果を示した。
しかしながら、すべてのシナリオで機能する"オールフィット"のGANソリューションはありません。
実際、GANトレーニングパラメータの設定は簡単ではなく、生成した合成データの品質に大きく影響を与える。
したがって、最適化関数やデータセットのサイズ、選択されたバッチサイズなどのGANパラメータが、表現不足のエンティティクラス(マイニングプール)のGAN実装にどのように影響するかを評価し、合成されたBitcoinアドレスデータと実際のBitcoinアドレスデータとの高い類似性を実現する「良い」GAN構成が得られるかを示す。
我々の知る限りでは、Bitcoinエンティティ分類におけるデータ拡張のための合成アドレスデータを生成する有効なツールとして、GANを提示する最初の研究である。
関連論文リスト
- SMaRt: Improving GANs with Score Matching Regularity [94.81046452865583]
生成的敵ネットワーク(GAN)は通常、基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチングは、生成したデータポイントを実データ多様体へ持続的にプッシュする能力のおかげで、この問題に対する有望な解決策であることを示す。
スコアマッチング規則性(SMaRt)を用いたGANの最適化を提案する。
論文 参考訳(メタデータ) (2023-11-30T03:05:14Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - Augmentation-Aware Self-Supervision for Data-Efficient GAN Training [68.81471633374393]
識別器が過度に適合する傾向があるため、限られたデータでGANを訓練することは困難である。
本稿では,拡張データの拡張パラメータを予測する,拡張型自己教師型識別器を提案する。
本稿では,クラス条件の BigGAN と非条件の StyleGAN2 アーキテクチャを用いた State-of-the-art (SOTA) 手法と比較する。
論文 参考訳(メタデータ) (2022-05-31T10:35:55Z) - FinGAN: Generative Adversarial Network for Analytical Customer
Relationship Management in Banking and Insurance [4.241208172557663]
GAN(Generative Adversarial Network)を用いたマイノリティクラスの合成サンプルを生成するオーバーサンプリング手法を提案する。
第二に、一級支援ビゴーマシン(OCSVM)が取得したアンダーサンプリングされた多数派クラスデータと、GANがオーバーサンプリングした合成マイノリティクラスデータを増分することで、アンダーサンプリングとオーバーサンプリングの力を両立させる。
提案手法は,全データセットのROC曲線(AUC)に基づく領域において,従来の結果よりも優れていた。
論文 参考訳(メタデータ) (2022-01-27T12:43:00Z) - Improving Model Compatibility of Generative Adversarial Networks by
Boundary Calibration [24.28407308818025]
境界キャリブレーションGAN(BCGAN)は、GANのモデル互換性を改善するために提案される。
BCGANはオリジナルのGANのようなリアルなイメージを生成するが、オリジナルのGANよりも優れたモデル互換性を実現する。
論文 参考訳(メタデータ) (2021-11-03T16:08:09Z) - GAN-based Data Augmentation for Chest X-ray Classification [0.0]
Generative Adrialversa Networks (GANs) は、合成データ拡張の新しい方法を提供する。
GANベースの拡張により、表現不足のクラスでは、よりダウンストリームのパフォーマンスが向上する。
これは、データ収集が違法に高価である場合にネットワーク性能を向上させるため、GANベースの拡張が有望な研究領域であることを示唆している。
論文 参考訳(メタデータ) (2021-07-07T01:36:48Z) - Class Balancing GAN with a Classifier in the Loop [58.29090045399214]
本稿では,GANを学習するための理論的動機付けクラスバランス正則化器を提案する。
我々の正規化器は、訓練済みの分類器からの知識を利用して、データセット内のすべてのクラスのバランスの取れた学習を確実にします。
複数のデータセットにまたがる既存手法よりも優れた性能を達成し,長期分布の学習表現における正規化器の有用性を実証する。
論文 参考訳(メタデータ) (2021-06-17T11:41:30Z) - Inducing Optimal Attribute Representations for Conditional GANs [61.24506213440997]
条件付きGANは、あるカテゴリから別のカテゴリへの画像の変換に広く使用されている。
既存の条件付きGANは、ターゲットドメインラベル情報を0と1の形式でハードコードされたカテゴリベクトルとして符号化する。
本稿では,グラフ畳み込みネットワークを用いた新しいエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T20:24:07Z) - xAI-GAN: Enhancing Generative Adversarial Networks via Explainable AI
Systems [16.360144499713524]
Generative Adversarial Networks (GAN) は、現実的な画像、音楽、テキスト、その他のデータの生成に成功しているディープニューラルネットワーク(DNN)の革命的なクラスである。
本稿では、AI(xAI)システムにおける最近の進歩を活用して、識別器からジェネレータへの「よりリッチな」修正フィードバックを提供する新しいGANクラスを提案する。
我々は、xAI-GANが標準GANよりも、MNISTとFMNISTの両方のデータセットで生成された画像の品質を最大23.18%向上させるのを観察する。
論文 参考訳(メタデータ) (2020-02-24T18:38:13Z) - On Positive-Unlabeled Classification in GAN [130.43248168149432]
本稿では,標準GANに対する肯定的かつ未ラベルの分類問題を定義する。
その後、GANにおける差別者の訓練を安定させる新しい手法が導かれる。
論文 参考訳(メタデータ) (2020-02-04T05:59:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。