論文の概要: ErGAN: Generative Adversarial Networks for Entity Resolution
- arxiv url: http://arxiv.org/abs/2012.10004v1
- Date: Fri, 18 Dec 2020 01:33:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:01:16.316422
- Title: ErGAN: Generative Adversarial Networks for Entity Resolution
- Title(参考訳): ErGAN: エンティティ解決のためのジェネレータネットワーク
- Authors: Jingyu Shao, Qing Wang, Asiri Wijesinghe, Erhard Rahm
- Abstract要約: 学習ベースのエンティティ解決の大きな課題は、トレーニングのラベルコストを削減する方法です。
そこで本研究では,erganと呼ばれる新しい深層学習手法を提案する。
ErGANのラベリングと学習効率を実証的に検証するための広範な実験を実施しました。
- 参考スコア(独自算出の注目度): 8.576633582363202
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Entity resolution targets at identifying records that represent the same
real-world entity from one or more datasets. A major challenge in
learning-based entity resolution is how to reduce the label cost for training.
Due to the quadratic nature of record pair comparison, labeling is a costly
task that often requires a significant effort from human experts. Inspired by
recent advances of generative adversarial network (GAN), we propose a novel
deep learning method, called ErGAN, to address the challenge. ErGAN consists of
two key components: a label generator and a discriminator which are optimized
alternatively through adversarial learning. To alleviate the issues of
overfitting and highly imbalanced distribution, we design two novel modules for
diversity and propagation, which can greatly improve the model generalization
power. We have conducted extensive experiments to empirically verify the
labeling and learning efficiency of ErGAN. The experimental results show that
ErGAN beats the state-of-the-art baselines, including unsupervised,
semi-supervised, and unsupervised learning methods.
- Abstract(参考訳): エンティティの解像度は、1つ以上のデータセットから同じ現実世界のエンティティを表すレコードを特定することを目標としている。
学習ベースのエンティティ解決における大きな課題は、トレーニングのラベルコストを削減する方法だ。
レコード対比較の二次的な性質から、ラベル付けはコストのかかる作業であり、人間の専門家からの多大な努力を必要とする。
近年のGAN(Generative Adversarial Network)の発展に触発されて,ErGANと呼ばれる新しいディープラーニング手法を提案する。
ErGANはラベルジェネレータと識別器の2つの重要なコンポーネントから構成されており、逆学習によって代わりに最適化される。
過剰フィッティングと高度にバランスの取れない分布の問題を緩和するために, モデル一般化能力を大幅に向上できる, 多様性と伝播のための2つの新しいモジュールを設計した。
我々はErGANのラベル付けと学習効率を実証的に検証するための広範な実験を行った。
実験の結果,ErGANは教師なし,半教師なし,教師なしの学習方法を含む最先端のベースラインを上回っていることがわかった。
関連論文リスト
- Adversarial Dual-Student with Differentiable Spatial Warping for
Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。
また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。
我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文 参考訳(メタデータ) (2022-03-05T17:36:17Z) - Feature Diversity Learning with Sample Dropout for Unsupervised Domain
Adaptive Person Re-identification [0.0]
本稿では,ノイズの多い擬似ラベルを限定することで,より優れた一般化能力を持つ特徴表現を学習する手法を提案する。
我々は,古典的な相互学習アーキテクチャの下で,FDL(Feature Diversity Learning)と呼ばれる新しい手法を提案する。
実験の結果,提案するFDL-SDは,複数のベンチマークデータセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-01-25T10:10:48Z) - Self-Ensembling GAN for Cross-Domain Semantic Segmentation [107.27377745720243]
本稿では,セマンティックセグメンテーションのためのクロスドメインデータを利用した自己理解型生成逆数ネットワーク(SE-GAN)を提案する。
SE-GANでは、教師ネットワークと学生ネットワークは、意味分節マップを生成するための自己組織化モデルを構成する。
その単純さにもかかわらず、SE-GANは敵の訓練性能を大幅に向上させ、モデルの安定性を高めることができる。
論文 参考訳(メタデータ) (2021-12-15T09:50:25Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - Discriminative-Generative Representation Learning for One-Class Anomaly
Detection [22.500931323372303]
生成法と識別法を組み合わせた自己教師型学習フレームワークを提案する。
提案手法は,複数のベンチマークデータセットにおいて,最先端の処理性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-27T11:46:15Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Supervised Anomaly Detection via Conditional Generative Adversarial
Network and Ensemble Active Learning [24.112455929818484]
異常検出はマシンインテリジェンスに広く応用されているが、未解決の問題である。
従来の教師なし異常検出器は最適以下であり、教師付きモデルはバイアス予測を容易に行うことができる。
Ensemble Active Learning Generative Adversarial Network (EAL-GAN) の導入により,新たな教師付き異常検知器を提案する。
論文 参考訳(メタデータ) (2021-04-24T13:47:50Z) - Partition-Guided GANs [63.980473635585234]
私たちは、スペースを小さな領域に分割し、それぞれがよりシンプルな分布を持ち、各パーティションごとに異なるジェネレータを訓練するパーティションーを設計します。
これはラベルを必要とせずに教師なしの方法で実行される。
各種標準ベンチマーク実験の結果,提案手法が近年の手法を上回っていることがわかった。
論文 参考訳(メタデータ) (2021-04-02T00:06:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。