論文の概要: Generative Trees: Adversarial and Copycat
- arxiv url: http://arxiv.org/abs/2201.11205v1
- Date: Wed, 26 Jan 2022 22:02:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-29 03:32:35.259406
- Title: Generative Trees: Adversarial and Copycat
- Title(参考訳): 生成木:敵意と模倣木
- Authors: Richard Nock and Mathieu Guillame-Bert
- Abstract要約: 我々は、DT誘導のための教師付きタスクの最高のコンポーネントについての数十年前からの理解を活用している。
木に基づく生成モデル, テクスト生成木(GT)を紹介する。
我々は、フェイク/現実の区別、フェイクデータからのトレーニング、欠落データ計算などのタスクでアルゴリズムをテストする。
- 参考スコア(独自算出の注目度): 26.09279398946235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Generative Adversarial Networks (GANs) achieve spectacular results on
unstructured data like images, there is still a gap on tabular data, data for
which state of the art supervised learning still favours to a large extent
decision tree (DT)-based models. This paper proposes a new path forward for the
generation of tabular data, exploiting decades-old understanding of the
supervised task's best components for DT induction, from losses (properness),
models (tree-based) to algorithms (boosting). The \textit{properness} condition
on the supervised loss -- which postulates the optimality of Bayes rule --
leads us to a variational GAN-style loss formulation which is \textit{tight}
when discriminators meet a calibration property trivially satisfied by DTs,
and, under common assumptions about the supervised loss, yields "one loss to
train against them all" for the generator: the $\chi^2$. We then introduce
tree-based generative models, \textit{generative trees} (GTs), meant to mirror
on the generative side the good properties of DTs for classifying tabular data,
with a boosting-compliant \textit{adversarial} training algorithm for GTs. We
also introduce \textit{copycat training}, in which the generator copies at run
time the underlying tree (graph) of the discriminator DT and completes it for
the hardest discriminative task, with boosting compliant convergence. We test
our algorithms on tasks including fake/real distinction, training from fake
data and missing data imputation. Each one of these tasks displays that GTs can
provide comparatively simple -- and interpretable -- contenders to
sophisticated state of the art methods for data generation (using neural
network models) or missing data imputation (relying on multiple imputation by
chained equations with complex tree-based modeling).
- Abstract(参考訳): Generative Adversarial Networks (GAN) は、画像のような構造化されていないデータに対して素晴らしい結果を得るが、表形式のデータにはまだ差がある。
本稿では、DT誘導のための教師付きタスクの最高のコンポーネントを数十年前から理解し、損失(適正性)、モデル(ツリーベース)からアルゴリズム(ブースティング)まで、表型データ生成に向けた新たな道筋を提案する。
教師付き損失に関する \textit{properness} 条件 - ベイズ規則の最適性を仮定する - は、dtsによって自明に満足されたキャリブレーション特性を識別者が満たすと、変分ganスタイルの損失定式化を導いてくれる。
次に、表データ分類のためのdtsの優れた特性を、gtsのためのブースティング準拠の \textit{adversarial} トレーニングアルゴリズムで反映する木ベースの生成モデル \textit{generative trees} (gts) を導入する。
また,識別器DTのツリー(グラフ)実行時にジェネレータがコピーし,最も難しい識別タスクのために完了し,従順な収束を促進させるような‘textit{copycat training} も導入する。
我々は、フェイク/現実の区別、フェイクデータからのトレーニング、欠落データ計算などのタスクでアルゴリズムをテストする。
これらのタスクのそれぞれが、GTsがデータ生成(ニューラルネットワークモデルを用いた)やデータ計算の欠如(複雑なツリーベースモデリングによる連鎖方程式による多重計算に基づく)のための高度な手法の高度な状態に対して、比較的単純で解釈可能な -- を提供することができることを示す。
関連論文リスト
- Unmasking Trees for Tabular Data [0.0]
勾配型決定木を用いた表計算(および生成)の簡易な方法であるUnmaskingTreesを提案する。
条件生成サブプロブレムを解決するために,木分類器のバランス木に適合するBaltoBotを提案する。
従来の方法とは異なり、条件分布のパラメトリックな仮定は必要とせず、多重モーダル分布を持つ特徴を収容する。
我々はついに2つのアプローチをメタアルゴリズムとみなし、TabPFNを用いた文脈内学習に基づく生成モデリングを実証した。
論文 参考訳(メタデータ) (2024-07-08T04:15:43Z) - DPGAN: A Dual-Path Generative Adversarial Network for Missing Data Imputation in Graphs [17.847551850315895]
本稿では,DPGAN(Dual-Pathrative Adversarial Network)と呼ばれる新しいフレームワークを提案する。
DPGANは、欠落したデータと同時に処理し、過度にスムースな問題を回避することができる。
さまざまなベンチマークデータセットにわたる総合的な実験は、DPGANが既存の最先端の計算アルゴリズムよりも優れていなくても、一貫して競合していることを裏付けている。
論文 参考訳(メタデータ) (2024-04-26T05:26:10Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - NodeFormer: A Scalable Graph Structure Learning Transformer for Node
Classification [70.51126383984555]
本稿では,任意のノード間のノード信号を効率的に伝搬する全ペアメッセージパッシング方式を提案する。
効率的な計算は、カーナライズされたGumbel-Softmax演算子によって実現される。
グラフ上のノード分類を含む様々なタスクにおいて,本手法の有望な有効性を示す実験を行った。
論文 参考訳(メタデータ) (2023-06-14T09:21:15Z) - Localized Contrastive Learning on Graphs [110.54606263711385]
局所グラフコントラスト学習(Local-GCL)という,シンプルだが効果的なコントラストモデルを導入する。
その単純さにもかかわらず、Local-GCLは、様々なスケールと特性を持つグラフ上の自己教師付きノード表現学習タスクにおいて、非常に競争力のある性能を達成する。
論文 参考訳(メタデータ) (2022-12-08T23:36:00Z) - Active-LATHE: An Active Learning Algorithm for Boosting the Error
Exponent for Learning Homogeneous Ising Trees [75.93186954061943]
我々は、$rho$が少なくとも0.8$である場合に、エラー指数を少なくとも40%向上させるアルゴリズムを設計し、分析する。
我々の分析は、グラフの一部により多くのデータを割り当てるために、微小だが検出可能なサンプルの統計的変動を巧みに活用することに基づいている。
論文 参考訳(メタデータ) (2021-10-27T10:45:21Z) - Convergent Boosted Smoothing for Modeling Graph Data with Tabular Node
Features [46.052312251801]
本稿では,グラフ伝播ステップでブースティングを反復するフレームワークを提案する。
我々のアプローチは、原則化されたメタロス関数に固定されている。
様々な非イドグラフデータセットに対して,本手法は同等あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2021-10-26T04:53:12Z) - OCT-GAN: Neural ODE-based Conditional Tabular GANs [8.062118111791495]
ニューラル常微分方程式(NODE)に基づくジェネレータと判別器を導入する。
我々は、保険詐欺の検出やオンラインニュース記事の予測などを含む13のデータセットを用いて実験を行う。
論文 参考訳(メタデータ) (2021-05-31T13:58:55Z) - A Robust and Generalized Framework for Adversarial Graph Embedding [73.37228022428663]
本稿では,AGE という逆グラフ埋め込みのための頑健なフレームワークを提案する。
AGEは、暗黙の分布から強化された負のサンプルとして偽の隣接ノードを生成する。
本フレームワークでは,3種類のグラフデータを扱う3つのモデルを提案する。
論文 参考訳(メタデータ) (2021-05-22T07:05:48Z) - PC-GAIN: Pseudo-label Conditional Generative Adversarial Imputation
Networks for Incomplete Data [19.952411963344556]
PC-GAIN(PC-GAIN)は、PC-GAIN(PC-GAIN)と呼ばれる新しい教師なしデータ計算法である。
まず,低損失率データのサブセットに含まれる潜在的なカテゴリ情報を学習するための事前学習手順を提案する。
そして、合成擬似ラベルを用いて補助分類器を決定する。
論文 参考訳(メタデータ) (2020-11-16T08:08:26Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。