論文の概要: TC-VAE: Uncovering Out-of-Distribution Data Generative Factors
- arxiv url: http://arxiv.org/abs/2304.04103v1
- Date: Sat, 8 Apr 2023 21:16:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 17:49:16.113824
- Title: TC-VAE: Uncovering Out-of-Distribution Data Generative Factors
- Title(参考訳): tc-vae: 分散データ生成要因を明らかにする
- Authors: Cristian Meo, Anirudh Goyal and Justin Dauwels
- Abstract要約: 提案モデルでは,異なるデータセット上でOOD生成因子を明らかにすることができることを示す。
また,学習した潜在表現と入力データとの結合総関係の下位境界を用いて最適化された生成モデルTC-VAEを提案する。
- 参考スコア(独自算出の注目度): 32.41272058228588
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncovering data generative factors is the ultimate goal of disentanglement
learning. Although many works proposed disentangling generative models able to
uncover the underlying generative factors of a dataset, so far no one was able
to uncover OOD generative factors (i.e., factors of variations that are not
explicitly shown on the dataset). Moreover, the datasets used to validate these
models are synthetically generated using a balanced mixture of some predefined
generative factors, implicitly assuming that generative factors are uniformly
distributed across the datasets. However, real datasets do not present this
property. In this work we analyse the effect of using datasets with unbalanced
generative factors, providing qualitative and quantitative results for widely
used generative models. Moreover, we propose TC-VAE, a generative model
optimized using a lower bound of the joint total correlation between the
learned latent representations and the input data. We show that the proposed
model is able to uncover OOD generative factors on different datasets and
outperforms on average the related baselines in terms of downstream
disentanglement metrics.
- Abstract(参考訳): データ生成要因を明らかにすることは、絡み合い学習の究極の目標である。
多くの研究が、データセットの根底にある生成因子を解明できる無絡生成モデルを提案したが、これまでのところ、OOD生成因子(すなわちデータセットに明示的に示されていない変動因子)を発見できなかった。
さらに、これらのモデルを検証するために使用されるデータセットは、予め定義された生成因子のバランスの取れた混合を用いて合成され、生成因子がデータセット全体に均一に分散されていることを暗黙的に仮定する。
しかし、実際のデータセットはこの性質を示さない。
本研究では,不均衡生成因子を用いたデータセットの利用の効果を分析し,広く用いられている生成モデルに対して質的・定量的な結果を与える。
さらに,学習した潜在表現と入力データとの結合総関係の下位境界を用いて最適化された生成モデルTC-VAEを提案する。
提案モデルでは, 異なるデータセット上のOOD生成因子を抽出し, 下流のアンタングル化指標を用いて, 関連するベースラインの平均値を上回る性能を示す。
関連論文リスト
- zGAN: An Outlier-focused Generative Adversarial Network For Realistic Synthetic Data Generation [0.0]
ブラックスワン」は古典的な機械学習モデルの性能に挑戦している。
本稿では、外部特性を持つ合成データを生成する目的で開発されたzGANモデルアーキテクチャの概要について述べる。
リアルな合成データ生成の有望な結果と、モデル性能のアップリフト能力を示す。
論文 参考訳(メタデータ) (2024-10-28T07:55:11Z) - LLM See, LLM Do: Guiding Data Generation to Target Non-Differentiable Objectives [44.781967004009715]
合成データ統合の結果を系統的に研究し, モデル特性の受動的継承の影響について検討した。
合成データが「中立」に見える場合でも、モデルが特定の属性に対して驚くほど敏感であることがわかった。
本研究では,非微分不可能な目的に応じて意図的に合成データを制約する用語として,アクティブ継承を提案する。
論文 参考訳(メタデータ) (2024-07-01T17:26:21Z) - An improved tabular data generator with VAE-GMM integration [9.4491536689161]
本稿では,現在のアプローチの限界に対処する新しい変分オートエンコーダ(VAE)モデルを提案する。
本手法は,TVAEモデルにインスパイアされたベイジアン・ガウス混合モデル(BGM)をVAEアーキテクチャに組み込む。
我々は,2つの医療関連データセットを含む混合データ型を持つ実世界の3つのデータセットに対して,我々のモデルを徹底的に検証する。
論文 参考訳(メタデータ) (2024-04-12T12:31:06Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - Analyzing Bias in Diffusion-based Face Generation Models [75.80072686374564]
拡散モデルは、合成データ生成と画像編集アプリケーションでますます人気がある。
本研究では, 性別, 人種, 年齢などの属性に関して, 拡散型顔生成モデルにおけるバイアスの存在について検討する。
本研究は,GAN(Generative Adversarial Network)とGAN(Generative Adversarial Network)をベースとした顔生成モデルにおいて,データセットサイズが属性組成および知覚品質に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-10T18:22:31Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Improving the quality of generative models through Smirnov
transformation [1.3492000366723798]
本稿では,ジェネレータの出力として使用される新しいアクティベーション関数を提案する。
これはスミルノフ確率変換に基づいており、生成されたデータの品質を改善するために特別に設計されている。
論文 参考訳(メタデータ) (2021-10-29T17:01:06Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Variational Selective Autoencoder: Learning from Partially-Observed
Heterogeneous Data [45.23338389559936]
本研究では,部分観測された異種データから表現を学習するための変分選択型オートエンコーダ(VSAE)を提案する。
vsaeは、観測データ、観測されていないデータ、およびインプテーションマスクの合同分布をモデル化することで、異種データの潜在依存関係を学習する。
その結果、データ生成や計算を含むさまざまな下流タスクの統一モデルが実現される。
論文 参考訳(メタデータ) (2021-02-25T04:39:13Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - CausalVAE: Structured Causal Disentanglement in Variational Autoencoder [52.139696854386976]
変分オートエンコーダ(VAE)の枠組みは、観測から独立した因子をアンタングルするために一般的に用いられる。
本稿では, 因果内因性因子を因果内因性因子に変換する因果層を含むVOEベースの新しいフレームワークCausalVAEを提案する。
その結果、CausalVAEが学習した因果表現は意味論的に解釈可能であり、DAG(Directed Acyclic Graph)としての因果関係は精度良く同定された。
論文 参考訳(メタデータ) (2020-04-18T20:09:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。