論文の概要: Contrastive Mixture of Posteriors for Counterfactual Inference, Data
Integration and Fairness
- arxiv url: http://arxiv.org/abs/2106.08161v1
- Date: Tue, 15 Jun 2021 14:04:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 15:19:43.183174
- Title: Contrastive Mixture of Posteriors for Counterfactual Inference, Data
Integration and Fairness
- Title(参考訳): 反現実的推論・データ統合・公正性のための後方のコントラスト混合
- Authors: Adam Foster, \'Arpi Vez\'er, Craig A Glastonbury, P\'aid\'i Creed, Sam
Abujudeh, Aaron Sim
- Abstract要約: バッチ効果の補正、データ統合、反ファクト推論といった課題に対処できるデータの意味的な表現を学ぶ。
条件付きVAEフレームワークを採用することで、条件変数から極端に独立した表現を学ぶという、これらの課題を統一する数学的原理を特定できる。
本稿では,この独立を強制するために,新しい調整ミスペナルティを用いたContrastive Mixture of Posteriors (CoMP)法を提案する。
- 参考スコア(独自算出の注目度): 0.8528401618469597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning meaningful representations of data that can address challenges such
as batch effect correction, data integration and counterfactual inference is a
central problem in many domains including computational biology. Adopting a
Conditional VAE framework, we identify the mathematical principle that unites
these challenges: learning a representation that is marginally independent of a
condition variable. We therefore propose the Contrastive Mixture of Posteriors
(CoMP) method that uses a novel misalignment penalty to enforce this
independence. This penalty is defined in terms of mixtures of the variational
posteriors themselves, unlike prior work which uses external discrepancy
measures such as MMD to ensure independence in latent space. We show that CoMP
has attractive theoretical properties compared to previous approaches,
especially when there is complex global structure in latent space. We further
demonstrate state of the art performance on a number of real-world problems,
including the challenging tasks of aligning human tumour samples with cancer
cell-lines and performing counterfactual inference on single-cell RNA
sequencing data. Incidentally, we find parallels with the fair representation
learning literature, and demonstrate CoMP has competitive performance in
learning fair yet expressive latent representations.
- Abstract(参考訳): バッチ効果補正、データ統合、反ファクト推論といった課題に対処できるデータの意味的な表現を学習することは、計算生物学を含む多くの領域において中心的な問題である。
本研究では,条件変数に依存しない表現の学習という,これらの課題を統一する数学的原理を考察する。
そこで我々は,この独立を強制するために,新規な不正調整ペナルティを用いたContrastive Mixture of Posteriors (CoMP)法を提案する。
このペナルティは、MDDのような外部の不一致対策を用いて潜伏空間の独立性を確保する以前の研究とは異なり、変分後部自体の混合によって定義される。
特に潜在空間に複雑な大域構造が存在する場合、comp は以前のアプローチと比較して魅力的な理論的性質を持つ。
さらに,ヒト腫瘍サンプルを癌細胞株と整列させ,単一細胞RNAシークエンシングデータに対する反実的推論を行うという課題を含む,現実的な課題に対する技術パフォーマンスの実態を実証する。
同時に、公正表現学習の文献と類似点を見つけ、公正かつ表現力のある潜在表現の学習において、CoMPが競争力を持つことを示す。
関連論文リスト
- Self-Distilled Disentangled Learning for Counterfactual Prediction [49.84163147971955]
我々は、SD2$として知られる自己蒸留遠絡フレームワークを提案する。
情報理論を基礎として、複雑な相互情報推定器の設計を伴わずに、理論上独立に不整合表現を鳴らす。
人工と実世界の両方のデータセットを用いて実験を行い,本手法の有効性を確認した。
論文 参考訳(メタデータ) (2024-06-09T16:58:19Z) - Counterfactual Fairness through Transforming Data Orthogonal to Bias [7.109458605736819]
我々は新しいデータ前処理アルゴリズムOrthogonal to Bias (OB)を提案する。
OBは、連続的な敏感な変数群の影響を排除し、機械学習アプリケーションにおける反ファクトフェアネスを促進するように設計されている。
OBはモデルに依存しないため、幅広い機械学習モデルやタスクに適用できる。
論文 参考訳(メタデータ) (2024-03-26T16:40:08Z) - Mapping the Multiverse of Latent Representations [17.2089620240192]
PRESTOは、潜在表現に依存する機械学習モデルのマルチバースをマッピングするための、原則化されたフレームワークである。
我々のフレームワークは、多種多様な機械学習手法の組み合わせから生じる潜伏空間を特徴付けるために永続的ホモロジーを使用する。
論文 参考訳(メタデータ) (2024-02-02T15:54:53Z) - Trade-off Between Dependence and Complexity for Nonparametric Learning
-- an Empirical Process Approach [10.27974860479791]
データが時間的依存を示す多くのアプリケーションでは、対応する経験的プロセスは理解されていない。
標準的な$beta/rho$-mixingの仮定の下では、経験過程の期待上限に一般化する。
長距離依存下であっても、i.d.設定と同じ速度で達成できることが示される。
論文 参考訳(メタデータ) (2024-01-17T05:08:37Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Conditional Kernel Imitation Learning for Continuous State Environments [9.750698192309978]
条件付きカーネル密度推定に基づく新しい模倣学習フレームワークを提案する。
我々は、多くの最先端ILアルゴリズムよりも一貫して優れた経験的性能を示す。
論文 参考訳(メタデータ) (2023-08-24T05:26:42Z) - Towards Characterizing Domain Counterfactuals For Invertible Latent Causal Models [15.817239008727789]
本研究では,異なるドメインで生成された場合,サンプルがどのようなものであったのかを仮定した,ドメイン反事実と呼ばれる特定のタイプの因果クエリを解析する。
本研究では, 潜在構造因果モデル (SCM) の回復は, ドメイン・デファクト・デファクトを推定するために不要であることを示す。
また、モデル生成過程を単純化し、生成モデル推定を行うための理論的基盤となる実用的なアルゴリズムも開発する。
論文 参考訳(メタデータ) (2023-06-20T04:19:06Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。