論文の概要: Contrastive Mixture of Posteriors for Counterfactual Inference, Data
Integration and Fairness
- arxiv url: http://arxiv.org/abs/2106.08161v1
- Date: Tue, 15 Jun 2021 14:04:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 15:19:43.183174
- Title: Contrastive Mixture of Posteriors for Counterfactual Inference, Data
Integration and Fairness
- Title(参考訳): 反現実的推論・データ統合・公正性のための後方のコントラスト混合
- Authors: Adam Foster, \'Arpi Vez\'er, Craig A Glastonbury, P\'aid\'i Creed, Sam
Abujudeh, Aaron Sim
- Abstract要約: バッチ効果の補正、データ統合、反ファクト推論といった課題に対処できるデータの意味的な表現を学ぶ。
条件付きVAEフレームワークを採用することで、条件変数から極端に独立した表現を学ぶという、これらの課題を統一する数学的原理を特定できる。
本稿では,この独立を強制するために,新しい調整ミスペナルティを用いたContrastive Mixture of Posteriors (CoMP)法を提案する。
- 参考スコア(独自算出の注目度): 0.8528401618469597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning meaningful representations of data that can address challenges such
as batch effect correction, data integration and counterfactual inference is a
central problem in many domains including computational biology. Adopting a
Conditional VAE framework, we identify the mathematical principle that unites
these challenges: learning a representation that is marginally independent of a
condition variable. We therefore propose the Contrastive Mixture of Posteriors
(CoMP) method that uses a novel misalignment penalty to enforce this
independence. This penalty is defined in terms of mixtures of the variational
posteriors themselves, unlike prior work which uses external discrepancy
measures such as MMD to ensure independence in latent space. We show that CoMP
has attractive theoretical properties compared to previous approaches,
especially when there is complex global structure in latent space. We further
demonstrate state of the art performance on a number of real-world problems,
including the challenging tasks of aligning human tumour samples with cancer
cell-lines and performing counterfactual inference on single-cell RNA
sequencing data. Incidentally, we find parallels with the fair representation
learning literature, and demonstrate CoMP has competitive performance in
learning fair yet expressive latent representations.
- Abstract(参考訳): バッチ効果補正、データ統合、反ファクト推論といった課題に対処できるデータの意味的な表現を学習することは、計算生物学を含む多くの領域において中心的な問題である。
本研究では,条件変数に依存しない表現の学習という,これらの課題を統一する数学的原理を考察する。
そこで我々は,この独立を強制するために,新規な不正調整ペナルティを用いたContrastive Mixture of Posteriors (CoMP)法を提案する。
このペナルティは、MDDのような外部の不一致対策を用いて潜伏空間の独立性を確保する以前の研究とは異なり、変分後部自体の混合によって定義される。
特に潜在空間に複雑な大域構造が存在する場合、comp は以前のアプローチと比較して魅力的な理論的性質を持つ。
さらに,ヒト腫瘍サンプルを癌細胞株と整列させ,単一細胞RNAシークエンシングデータに対する反実的推論を行うという課題を含む,現実的な課題に対する技術パフォーマンスの実態を実証する。
同時に、公正表現学習の文献と類似点を見つけ、公正かつ表現力のある潜在表現の学習において、CoMPが競争力を持つことを示す。
関連論文リスト
- Mapping the Multiverse of Latent Representations [18.799554727838437]
PRESTOは、潜在表現に依存する機械学習モデルのマルチバースをマッピングするための、原則化されたフレームワークである。
我々のフレームワークは、多種多様な機械学習手法の組み合わせから生じる潜伏空間を特徴付けるために永続的ホモロジーを使用する。
論文 参考訳(メタデータ) (2024-02-02T15:54:53Z) - Trade-off Between Dependence and Complexity for Nonparametric Learning
-- an Empirical Process Approach [10.27974860479791]
データが時間的依存を示す多くのアプリケーションでは、対応する経験的プロセスは理解されていない。
標準的な$beta/rho$-mixingの仮定の下では、経験過程の期待上限に一般化する。
長距離依存下であっても、i.d.設定と同じ速度で達成できることが示される。
論文 参考訳(メタデータ) (2024-01-17T05:08:37Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Conditional Kernel Imitation Learning for Continuous State Environments [9.750698192309978]
条件付きカーネル密度推定に基づく新しい模倣学習フレームワークを提案する。
我々は、多くの最先端ILアルゴリズムよりも一貫して優れた経験的性能を示す。
論文 参考訳(メタデータ) (2023-08-24T05:26:42Z) - Robust Perception through Equivariance [28.43219868475906]
本稿では,自然画像の内在的制約を強固にするためのフレームワークを提案する。
推論時に制約を導入することで、堅牢性の負担をトレーニングから推論アルゴリズムに移行することができる。
論文 参考訳(メタデータ) (2022-12-12T17:52:46Z) - Cycle-Balanced Representation Learning For Counterfactual Inference [42.229586802733806]
本稿では,Cycle-Balanced Representation Learning for counterfactual Inference (CBRE) に基づく新しいフレームワークを提案する。
具体的には,異なるグループに対して,逆行訓練を用いて頑健なバランスの取れた表現を実現し,一方,元データ特性を循環的に保存する情報ループを構築する。
実世界の3つのデータセットの結果は、CBREが最先端の手法にマッチ/アウトパフォーマンスを示し、反現実的推論に適用できる大きな可能性を持っている。
論文 参考訳(メタデータ) (2021-10-29T01:15:16Z) - On Covariate Shift of Latent Confounders in Imitation and Reinforcement
Learning [69.48387059607387]
模擬・強化学習において,未観測の共同設立者と専門家データを併用することの問題点を考察する。
我々は、外部報酬を伴わずに、確立した専門家データから学ぶことの限界を分析する。
我々は,支援医療とレコメンデーションシステムシミュレーションの課題に挑戦する上で,我々の主張を実証的に検証する。
論文 参考訳(メタデータ) (2021-10-13T07:31:31Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。