論文の概要: DoGR: Disaggregated Gaussian Regression for Reproducible Analysis of
Heterogeneous Data
- arxiv url: http://arxiv.org/abs/2108.13581v1
- Date: Tue, 31 Aug 2021 01:58:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-01 14:27:12.322757
- Title: DoGR: Disaggregated Gaussian Regression for Reproducible Analysis of
Heterogeneous Data
- Title(参考訳): dogr: 不均質データの再現性解析のための分散ガウス回帰
- Authors: Nazanin Alipourfard, Keith Burghardt, Kristina Lerman
- Abstract要約: データを重なり合うクラスタ(分散)に分割し,その内の動作をモデル化することで,潜在的共同設立者を検出するDoGRを導入する(回帰)。
実世界のデータに適用すると,本手法は有意義なクラスタとその特徴的行動を発見し,グループ差と関心の帰結に対する影響について考察する。
我々のフレームワークは、潜伏した共同創設者を考慮し、ノイズの多い異種データの探索分析を促進し、新しいデータにもっと一般化した予測モデルを学ぶのに利用できる。
- 参考スコア(独自算出の注目度): 4.720638420461489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quantitative analysis of large-scale data is often complicated by the
presence of diverse subgroups, which reduce the accuracy of inferences they
make on held-out data. To address the challenge of heterogeneous data analysis,
we introduce DoGR, a method that discovers latent confounders by simultaneously
partitioning the data into overlapping clusters (disaggregation) and modeling
the behavior within them (regression). When applied to real-world data, our
method discovers meaningful clusters and their characteristic behaviors, thus
giving insight into group differences and their impact on the outcome of
interest. By accounting for latent confounders, our framework facilitates
exploratory analysis of noisy, heterogeneous data and can be used to learn
predictive models that better generalize to new data. We provide the code to
enable others to use DoGR within their data analytic workflows.
- Abstract(参考訳): 大規模データの定量的分析は、様々なサブグループの存在によって複雑になり、保持されたデータに対する推測の精度が低下する。
異種データ分析の課題に対処するため,重なり合うクラスタ(分散)にデータを分割し,その内の振る舞いをモデル化し(回帰)、潜在的共同設立者を検出するDoGRを導入する。
実世界のデータに適用すると,本手法は有意義なクラスタとその特徴的行動を発見し,グループ差と関心の帰結に与える影響について考察する。
潜伏する共同創設者を考慮すれば,ノイズの多い異種データの探索的分析が容易になり,新しいデータへの一般化を促進する予測モデルを学ぶことができる。
私たちは、他の人がデータ分析ワークフローでDoGRを使えるようにするためのコードを提供します。
関連論文リスト
- Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - Task Groupings Regularization: Data-Free Meta-Learning with Heterogeneous Pre-trained Models [83.02797560769285]
Data-Free Meta-Learning (DFML)は、トレーニング済みモデルのコレクションから、元のデータにアクセスせずに知識を抽出することを目的としている。
現在の手法は、事前訓練されたモデル間の不均一性を見落とし、タスクの衝突による性能低下につながることが多い。
課題群規則化(Task Groupings Regularization)は、矛盾するタスクをグループ化し整合させることにより、モデルの不均一性から恩恵を受ける新しいアプローチである。
論文 参考訳(メタデータ) (2024-05-26T13:11:55Z) - A Guide for Practical Use of ADMG Causal Data Augmentation [0.0]
これらの課題に対処するためのソリューションとして、因果データ拡張戦略が指摘されている。
異なる設定を考慮したADMG因果拡大法を実験的に検討した。
論文 参考訳(メタデータ) (2023-04-03T09:31:13Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - TRAPDOOR: Repurposing backdoors to detect dataset bias in machine
learning-based genomic analysis [15.483078145498085]
データセット内のグループの下位表現は、特定のグループの不正確な予測につながる可能性があるため、システム的識別問題を悪化させる可能性がある。
本稿では,ニューラルネットワークのバックドアであるTRAPDOORを提案する。
実世界のがんデータセットを用いて、すでに白人個人に対して存在するバイアスでデータセットを分析し、データセットにバイアスを人工的に導入する。
論文 参考訳(メタデータ) (2021-08-14T17:02:02Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。