論文の概要: Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets
- arxiv url: http://arxiv.org/abs/2203.15234v1
- Date: Tue, 29 Mar 2022 04:54:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 06:33:32.671159
- Title: Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets
- Title(参考訳): ポーリングされたニューロイメージングデータセットの解析における複数のニュアンス変数の対応性
- Authors: Vishnu Suresh Lokhande, Rudrasis Chakraborty, Sathya N. Ravi, Vikas
Singh
- Abstract要約: 本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
- 参考スコア(独自算出の注目度): 53.34152466646884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pooling multiple neuroimaging datasets across institutions often enables
improvements in statistical power when evaluating associations (e.g., between
risk factors and disease outcomes) that may otherwise be too weak to detect.
When there is only a {\em single} source of variability (e.g., different
scanners), domain adaptation and matching the distributions of representations
may suffice in many scenarios. But in the presence of {\em more than one}
nuisance variable which concurrently influence the measurements, pooling
datasets poses unique challenges, e.g., variations in the data can come from
both the acquisition method as well as the demographics of participants
(gender, age). Invariant representation learning, by itself, is ill-suited to
fully model the data generation process. In this paper, we show how bringing
recent results on equivariant representation learning (for studying symmetries
in neural networks) instantiated on structured spaces together with simple use
of classical results on causal inference provides an effective practical
solution. In particular, we demonstrate how our model allows dealing with more
than one nuisance variable under some assumptions and can enable analysis of
pooled scientific datasets in scenarios that would otherwise entail removing a
large portion of the samples.
- Abstract(参考訳): 組織にまたがる複数の神経画像データセットをプールすることで、関係性(例えば、リスク要因と疾患の結果の間の関係)を評価するとき、統計力の向上が可能になる。
可変性の源(例えば、異なるスキャナ)しか存在しない場合、ドメイン適応と表現の分布のマッチングは、多くのシナリオにおいて十分である。
しかし、測定に同時に影響を及ぼす1つ以上のニュアンス変数が存在する場合、プールデータセットは、例えば、データのバリエーションは、取得方法と、参加者の人口統計(性別、年齢)の両方から生じる、ユニークな課題を生じさせる。
不変表現学習自体は、データ生成プロセスを完全にモデル化するのに不適当である。
本稿では,構造化空間上での同変表現学習(ニューラルネットワークにおける対称性の研究)に関する最近の結果と,因果推論における古典的結果の簡易利用が,効果的な実用的解決策となることを示す。
特に、いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分が取り除かれるシナリオにおいて、プールされた科学データセットの分析を可能にする。
関連論文リスト
- Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - Analyzing the Effects of Handling Data Imbalance on Learned Features
from Medical Images by Looking Into the Models [50.537859423741644]
不均衡なデータセットでモデルをトレーニングすることは、学習問題にユニークな課題をもたらす可能性がある。
ニューラルネットワークの内部ユニットを深く調べて、データの不均衡処理が学習した機能にどのように影響するかを観察します。
論文 参考訳(メタデータ) (2022-04-04T09:38:38Z) - MoReL: Multi-omics Relational Learning [26.484803417186384]
ヘテロジニアスビューの分子間相互作用をコードする多部グラフを効率的に推定する新しいディープベイズ生成モデルを提案する。
このようなディープベイズ生成モデルにおける最適輸送正則化により、ビュー固有側情報を組み込むだけでなく、分布ベース正則化によるモデルの柔軟性も向上する。
論文 参考訳(メタデータ) (2022-03-15T02:50:07Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Meta Learning for Causal Direction [29.00522306460408]
小型データ設定における原因と効果の区別を可能にする新しい生成モデルを提案する。
提案手法は, 各種合成データと実世界のデータを用いて実証し, 種々のデータセットサイズにおける方向検出の精度を高い精度で維持可能であることを示す。
論文 参考訳(メタデータ) (2020-07-06T15:12:05Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。