論文の概要: Detect and Correct Bias in Multi-Site Neuroimaging Datasets
- arxiv url: http://arxiv.org/abs/2002.05049v2
- Date: Tue, 27 Oct 2020 20:11:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 19:56:01.018008
- Title: Detect and Correct Bias in Multi-Site Neuroimaging Datasets
- Title(参考訳): マルチサイト・ニューロイメージング・データセットにおけるバイアスの検出と補正
- Authors: Christian Wachinger and Anna Rieckmann and Sebastian P\"olsterl
- Abstract要約: 神経画像のバイアスを調べるため、17の研究で脳の35,320個の磁気共鳴画像を合成した。
我々は、しばしば観察研究における主要な欠点と見なされる共起バイアスについて、より詳しく検討する。
我々は最近導入されたComBatアルゴリズムを拡張し、画像特徴間のグローバルな変動を制御する。
- 参考スコア(独自算出の注目度): 2.750124853532831
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The desire to train complex machine learning algorithms and to increase the
statistical power in association studies drives neuroimaging research to use
ever-larger datasets. The most obvious way to increase sample size is by
pooling scans from independent studies. However, simple pooling is often
ill-advised as selection, measurement, and confounding biases may creep in and
yield spurious correlations. In this work, we combine 35,320 magnetic resonance
images of the brain from 17 studies to examine bias in neuroimaging. In the
first experiment, Name That Dataset, we provide empirical evidence for the
presence of bias by showing that scans can be correctly assigned to their
respective dataset with 71.5% accuracy. Given such evidence, we take a closer
look at confounding bias, which is often viewed as the main shortcoming in
observational studies. In practice, we neither know all potential confounders
nor do we have data on them. Hence, we model confounders as unknown, latent
variables. Kolmogorov complexity is then used to decide whether the confounded
or the causal model provides the simplest factorization of the graphical model.
Finally, we present methods for dataset harmonization and study their ability
to remove bias in imaging features. In particular, we propose an extension of
the recently introduced ComBat algorithm to control for global variation across
image features, inspired by adjusting for population stratification in
genetics. Our results demonstrate that harmonization can reduce
dataset-specific information in image features. Further, confounding bias can
be reduced and even turned into a causal relationship. However, harmonziation
also requires caution as it can easily remove relevant subject-specific
information. Code is available at https://github.com/ai-med/Dataset-Bias.
- Abstract(参考訳): 複雑な機械学習アルゴリズムを訓練し、関連研究の統計力を高めたいという願望は、神経画像研究を、より大規模にデータセットを使用することに繋がる。
サンプルサイズを増やす最も明白な方法は、独立した研究からスキャンをプールすることである。
しかし、単純なプーリングは選択、測定、結合バイアスが潜り込み、スプリアス相関をもたらすため、しばしば不注意である。
本研究では、脳の3,320個の磁気共鳴画像を組み合わせて、ニューロイメージングのバイアスを調べる。
最初の実験では、71.5%の精度でスキャンをデータセットに正しく割り当てることができることを示すことにより、バイアスの存在に関する実証的な証拠を提供する。
このような証拠から、観測研究における主な欠点と見なされる共起バイアスについて、より詳しく検討する。
実際には、すべての潜在的な共同創設者を知らないし、データも持っていない。
したがって、共同設立者を未知の潜在変数としてモデル化する。
コルモゴロフ複雑性は、融合モデルまたは因果モデルがグラフィカルモデルの最も単純な分解を提供するかどうかを決定するために用いられる。
最後に,データセットの調和のための手法を提案し,画像特徴のバイアスを解消する能力について検討する。
特に,最近導入されたComBatアルゴリズムの拡張により,遺伝学における個体群階層化の調整に着想を得て,画像特徴のグローバルな変動を制御する。
この結果から,調和化は画像特徴のデータセット固有情報を低減できることが示された。
さらに、共起バイアスを低減し、因果関係にすることも可能である。
しかし、調和はまた、関連する主題固有の情報を容易に削除できるため注意が必要である。
コードはhttps://github.com/ai-med/dataset-biasで入手できる。
関連論文リスト
- Common-Sense Bias Discovery and Mitigation for Classification Tasks [16.8259488742528]
画像記述に基づいてデータセットの特徴クラスタを抽出するフレームワークを提案する。
解析された特徴と相関は人間に解釈可能であるので、我々はCommon-Sense Bias Discovery (CSBD) という手法を名づける。
実験の結果,2つのベンチマーク画像データセットに対して,複数の分類タスクに新たなバイアスが生じることがわかった。
論文 参考訳(メタデータ) (2024-01-24T03:56:07Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - The (de)biasing effect of GAN-based augmentation methods on skin lesion
images [3.441021278275805]
新しい医学データセットは、学習プロセスに影響を与える刺激的な相関の源であるかもしれない。
データ不均衡を軽減する1つのアプローチは、GAN(Generative Adversarial Networks)によるデータ拡張である。
この研究は、それらのバイアス継承と合成データがモデルにどのように影響するかを比較するために、無条件および条件付きGANを探索した。
論文 参考訳(メタデータ) (2022-06-30T10:32:35Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Intrinsic Bias Identification on Medical Image Datasets [9.054785751150547]
まず、データ固有のバイアス属性を定義し、次いで、医用画像データセットのための新しいバイアス識別フレームワークを提案する。
このフレームワークには、KlotskiNetとBias Discriminant Direction Analysis(bdda)という2つの主要なコンポーネントが含まれている。
3つのデータセットの実験結果から,フレームワークが検出したバイアス特性の有効性が示された。
論文 参考訳(メタデータ) (2022-03-24T06:28:07Z) - Pseudo Bias-Balanced Learning for Debiased Chest X-ray Classification [57.53567756716656]
本研究では, バイアスラベルを正確に把握せず, 脱バイアス胸部X線診断モデルの開発について検討した。
本稿では,まずサンプルごとのバイアスラベルをキャプチャし,予測する新しいアルゴリズム,擬似バイアスバランス学習を提案する。
提案手法は他の最先端手法よりも一貫した改善を実現した。
論文 参考訳(メタデータ) (2022-03-18T11:02:18Z) - Potential sources of dataset bias complicate investigation of
underdiagnosis by machine learning algorithms [20.50071537200745]
Seyed-Kalantariらは、3つの胸部X線データセットで訓練されたモデルが偽陽性率の差をもたらすことを発見した。
この研究は、これらのモデルが体系的な下垂体手術を展示し、潜在的に増幅していると結論付けている。
論文 参考訳(メタデータ) (2022-01-19T20:51:38Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。