論文の概要: Confirmation Bias in Gaussian Mixture Models
- arxiv url: http://arxiv.org/abs/2408.09718v1
- Date: Mon, 19 Aug 2024 06:18:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 17:34:18.804876
- Title: Confirmation Bias in Gaussian Mixture Models
- Title(参考訳): ガウス混合モデルにおける確認バイアス
- Authors: Amnon Balanov, Tamir Bendory, Wasim Huleihel,
- Abstract要約: 本研究ではガウス混合モデルにおける確認バイアスについて検討する。
ある科学者チームは、ガウス混合モデルから得られたデータを、既知の信号(仮説)をセントロイドとして分析していると推測している。
実際には、観測は情報構造を持たないノイズで構成されている。
- 参考スコア(独自算出の注目度): 10.62347045435943
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Confirmation bias, the tendency to interpret information in a way that aligns with one's preconceptions, can profoundly impact scientific research, leading to conclusions that reflect the researcher's hypotheses even when the observational data do not support them. This issue is especially critical in scientific fields involving highly noisy observations, such as cryo-electron microscopy. This study investigates confirmation bias in Gaussian mixture models. We consider the following experiment: A team of scientists assumes they are analyzing data drawn from a Gaussian mixture model with known signals (hypotheses) as centroids. However, in reality, the observations consist entirely of noise without any informative structure. The researchers use a single iteration of the K-means or expectation-maximization algorithms, two popular algorithms to estimate the centroids. Despite the observations being pure noise, we show that these algorithms yield biased estimates that resemble the initial hypotheses, contradicting the unbiased expectation that averaging these noise observations would converge to zero. Namely, the algorithms generate estimates that mirror the postulated model, although the hypotheses (the presumed centroids of the Gaussian mixture) are not evident in the observations. Specifically, among other results, we prove a positive correlation between the estimates produced by the algorithms and the corresponding hypotheses. We also derive explicit closed-form expressions of the estimates for a finite and infinite number of hypotheses. This study underscores the risks of confirmation bias in low signal-to-noise environments, provides insights into potential pitfalls in scientific methodologies, and highlights the importance of prudent data interpretation.
- Abstract(参考訳): 確認バイアス(英: confirmation bias)とは、自分の先入観と一致する方法で情報を解釈する傾向であり、科学的研究に大きな影響を及ぼし、観測データがそれらをサポートしない場合でも、研究者の仮説を反映する結論となる。
この問題は、低温電子顕微鏡のような非常にノイズの多い観測を含む科学分野において特に重要である。
本研究ではガウス混合モデルにおける確認バイアスについて検討する。
ある科学者チームは、ガウスの混合モデルから得られたデータを、既知の信号(仮説)をセントロイドとして分析していると仮定しています。
しかし、実際には、観測は情報構造を持たないノイズで成っている。
研究者たちは、K平均または期待最大化アルゴリズムの1つのイテレーション、すなわち2つの一般的なアルゴリズムを使って、セントロイドを推定する。
純粋なノイズであるにもかかわらず、これらのアルゴリズムは初期仮説に類似した偏りのある推定値を示し、平均的なノイズ観測が0に収束するという偏りのない予想に反している。
すなわち、アルゴリズムは仮定(ガウス混合の推定遠心点)は観測では明らかでないが、仮定されたモデルを反映する推定を生成する。
具体的には,アルゴリズムが生成した推定値とそれに対応する仮説との正の相関を証明した。
また、有限かつ無限の仮説に対する推定値の明示的な閉形式式も導出する。
本研究は,低信号・雑音環境における確証バイアスのリスクを浮き彫りにし,科学的手法における潜在的な落とし穴についての洞察を提供し,思慮深いデータ解釈の重要性を強調した。
関連論文リスト
- Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Biases in Inverse Ising Estimates of Near-Critical Behaviour [0.0]
逆推論は、ペアワイズ相互作用を経験的相関から再構成することを可能にする。
Pseudo-likelihood (PLM) などの推定値に偏りが認められた。
データ駆動法は神経科学による機能的磁気共鳴イメージング(fMRI)データセットに研究され応用された。
論文 参考訳(メタデータ) (2023-01-13T14:01:43Z) - Chilled Sampling for Uncertainty Quantification: A Motivation From A
Meteorological Inverse Problem [1.688134675717698]
勾配に基づくマルコフ連鎖モンテカルロアルゴリズムを用いて(予測)推定誤差の評価を行った。
主な貢献は、点推定の近傍における後部分布の局所的な近似をサンプリングする「ここでの冷却」と呼ばれる一般的な戦略を提案することである。
論文 参考訳(メタデータ) (2022-07-07T09:23:03Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Correct block-design experiments mitigate temporal correlation bias in
EEG classification [68.85562949901077]
[1]の主主張は極めて過大評価されており、他の分析は間違った方法論的選択によって深刻な欠陥を負っていることを示す。
脳波の時間相関が2つの実験環境で同じモデルをテストすることによって分類精度に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2020-11-25T22:25:21Z) - Reducing the Variance of Variational Estimates of Mutual Information by
Limiting the Critic's Hypothesis Space to RKHS [0.0]
相互情報(英: Mutual Information、MI)は、2つの確率変数間の依存性に関する情報理論の尺度である。
近年の手法では、未知密度比を近似するニューラルネットワークとしてパラメトリック確率分布や批判が実現されている。
我々は、高分散特性は、批評家の仮説空間の制御不能な複雑さに起因すると論じる。
論文 参考訳(メタデータ) (2020-11-17T14:32:48Z) - Neural Empirical Bayes: Source Distribution Estimation and its
Applications to Simulation-Based Inference [9.877509217895263]
ニューラルネットワークによる経験的ベイズ手法は,地中真理源分布を復元する。
また,コライダー物理の逆問題に対するニューラル経験ベイズの適用性を示す。
論文 参考訳(メタデータ) (2020-11-11T14:59:34Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。