論文の概要: Do We Really Sample Right In Model-Based Diagnosis?
- arxiv url: http://arxiv.org/abs/2009.12178v2
- Date: Thu, 4 Aug 2022 14:43:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 22:57:30.460052
- Title: Do We Really Sample Right In Model-Based Diagnosis?
- Title(参考訳): モデルベース診断は本当に正しいのか?
- Authors: Patrick Rodler and Fatima Elichanova
- Abstract要約: 本研究は, 断層説明に関する推定値を用いて, 生成したサンプルの表現性について検討する。
サンプルサイズ, サンプリング効率と効果率の最適トレードオフについて検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Statistical samples, in order to be representative, have to be drawn from a
population in a random and unbiased way. Nevertheless, it is common practice in
the field of model-based diagnosis to make estimations from (biased) best-first
samples. One example is the computation of a few most probable possible fault
explanations for a defective system and the use of these to assess which aspect
of the system, if measured, would bring the highest information gain.
In this work, we scrutinize whether these statistically not well-founded
conventions, that both diagnosis researchers and practitioners have adhered to
for decades, are indeed reasonable. To this end, we empirically analyze various
sampling methods that generate fault explanations. We study the
representativeness of the produced samples in terms of their estimations about
fault explanations and how well they guide diagnostic decisions, and we
investigate the impact of sample size, the optimal trade-off between sampling
efficiency and effectivity, and how approximate sampling techniques compare to
exact ones.
- Abstract(参考訳): 統計的サンプルは、代表的であるためには、ランダムで偏りのない方法で人口から引き出さなければならない。
しかしながら、モデルに基づく診断の分野では、(バイアスのある)ベストファーストサンプルから推定を行うのが一般的である。
1つの例は、欠陥のあるシステムに対する最も可能性の高い障害説明の計算と、これらを使用して、もし測定された場合、システムのどの側面が最高の情報を得るかを評価することである。
本研究は、診断研究者と臨床医が何十年にもわたって遵守してきた、統計的に確立されていない慣行が妥当かどうかを精査するものである。
そこで本研究では,故障説明を生成する様々なサンプリング手法を実証的に分析する。
本研究は, 生成したサンプルの代表性について, 故障説明に対する推定値, 診断判断の導出方法などの観点から検討し, サンプルサイズの影響, サンプリング効率と有効性との最適トレードオフ, 正確なサンプリング手法との比較について検討した。
関連論文リスト
- Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Evaluating Causal Inference Methods [0.4588028371034407]
我々は、因果推論手法を検証するために、深層生成モデルに基づくフレームワーク、クレデンスを導入する。
我々の研究は、因果推論手法を検証するために、深層生成モデルに基づくフレームワーク、クレデンスを導入している。
論文 参考訳(メタデータ) (2022-02-09T00:21:22Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - The Pitfalls of Sample Selection: A Case Study on Lung Nodule
Classification [13.376247652484274]
肺結節分類では, LIDCデータセットについて多くの研究結果が報告されており, 理論的には, 提案手法の性能を直接比較し, 個人の貢献が与える影響を評価することが期待できる。
それぞれが異なるデータ選択プロセスを採用しており,良性と悪性の症例の総数と比率が大きく異なることが判明した。
特定の選択がデータ分布に深刻な影響を与える可能性があることを示し、あるサンプル分布において優れた性能を達成できるが、別のサンプル分布では達成できない可能性があることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:07:07Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - A Causal Direction Test for Heterogeneous Populations [10.653162005300608]
ほとんどの因果モデルでは、単一の同質な集団を仮定するが、これは多くの応用において成り立たない仮定である。
等質性仮定に違反した場合、そのような仮定に基づいて開発された因果モデルが正しい因果方向を識別できないことを示す。
我々は,$k$-means型クラスタリングアルゴリズムを用いて,一般的な因果方向検定統計量の調整を提案する。
論文 参考訳(メタデータ) (2020-06-08T18:59:14Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Overly Optimistic Prediction Results on Imbalanced Data: a Case Study of
Flaws and Benefits when Applying Over-sampling [13.463035357173045]
データを相互に排他的なトレーニングとテストセットに分割する前にオーバーサンプリングを適用する。
この結果が,2つの人工データセットを用いて偏りを生じさせ,この欠陥が同定された研究結果を再現することを示す。
論文 参考訳(メタデータ) (2020-01-15T12:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。