論文の概要: Statistical modeling: the three cultures
- arxiv url: http://arxiv.org/abs/2012.04570v1
- Date: Tue, 8 Dec 2020 17:15:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 18:13:23.705863
- Title: Statistical modeling: the three cultures
- Title(参考訳): 統計的モデリング:三つの文化
- Authors: Adel Daoud and Devdatt Dubhashi
- Abstract要約: 20年前、Leo Breiman氏は統計モデルのための2つの文化を特定した。
データ・モデリング・カルチャー(DMC、Data Modeling culture)は、1つか数量の興味を統計的に推測することを目的とした実践である。
アルゴリズムモデリングカルチャー(アルゴリズムモデリングカルチャー、AMC)とは、関心事に関する正確な予測を生成する機械学習(ML)手順を定義するプラクティスを指す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Two decades ago, Leo Breiman identified two cultures for statistical
modeling. The data modeling culture (DMC) refers to practices aiming to conduct
statistical inference on one or several quantities of interest. The algorithmic
modeling culture (AMC) refers to practices defining a machine-learning (ML)
procedure that generates accurate predictions about an event of interest.
Breiman argued that statisticians should give more attention to AMC than to
DMC, because of the strengths of ML in adapting to data. While twenty years
later, DMC has lost some of its dominant role in statistics because of the
data-science revolution, we observe that this culture is still the leading
practice in the natural and social sciences. DMC is the modus operandi because
of the influence of the established scientific method, called the
hypothetico-deductive scientific method. Despite the incompatibilities of AMC
with this scientific method, among some research groups, AMC and DMC cultures
mix intensely. We argue that this mixing has formed a fertile spawning pool for
a mutated culture that we called the hybrid modeling culture (HMC) where
prediction and inference have fused into new procedures where they reinforce
one another. This article identifies key characteristics of HMC, thereby
facilitating the scientific endeavor and fueling the evolution of statistical
cultures towards better practices. By better, we mean increasingly reliable,
valid, and efficient statistical practices in analyzing causal relationships.
In combining inference and prediction, the result of HMC is that the
distinction between prediction and inference, taken to its limit, melts away.
We qualify our melting-away argument by describing three HMC practices, where
each practice captures an aspect of the scientific cycle, namely, ML for causal
inference, ML for data acquisition, and ML for theory prediction.
- Abstract(参考訳): 20年前、Leo Breiman氏は統計モデルのための2つの文化を特定した。
データ・モデリング・カルチャー(DMC、Data Modeling culture)は、1つか数量の興味を統計的に推測することを目的とした実践である。
アルゴリズムモデリングカルチャー(アルゴリズムモデリングカルチャー、AMC)とは、関心事に関する正確な予測を生成する機械学習(ML)手順を定義するプラクティスを指す。
統計学者はデータに適応するMLの強みのために、MCよりもAMCに注意を払うべきだと主張した。
20年後、dmcはデータサイエンス革命によって統計学において支配的な役割を失ったが、この文化は自然科学や社会科学において依然として主要な実践である。
DMCは、仮説導出科学的方法と呼ばれる確立された科学的方法の影響により、モダス・オペランディ(modus operandi)である。
AMCとこの科学的手法は相容れないが、一部の研究グループではAMCとDMCの文化が激しく混ざり合っている。
我々は, この混合が, ハイブリッド・モデリング・カルチャー (HMC) と呼ばれる変異培養のための受精プールを形成し, 予測と推論が互いに強化する新たな手順に融合したと主張している。
本稿では, HMC の重要な特徴を明らかにし, 科学的取り組みの促進と, より優れた実践に向けての統計文化の進化を促進する。
因果関係を解析する上で、信頼性、有効、効率的な統計プラクティスがますます多くなっていることを意味します。
推測と予測の組み合わせにおいて、HMCの結果は、予測と推論の区別が限界までとられ、解けてしまう。
それぞれの実践が科学サイクルの側面、すなわち因果推論のML、データ取得のML、理論予測のMLを捉えている。
関連論文リスト
- Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。
まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。
本稿では,実証的リスク最小化法(DEM)を提案する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Hypothesizing Missing Causal Variables with LLMs [55.28678224020973]
我々は、入力が欠落変数を持つ部分因果グラフであるような新しいタスクを定式化し、出力は部分グラフを完成させるための欠落変数に関する仮説である。
原因と効果の間の媒介変数を仮説化するLLMの強い能力を示す。
また,オープンソースモデルの一部がGPT-4モデルより優れているという驚くべき結果も得られた。
論文 参考訳(メタデータ) (2024-09-04T10:37:44Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Fairness and bias correction in machine learning for depression
prediction: results from four study populations [3.3136009643108038]
本稿では,うつ病の予測を目的とした機械学習モデルにおけるバイアスの体系的研究について述べる。
標準MLアプローチは、定期的にバイアスのある振る舞いを示す。
また、標準法と自己のポストホック法の両方による緩和技術は、不公平なバイアスのレベルを低減するのに有効であることを示す。
論文 参考訳(メタデータ) (2022-11-10T03:53:17Z) - Variational Inference for Additive Main and Multiplicative Interaction
Effects Models [0.0]
植物育種において、環境による遺伝子型(GxE)相互作用の存在は、栽培決定に強い影響を及ぼす。
本稿では,そのようなモデルに対する変分推論手法について考察する。
パラメータを推定するための変分近似を導出し、シミュレーションデータと実データの両方を用いてMCMCと比較する。
論文 参考訳(メタデータ) (2022-06-29T22:58:12Z) - The worst of both worlds: A comparative analysis of errors in learning
from data in psychology and machine learning [17.336655978572583]
機械学習(ML)が誤診や複製の危機に直面しているという最近の懸念は、ML研究で公表された主張の一部が対面価値で評価できないことを示唆している。
教師付きMLにおける研究の関心事は、実験科学における複製危機と共通している。
論文 参考訳(メタデータ) (2022-03-12T18:26:24Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z) - Composite Monte Carlo Decision Making under High Uncertainty of Novel
Coronavirus Epidemic Using Hybridized Deep Learning and Fuzzy Rule Induction [12.411873699109236]
政府や当局は高い不確実性の下で重要な決定を下すのに苦労している。
複合モンテカルロシミュレーションは、利用可能なデータを外挿する予測手法である。
深層学習ネットワークとファジィルール誘導は、疫病の発生に関するより良い洞察を得るために使用される。
論文 参考訳(メタデータ) (2020-03-22T11:58:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。