論文の概要: Breiman's two cultures: You don't have to choose sides
- arxiv url: http://arxiv.org/abs/2104.12219v1
- Date: Sun, 25 Apr 2021 17:58:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:51:41.464653
- Title: Breiman's two cultures: You don't have to choose sides
- Title(参考訳): breiman氏の2つの文化: どちらかを選ぶ必要はありません
- Authors: Andrew C. Miller, Nicholas J. Foti, Emily B. Fox
- Abstract要約: Breiman氏の古典的な論文は、2つの文化の選択肢としてデータ分析をキャストする。
データモデラーは、データ解析によく理解された理論的特性を持つ単純な解釈可能なモデルを使用する。
アルゴリズムモデラーは予測精度を優先順位付けし、より柔軟な関数近似を用いてデータを分析する。
- 参考スコア(独自算出の注目度): 10.695407438192527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Breiman's classic paper casts data analysis as a choice between two cultures:
data modelers and algorithmic modelers. Stated broadly, data modelers use
simple, interpretable models with well-understood theoretical properties to
analyze data. Algorithmic modelers prioritize predictive accuracy and use more
flexible function approximations to analyze data. This dichotomy overlooks a
third set of models $-$ mechanistic models derived from scientific theories
(e.g., ODE/SDE simulators). Mechanistic models encode application-specific
scientific knowledge about the data. And while these categories represent
extreme points in model space, modern computational and algorithmic tools
enable us to interpolate between these points, producing flexible,
interpretable, and scientifically-informed hybrids that can enjoy accurate and
robust predictions, and resolve issues with data analysis that Breiman
describes, such as the Rashomon effect and Occam's dilemma. Challenges still
remain in finding an appropriate point in model space, with many choices on how
to compose model components and the degree to which each component informs
inferences.
- Abstract(参考訳): Breiman氏の古典的な論文は、データ解析を2つの文化 – データモデラーとアルゴリズムモデラー – の選択として挙げている。
広く述べられているように、データモデラーは、データ分析のためによく理解された理論特性を持つシンプルで解釈可能なモデルを使用する。
アルゴリズムモデラーは予測精度を優先順位付けし、より柔軟な関数近似を用いてデータを分析する。
この二分法は、科学理論(ODE/SDEシミュレータなど)に由来する$$$メカニスティックモデルの第3の集合を見渡す。
メカニスティックモデルは、データに関するアプリケーション固有の科学的知識を符号化する。
これらのカテゴリはモデル空間の極端な点を表すが、現代の計算とアルゴリズムのツールはこれらの点間の補間を可能にし、柔軟で解釈可能で科学的にインフォームドなハイブリッドを生成し、正確で堅牢な予測を楽しむことができ、レイマンが記述したラショモン効果やオッカムのジレンマのようなデータ解析の問題を解決する。
モデルコンポーネントの構成方法や各コンポーネントが推論を通知する程度については、多くの選択肢がある。
関連論文リスト
- Interpretable and Scalable Graphical Models for Complex Spatio-temporal
Processes [3.469001874498102]
論文は、複雑な時間構造を持つデータと、解釈可能かつ解釈可能な方法で構造を学ぶ確率的グラフィカルモデルに焦点を当てている。
この方法論の実践的応用は、実際のデータセットを用いて検討される。
これには、データを用いた脳接続分析、太陽画像データを用いた宇宙天気予報、Twitterデータを用いた世論の縦断的分析、TalkLifeデータを用いたメンタルヘルス関連の問題のマイニングが含まれる。
論文 参考訳(メタデータ) (2023-01-15T05:39:30Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Design of Dynamic Experiments for Black-Box Model Discrimination [72.2414939419588]
選択したいような動的モデル判別の設定を考えてみましょう。 (i) 最高のメカニスティックな時間変化モデルと (ii) 最高のモデルパラメータ推定値です。
勾配情報にアクセス可能な競合する力学モデルに対しては、既存の手法を拡張し、より広い範囲の問題の不確実性を組み込む。
これらのブラックボックスモデルをガウス過程サロゲートモデルに置き換えることで、モデル識別設定を拡張して、競合するブラックボックスモデルをさらに取り入れる。
論文 参考訳(メタデータ) (2021-02-07T11:34:39Z) - Understanding Neural Abstractive Summarization Models via Uncertainty [54.37665950633147]
seq2seq抽象要約モデルは、自由形式の方法でテキストを生成する。
モデルのトークンレベルの予測のエントロピー、すなわち不確実性について検討する。
要約とテキスト生成モデルをより広範囲に解析する上で,不確実性は有用であることを示す。
論文 参考訳(メタデータ) (2020-10-15T16:57:27Z) - Deducing neighborhoods of classes from a fitted model [68.8204255655161]
本稿では,新しいタイプの解釈可能な機械学習手法を提案する。
量子シフトを用いた分類モデルでは、特徴空間の予測クラスへの分割を理解するのに役立ちます。
基本的に、実際のデータポイント(または特定の関心点)を使用し、特定の特徴をわずかに引き上げたり減少させたりした後の予測の変化を観察する。
論文 参考訳(メタデータ) (2020-09-11T16:35:53Z) - A Bayesian machine scientist to aid in the solution of challenging
scientific problems [0.0]
ベイジアン・マシン・サイエンティストは、モデルよりも正確な辺縁後部への明示的な近似を用いてモデルの妥当性を確立する。
マルコフ連鎖モンテカルロを用いてモデル空間を探索する。
提案手法は,合成および実データの正確なモデルを明らかにし,既存の手法よりも高精度なサンプル外予測を提供する。
論文 参考訳(メタデータ) (2020-04-25T14:42:13Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z) - Predicting Multidimensional Data via Tensor Learning [0.0]
本研究では,本データセットの内在的多次元構造を保持するモデルを開発する。
モデルパラメータを推定するために、オルタネート・リースト・スクエアスアルゴリズムを開発した。
提案モデルは,予測文献に存在するベンチマークモデルより優れている。
論文 参考訳(メタデータ) (2020-02-11T11:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。