論文の概要: Bridging Breiman's Brook: From Algorithmic Modeling to Statistical
Learning
- arxiv url: http://arxiv.org/abs/2102.12328v1
- Date: Tue, 23 Feb 2021 03:38:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 07:27:20.983559
- Title: Bridging Breiman's Brook: From Algorithmic Modeling to Statistical
Learning
- Title(参考訳): Bridging Breiman's Brook:アルゴリズムモデリングから統計的学習へ
- Authors: Lucas Mentch and Giles Hooker
- Abstract要約: 2001年、レオ・ブレイマンは「データモデリング」と「アルゴリズムモデリング」の文化の違いについて書いた。
20年後のこの区分は、個人をキャンプに割り当てること、知的境界の両面で、はるかに短命であると感じた。
これは主に、アルゴリズムメソッドをツールボックスに組み込んだ「データモデラー」によるものだと主張しています。
- 参考スコア(独自算出の注目度): 6.837936479339647
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In 2001, Leo Breiman wrote of a divide between "data modeling" and
"algorithmic modeling" cultures. Twenty years later this division feels far
more ephemeral, both in terms of assigning individuals to camps, and in terms
of intellectual boundaries. We argue that this is largely due to the "data
modelers" incorporating algorithmic methods into their toolbox, particularly
driven by recent developments in the statistical understanding of Breiman's own
Random Forest methods. While this can be simplistically described as "Breiman
won", these same developments also expose the limitations of the
prediction-first philosophy that he espoused, making careful statistical
analysis all the more important. This paper outlines these exciting recent
developments in the random forest literature which, in our view, occurred as a
result of a necessary blending of the two ways of thinking Breiman originally
described. We also ask what areas statistics and statisticians might currently
overlook.
- Abstract(参考訳): 2001年、レオ・ブレイマンは「データモデリング」と「アルゴリズムモデリング」の文化の違いについて書いた。
20年後のこの区分は、個人をキャンプに割り当てること、知的境界の両面で、はるかに短命であると感じた。
これは主に、アルゴリズムの手法をツールボックスに組み込んだ「データモデラー」によるものであり、特にブレマン自身のランダムフォレスト手法の統計的理解における最近の進歩に起因している。
これは「ブリーマン・ウォン(breiman won)」と簡潔に表現できるが、これら同じ発展は彼が提唱した予測優先哲学の限界を露呈し、注意深い統計分析がより重要である。
本論文では,ブレイマンが最初に記述した2つの考え方を融合させた結果として生じた,ランダムな森林文学におけるこれらのエキサイティングな最近の展開について概説する。
また、統計と統計学者が現在見落としている領域も尋ねます。
関連論文リスト
- Causal Estimation of Memorisation Profiles [58.20086589761273]
言語モデルにおける記憶の理解は、実践的および社会的意味を持つ。
覚書化(英: Memorisation)とは、モデルがそのインスタンスを予測できる能力に対して、あるインスタンスでトレーニングを行うことによる因果的影響である。
本稿では,計量学の差分差分設計に基づく,新しい,原理的,効率的な記憶推定法を提案する。
論文 参考訳(メタデータ) (2024-06-06T17:59:09Z) - Extracting or Guessing? Improving Faithfulness of Event Temporal
Relation Extraction [87.04153383938969]
本研究では,TempRel抽出モデルの忠実度を2つの観点から改善する。
第1の視点は、文脈記述に基づいて真に抽出することである。
第2の視点は、適切な不確実性評価を提供することである。
論文 参考訳(メタデータ) (2022-10-10T19:53:13Z) - The "given data" paradigm undermines both cultures [0.0]
データは矢印付きの「ブラックボックス」に強制され、それから第2の矢印によって触媒され、出力に変換される。
ブレイマンは、統計学における2つの文化の区別をカプセル化したものとして、この視覚の2つの解釈を提唱している。
このコメントでは、統計学のより広い視点で議論し、そのために、統計的革新と実践のための実りある領域として「前」と「後」の質問を高めます。
論文 参考訳(メタデータ) (2021-05-26T11:22:06Z) - Breiman's two cultures: You don't have to choose sides [10.695407438192527]
Breiman氏の古典的な論文は、2つの文化の選択肢としてデータ分析をキャストする。
データモデラーは、データ解析によく理解された理論的特性を持つ単純な解釈可能なモデルを使用する。
アルゴリズムモデラーは予測精度を優先順位付けし、より柔軟な関数近似を用いてデータを分析する。
論文 参考訳(メタデータ) (2021-04-25T17:58:46Z) - Revisiting Rashomon: A Comment on "The Two Cultures" [95.81740983484471]
Breiman氏は「Rashomon Effect」と呼び、予測精度基準を等しく満たす多くのモデルが存在するが、情報を実質的に異なる方法で処理する状況について説明した。
この現象は、データに適合するモデルに基づいて結論を導き出すか、意思決定を自動化することを困難にします。
私は、この問題の意義を探求する機械学習文学における最近の研究と関係しています。
論文 参考訳(メタデータ) (2021-04-05T20:51:58Z) - Comments on Leo Breiman's paper 'Statistical Modeling: The Two Cultures'
(Statistical Science, 2001, 16(3), 199-231) [1.2183405753834562]
ブレマンは統計学者に、より広く考え、未知のモデルのない学習世界に踏み込むよう求めた。
新たなフロンティアが出現し、学習アルゴリズムの役割、影響、安定性が予測品質によって測定されるのではなく、推論によって測定されるようになる。
論文 参考訳(メタデータ) (2021-03-21T07:40:37Z) - Why do classifier accuracies show linear trends under distribution
shift? [58.40438263312526]
あるデータ分布上のモデルの精度は、別の分布上の精度のほぼ線形関数である。
2つのモデルが予測で一致する確率は、精度レベルだけで推測できるものよりも高いと仮定します。
分布シフトの大きさが大きければ, 2 つの分布のモデルを評価する場合, 線形傾向が生じなければならない。
論文 参考訳(メタデータ) (2020-12-31T07:24:30Z) - A Bayesian Perspective on Training Speed and Model Selection [51.15664724311443]
モデルのトレーニング速度の測定値を用いて,その限界確率を推定できることを示す。
線形モデルと深部ニューラルネットワークの無限幅限界に対するモデル選択タスクの結果を検証する。
以上の結果から、勾配勾配勾配で訓練されたニューラルネットワークが、一般化する関数に偏りがある理由を説明するための、有望な新たな方向性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T17:56:14Z) - Understanding Neural Abstractive Summarization Models via Uncertainty [54.37665950633147]
seq2seq抽象要約モデルは、自由形式の方法でテキストを生成する。
モデルのトークンレベルの予測のエントロピー、すなわち不確実性について検討する。
要約とテキスト生成モデルをより広範囲に解析する上で,不確実性は有用であることを示す。
論文 参考訳(メタデータ) (2020-10-15T16:57:27Z) - Breiman's "Two Cultures" Revisited and Reconciled [0.0]
データモデリングの2つの文化:パラメトリック統計とアルゴリズム機械学習。
2つの文化」の間のギャップは、それらを一貫性のある全体と組み合わせる方法を見つけない限り、避けられません。
本稿は,2つの文化の関連性を確立することで,その解決策を提示する。
論文 参考訳(メタデータ) (2020-05-27T19:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。