論文の概要: Introduction to Rare-Event Predictive Modeling for Inferential
Statisticians -- A Hands-On Application in the Prediction of Breakthrough
Patents
- arxiv url: http://arxiv.org/abs/2003.13441v2
- Date: Mon, 1 Mar 2021 14:36:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 06:51:39.725086
- Title: Introduction to Rare-Event Predictive Modeling for Inferential
Statisticians -- A Hands-On Application in the Prediction of Breakthrough
Patents
- Title(参考訳): inferential statisticians (inferential statisticians) のレアイベント予測モデリング入門 - ブレークスルー特許の予測への応用-
- Authors: Daniel Hain, Roman Jurowetzki
- Abstract要約: 本稿では,予測性能の最適化を目的とした定量的分析のための機械学習(ML)手法を提案する。
両フィールド間の潜在的な相乗効果について考察する。
我々は,コンピュータサイエンスの用語のデミスティフィケーションを目指して,定量的な社会科学の聴衆に手持ちの予測モデルの導入を行っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have seen a substantial development of quantitative methods,
mostly led by the computer science community with the goal of developing better
machine learning applications, mainly focused on predictive modeling. However,
economic, management, and technology forecasting research has so far been
hesitant to apply predictive modeling techniques and workflows. In this paper,
we introduce a machine learning (ML) approach to quantitative analysis geared
towards optimizing the predictive performance, contrasting it with standard
practices inferential statistics, which focus on producing good parameter
estimates. We discuss the potential synergies between the two fields against
the backdrop of this, at first glance, target-incompatibility. We discuss
fundamental concepts in predictive modeling, such as out-of-sample model
validation, variable and model selection, generalization, and hyperparameter
tuning procedures. We are providing a hands-on predictive modeling introduction
for a quantitative social science audience while aiming at demystifying
computer science jargon. We use the illustrative example of patent quality
estimation - which should be a familiar topic of interest in the Scientometrics
community - guiding the reader through various model classes and procedures for
data pre-processing, modeling, and validation. We start off with more familiar
easy to interpret model classes (Logit and Elastic Nets), continues with less
familiar non-parametric approaches (Classification Trees, Random Forest,
Gradient Boosted Trees), and finally presents artificial neural network
architectures, first a simple feed-forward and then a deep autoencoder geared
towards rare-event prediction.
- Abstract(参考訳): 近年は定量的手法が大幅に発展し、主にコンピュータサイエンスコミュニティが主導し、予測モデリングに重点を置く機械学習アプリケーションの開発を目標にしている。
しかし、これまでのところ、経済、経営、技術予測の研究は予測モデリング技術やワークフローの適用をためらっている。
本稿では,予測性能の最適化を目的とした定量的分析のための機械学習(ML)アプローチを提案する。
この2つのフィールド間の潜在的なシナジーについて、一見すると目標非互換性の背景から議論する。
本稿では,モデル検証,変数選択,モデル選択,一般化,ハイパーパラメータチューニング手順といった予測モデリングの基本概念について述べる。
我々は,コンピュータサイエンスの用語のデミスティフィケーションを目指して,定量的社会科学の聴衆に手持ちの予測モデルの導入を行っている。
特許品質推定の例 — サイエントメトリックスコミュニティではおなじみのトピックであるべき – を使って,さまざまなモデルクラスとデータ前処理,モデリング,検証手順を通じて読者をガイドしています。
まず、モデルクラス(ロジットと弾性ネット)を解釈し、あまり馴染みのない非パラメトリックなアプローチ(分類木、ランダムフォレスト、勾配ブーストツリー)で継続し、最後に、単純なフィードフォワード、そしてレアイベント予測のためのディープオートエンコーダという、ニューラルネットワークアーキテクチャを提示します。
関連論文リスト
- SynthTree: Co-supervised Local Model Synthesis for Explainable Prediction [15.832975722301011]
本稿では,最小限の精度で説明可能性を向上させる手法を提案する。
我々は,AI技術を利用してノードを推定する新しい手法を開発した。
我々の研究は、統計的方法論が説明可能なAIを前進させる上で重要な役割を担っている。
論文 参考訳(メタデータ) (2024-06-16T14:43:01Z) - Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Enhancing Dynamical System Modeling through Interpretable Machine
Learning Augmentations: A Case Study in Cathodic Electrophoretic Deposition [0.8796261172196743]
本稿では,物理システムのモデリング向上を目的とした包括的データ駆動フレームワークを提案する。
実証的応用として,電顕的電気泳動沈着(EPD)のモデル化を追求する。
論文 参考訳(メタデータ) (2024-01-16T14:58:21Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Towards a Prediction of Machine Learning Training Time to Support
Continuous Learning Systems Development [5.207307163958806]
我々は全文を実証研究する。
ZhengらによるFPTC(Time Complexity)アプローチ。
本稿では,ロジスティック回帰とランダムフォレスト分類のための定式化について検討する。
本研究では,本研究から,学習時間の予測が文脈とどのように密接に関連しているかを観察する。
論文 参考訳(メタデータ) (2023-09-20T11:35:03Z) - A review of predictive uncertainty estimation with machine learning [0.0]
機械学習アルゴリズムを用いて予測不確実性推定の話題を概観する。
我々は確率的予測を評価するための関連する指標(一貫性スコアリング関数と適切なスコアリングルール)について論じる。
このレビューでは、ユーザーのニーズに合わせて新しいアルゴリズムを開発する方法についての理解を深める。
論文 参考訳(メタデータ) (2022-09-17T10:36:30Z) - Predictive machine learning for prescriptive applications: a coupled
training-validating approach [77.34726150561087]
規範的応用のための予測機械学習モデルをトレーニングするための新しい手法を提案する。
このアプローチは、標準的なトレーニング検証テストスキームの検証ステップを微調整することに基づいている。
合成データを用いたいくつかの実験は、決定論的モデルと実モデルの両方において処方料コストを削減できる有望な結果を示した。
論文 参考訳(メタデータ) (2021-10-22T15:03:20Z) - Hessian-based toolbox for reliable and interpretable machine learning in
physics [58.720142291102135]
本稿では,モデルアーキテクチャの解釈可能性と信頼性,外挿を行うためのツールボックスを提案する。
与えられたテストポイントでの予測に対する入力データの影響、モデル予測の不確実性の推定、およびモデル予測の不可知スコアを提供する。
我々の研究は、物理学やより一般的には科学に適用されたMLにおける解釈可能性と信頼性の方法の体系的利用への道を開く。
論文 参考訳(メタデータ) (2021-08-04T16:32:59Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z) - Goal-Directed Planning for Habituated Agents by Active Inference Using a
Variational Recurrent Neural Network [5.000272778136268]
本研究では, 予測符号化(PC)とアクティブ推論(AIF)フレームワークが, 低次元潜在状態空間における事前分布を学習することにより, より優れた一般化を実現できることを示す。
提案モデルでは, 最適潜伏変数を推定し, 実験結果の最小化のためのシナプス重みを推定することにより学習を行う。
提案手法は,シミュレーションにおけるロボットタスクと複雑なロボットタスクの両方を用いて評価し,限られた学習データを用いた学習における十分な一般化を実証した。
論文 参考訳(メタデータ) (2020-05-27T06:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。