論文の概要: Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework
- arxiv url: http://arxiv.org/abs/2207.10721v1
- Date: Thu, 21 Jul 2022 19:15:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 13:45:09.755710
- Title: Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework
- Title(参考訳): 拡張クラッシュ予測のためのヘテロジニアスアンサンブル学習 - 頻繁かつ機械学習ベースのスタックフレームワーク
- Authors: Numan Ahmad, Behram Wali, Asad J. Khattak
- Abstract要約: 本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
- 参考スコア(独自算出の注目度): 0.803552105641624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A variety of statistical and machine learning methods are used to model crash
frequency on specific roadways with machine learning methods generally having a
higher prediction accuracy. Recently, heterogeneous ensemble methods (HEM),
including stacking, have emerged as more accurate and robust intelligent
techniques and are often used to solve pattern recognition problems by
providing more reliable and accurate predictions. In this study, we apply one
of the key HEM methods, Stacking, to model crash frequency on five lane
undivided segments (5T) of urban and suburban arterials. The prediction
performance of Stacking is compared with parametric statistical models (Poisson
and negative binomial) and three state of the art machine learning techniques
(Decision tree, random forest, and gradient boosting), each of which is termed
as the base learner. By employing an optimal weight scheme to combine
individual base learners through stacking, the problem of biased predictions in
individual base-learners due to differences in specifications and prediction
accuracies is avoided. Data including crash, traffic, and roadway inventory
were collected and integrated from 2013 to 2017. The data are split into
training, validation, and testing datasets. Estimation results of statistical
models reveal that besides other factors, crashes increase with density (number
per mile) of different types of driveways. Comparison of out-of-sample
predictions of various models confirms the superiority of Stacking over the
alternative methods considered. From a practical standpoint, stacking can
enhance prediction accuracy (compared to using only one base learner with a
particular specification). When applied systemically, stacking can help
identify more appropriate countermeasures.
- Abstract(参考訳): 様々な統計的および機械学習手法を用いて、特定の道路の衝突頻度を予測精度の高い機械学習手法でモデル化する。
近年、スタック化を含む異種アンサンブル法(HEM)は、より正確で堅牢なインテリジェントな手法として登場し、より信頼性が高く正確な予測を提供することで、パターン認識の問題を解決するためにしばしば用いられる。
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と、機械学習技術の3つの状態(決定木、ランダム森林、勾配促進)を比較し、それぞれをベースラーナーと呼ぶ。
個々のベース学習者を積み重ねによって結合する最適重みスキームを用いることにより、仕様や予測精度の相違による個々のベース学習者におけるバイアス付き予測の問題を回避する。
事故、交通、道路の在庫を含むデータは2013年から2017年にかけて収集、統合された。
データはトレーニング、検証、テストデータセットに分割される。
統計モデルの推定結果は、他の要因に加えて、衝突は異なる種類のドライブウェイの密度(1マイルあたりの数)とともに増加することを示している。
様々なモデルのサンプル外予測の比較により、検討した代替手法よりもスタックの優位性が確認される。
実用的な見地からすると、スタック化は予測精度を高めることができる(特定の仕様を持つ1つのベース学習者のみを使用することと比較できる)。
体系的に適用される場合、スタックはより適切な対策を特定するのに役立つ。
関連論文リスト
- Awareness of uncertainty in classification using a multivariate model and multi-views [1.3048920509133808]
提案モデルでは,不確かさ予測を正規化し,予測と不確かさ推定の両方を計算する訓練を行う。
複数ビュー予測と不確かさと信頼度を考慮し、最終的な予測を計算する方法をいくつか提案した。
提案手法はクリーンでノイズの多いラベル付きCIFAR-10データセットを用いて検証した。
論文 参考訳(メタデータ) (2024-04-16T06:40:51Z) - Blending gradient boosted trees and neural networks for point and
probabilistic forecasting of hierarchical time series [0.0]
本稿では、勾配木やニューラルネットワークファミリーに属する機械学習モデルのブレンディング手法について述べる。
これらの原則は、最近のM5コンペティションにおいて、正確性と不確実性の両方のトラックでうまく適用された。
論文 参考訳(メタデータ) (2023-10-19T09:42:02Z) - Context-Aware Ensemble Learning for Time Series [11.716677452529114]
本稿では,ベースモデルの特徴ベクトルの結合である特徴のスーパーセットを用いて,ベースモデル予測を効果的に組み合わせたメタ学習手法を提案する。
我々のモデルは、ベースモデルの予測を機械学習アルゴリズムの入力として使用するのではなく、問題の状態に基づいて各時点における最良の組み合わせを選択する。
論文 参考訳(メタデータ) (2022-11-30T10:36:13Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z) - Engineering the Neural Automatic Passenger Counter [0.0]
我々は、信頼性、性能、そして品質のカウントを向上させるために、機械学習の様々な側面を探求し、活用する。
アンサンブル量子化のようなアグリゲーション技術がバイアスを減少させる方法を示し、その結果の全体的拡散について考察する。
論文 参考訳(メタデータ) (2022-03-02T14:56:11Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。