論文の概要、ライセンス

# (参考訳) テレマティクスによる夜間自動車の予測--マルチレベルアプローチ [全文訳有]

Nightly Automobile Claims Prediction from Telematics-Derived Features: A Multilevel Approach ( http://arxiv.org/abs/2205.04616v1 )

ライセンス: CC BY 4.0
Allen R. Williams, Yoolim Jin, Anthony Duer, Tuka Alhanai, Mohammad Ghassemi(参考訳) 近年では、ドライバーからgpsデータを収集し、そのデータをドライバーの自動車保険価格に組み込むことが可能になっている。 このデータを夜間に収集・処理し、各個別旅行の1マイルと時刻の要約と、旅行の属性(例えば、運転者の疲労や運転者の気遣いなど)を記述する一連の行動スコアからなるメタデータに分類し、運転者の主張に繋がる事故の直前に発生した旅行の分類を成功させることで、リスクの増加期間を識別できるかどうかを検討する。 ドライバーのリスクの増加期間の特定は、介入の機会と、潜在的にクレームの回避をもたらすため、価値がある。 ドライバーが取るべき旅行のメタデータを調べ、分類器を訓練し、そのドライバーが主張する場所が‘textit{the following trip’であるかどうかを予測する。 0.6以上の受信者-操作特性の領域を達成することにより,事前にクレームを予測可能であることを示す。 さらに、XGBoost分類器の受信-演算特性に基づく領域で測定された予測パワーを、駆動マイルなどの露光機能を用いて運転者がクレームを持つかどうか、計算速度スコアなどの行動特性を用いて訓練した者と比較した。

In recent years it has become possible to collect GPS data from drivers and to incorporate this data into automobile insurance pricing for the driver. This data is continuously collected and processed nightly into metadata consisting of mileage and time summaries of each discrete trip taken, and a set of behavioral scores describing attributes of the trip (e.g, driver fatigue or driver distraction) so we examine whether it can be used to identify periods of increased risk by successfully classifying trips that occur immediately before a trip in which there was an incident leading to a claim for that driver. Identification of periods of increased risk for a driver is valuable because it creates an opportunity for intervention and, potentially, avoidance of a claim. We examine metadata for each trip a driver takes and train a classifier to predict whether \textit{the following trip} is one in which a claim occurs for that driver. By achieving a area under the receiver-operator characteristic above 0.6, we show that it is possible to predict claims in advance. Additionally, we compare the predictive power, as measured by the area under the receiver-operator characteristic of XGBoost classifiers trained to predict whether a driver will have a claim using exposure features such as driven miles, and those trained using behavioral features such as a computed speed score.
公開日: Tue, 10 May 2022 01:25:10 GMT

※ 翻訳結果を表に示しています。PDFがオリジナルの論文です。翻訳結果のライセンスはCC BY-SA 4.0です。詳細はトップページをご参照ください。

翻訳結果

    Page: /      
英語(論文から抽出)日本語訳スコア
Article Nightly Automobile Claims Prediction from Telematics-Derived Features: A Multilevel Approach Allen R. Williams 1, Yoolim Jin 2, Anthony Duer 2, Tuka Alhani 3 and Mohammad Ghassemi 4,* Article Nightly Automobile Claims Predictions from Telematics-Derived Features: A Multilevel Approach Allen R. Williams 1, Yoolim Jin 2, Anthony Duer 2, Tuka Alhani 3 and Mohammad Ghassemi 4,*
訳抜け防止モード: 夜間自動車がテレマティクスから予測する特徴 : マルチレベルアプローチのAllen R. Williams 1 Yoolim Jin 2、Anthony Duer 2、Tuka Alhani 3 そしてMohammad Ghassemi 4 , *
0.78
2 2 0 2 y a M 0 1 2 2 0 2 y a m 0 1 である。 0.53
] G L . s c [ ] G L。 sc [ 0.47
1 v 6 1 6 4 0 1 v 6 1 6 4 0 0.42
. 5 0 2 2 : v i X r a . 5 0 2 2 : v i X r a 0.42
Citation: Williams, A.R.; Jin, Y. Citation: Williams, A.R.; Jin, Y 0.42
; Duer, A. A (Duer, A)。 0.33
; Alhanai, T. Ghassemi, M. Title. タイトルは『alhanai, t. ghassemi, m.』。 0.60
Preprints 2022, 1, 0. プレプリント2022, 1, 0。 0.73
https://doi.org/ https://doi.org/ 0.26
Publisher’s Note: MDPI stays neutral with regard to jurisdictional claims in published maps and institutional affiliations. 出版者の注記: mdpiは、出版地図や機関提携の司法権主張に関して中立である。 0.60
Copyright: © 2022 by the authors. 著作権:2022年。 0.38
Licensee MDPI, Basel, Switzerland. スイスのバーゼルにあるMDPIのライセンス。 0.66
This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution (CC BY) license (https:// creativecommons.org/ licenses/by/ 4.0/). この記事はCreative Commons Attribution (CC BY)ライセンス(https:// creativecommons.org/ licenses/by/4.0/)の条項と条件で配布されているオープンアクセスの記事である。 0.72
1 Michigan State University; will3670@msu.edu 2 CSAA Insurance Group; Victor.Jin@csaa.com; Anthony.Duer@csaa.co m 3 New York University; tuka.alhanai@nyu.edu 4 Michigan State University; ghassem3@msu.edu * Correspondence: ghassem3@msu.edu; 1ミシガン州立大学、will3670@msu.edu 2 csaa保険グループ、victor.jin@csaa.com、anthony.duer@csaa.co m 3ニューヨーク大学、tuka.alhanai@nyu.edu 4ミシガン州立大学、ghassem3@msu.edu *対応:ghassem3@msu.edu; 0.70
Abstract: In recent years it has become possible to collect GPS data from drivers and to incorporate this data into automobile insurance pricing for the driver. 概要:近年では、ドライバーからgpsデータを収集し、そのデータをドライバーの自動車保険価格に組み込むことが可能になっている。 0.73
This data is continuously collected and processed nightly into metadata consisting of mileage and time summaries of each discrete trip taken, and a set of behavioral scores describing attributes of the trip (e.g, driver fatigue or driver distraction) so we examine whether it can be used to identify periods of increased risk by successfully classifying trips that occur immediately before a trip in which there was an incident leading to a claim for that driver. このデータを夜間に収集・処理し、各個別旅行の1マイルと時刻の要約と、旅行の属性(例えば、運転者の疲労や運転者の気遣いなど)を記述する一連の行動スコアからなるメタデータに分類し、運転者の主張に繋がる事故の直前に発生した旅行の分類を成功させることで、リスクの増加期間を識別できるかどうかを検討する。 0.70
Identification of periods of increased risk for a driver is valuable because it creates an opportunity for intervention and, potentially, avoidance of a claim. ドライバーのリスクの増加期間の特定は、介入の機会と、潜在的にクレームの回避をもたらすため、価値がある。 0.63
We examine metadata for each trip a driver takes and train a classifier to predict whether the following trip is one in which a claim occurs for that driver. 我々は,ドライバーが取るべき旅行のメタデータを調べ,そのドライバーが主張する旅行が次の旅行であるかどうかを判断するために分類器を訓練する。 0.64
By achieving a area under the receiver-operator characteristic above 0.6, we show that it is possible to predict claims in advance. 0.6以上の受信者-操作特性の領域を達成することにより,事前にクレームを予測可能であることを示す。 0.72
Additionally, we compare the predictive power, as measured by the area under the receiver-operator characteristic of XGBoost classifiers trained to predict whether a driver will have a claim using exposure features such as driven miles, and those trained using behavioral features such as a computed speed score. さらに、XGBoost分類器の受信-演算特性に基づく領域で測定された予測パワーを、駆動マイルなどの露光機能を用いて運転者がクレームを持つかどうか、計算速度スコアなどの行動特性を用いて訓練した者と比較した。 0.82
Keywords: Telematics; Usage Based Insurance; Risk Mitigation キーワード:テレマティクス、使用ベースの保険、リスク緩和 0.71
1. INTRODUCTION 1.1. 1. 導入 1.1。 0.64
Motivation Classical automobile insurance pricing is based on static features often indirectly and non-causally related to the risk propensity of the driver. 動機 古典的な自動車保険の料金は、しばしばドライバーの危険度と間接的かつ非因果関係の静的特徴に基づいている。 0.62
There has been an increasing trend toward integrating driving habits and patterns into the insurance pricing equation. 運転習慣やパターンを保険価格の方程式に統合する傾向が強まっている。
訳抜け防止モード: 傾向が増しています 運転習慣とパターンを保険価格の方程式に統合する。
0.75
Policies which incorporate information about a policy holder’s driving habits are often referred to as usage based insurance and can include policy types such as pay-as-you-drive (PAYD) which offers a lower premium pricing for drivers who drive fewer annual miles, and pay-how-you-drive (PHYD) which uses features derived from a driver’s actual driving patterns (e.g, braking event counts or cornering event counts) to assess a driver’s claims propensity and determine a premium price [1]. 政策ホルダーの運転習慣に関する情報を取り入れた政策は、しばしば利用ベースの保険と呼ばれ、年間走行距離を減らしたドライバーに低いプレミアム価格を提供するペイ・アズ・ユー・ドライブ(PAYD)や、ドライバーの実際の運転パターン(例えば、イベントカウントのブレーキやイベントカウントのコーナー化など)から派生した特徴を利用してドライバーの主張の妥当性を評価し、プレミアム価格を決定するペイ・ア・ユー・ドライブ(PHYD)といった政策タイプを含むことができる。 0.78
There are several advantages to usage based insurance including a fairer distribution of cost among the population of insured drivers, an expectation of savings on insurance costs for the majority of drivers (especially drivers in the lower income category), increased traffic safety through a reduction in miles driven, and an opportunity to provide feedback to drivers thereby reducing the total risk in an insurer’s portfolio [2,3]. 利用ベースの保険には、被保険者の人口間のコストの公平な分配、運転者(特に低所得階級のドライバー)の保険コストの削減の期待、走行距離の削減による交通安全の向上、運転者にフィードバックを提供することにより、保険会社のポートフォリオの総リスクを減少させる機会など、いくつかの利点がある。
訳抜け防止モード: 保険料ベースの保険にはいくつかの利点があり、保険契約者の間でコストの公平な分配が可能である。 大多数のドライバー(特に低所得階級のドライバー)の保険費用の節減を期待すること 走行距離の削減による交通安全の向上と機会 ドライバーにフィードバックを提供することにより、保険会社のポートフォリオ[2,3]の総リスクを低減する。
0.76
1.2. Objective We were primarily interested in three research questions in this study. 1.2. 目的 この研究で主に3つの研究課題に興味を持った。 0.60
First, can we use telematic behavioral measures to determine which drivers were more likely to have a claim; that is, can we assess the risk propensity of a driver based on the telematics derived features? 第一に、テレマティックな行動測定を用いて、どのドライバーがクレームを持つ可能性が高かったか、すなわち、テレマティックな特徴に基づいて、運転者のリスク適合性を評価することができるか。 0.67
Second, 第二に 0.37
英語(論文から抽出)日本語訳スコア
2 of 14 can we determine which trips were more likely to result in claims using only features derived from previous trips? 14人中2人 これまでの旅行から派生した特徴だけを使って どの旅行が 引き起こされるか 判断できますか? 0.62
Finally, would the classification tasks be improved by combining the results of the driver risk assessment and journey risk assessment? 最後に,ドライバリスクアセスメントの結果と旅行リスクアセスメントを組み合わせることで,分類タスクを改善することができるか? 0.81
1.3. Literature Review 1.3.1. 1.3. 文献1.3.1。 0.31
Telematics Data テレマティクスデータ 0.46
There are multiple ways of collecting telematics data for usage based insurance, and even more ways of processing this data into usable features for determining the risk propensity of a driver. 利用ベースの保険のためのテレマティクスデータの収集には複数の方法があり、さらにこのデータをドライバーのリスク傾向を決定するために利用可能な機能として処理する方法もある。 0.73
Driven distance and location (e.g, miles driven in urban areas) have been used as measures of a driver’s exposure to risk [4]. 運転距離と走行距離(都市部で走行距離など)は、運転者の危険への曝露の指標として用いられてきた[4]。 0.77
The exact relationship between distance driven and claims frequency has been debated, with some authors describing a learning effect, which offsets some of the increased risk exposure from additional miles driven [5], however it has been argued that the effect is due to a residual heterogeneity which is inappropriately captured by the model used, meaning that low distance drivers have certain traits that are different from high mileage drivers other than just their distances driven [6]. 距離駆動とクレーム周波数の正確な関係は議論され、一部の著者は学習効果が追加のマイル駆動によるリスク露出の増加 [5] を相殺していると説明しているが、この効果は使用したモデルによって不適切に捕獲された残留不均質性によるものであり、低距離運転者は距離駆動以外の高距離運転者とは異なる特定の特性を持っていると論じられている [6]。 0.83
The argument is that increased mileage should not be viewed as risk reducing, since a driver who decides to drive more miles has a fixed claims probability for their original driven distance and the additional distance can only increase that probability, although the marginal increase in probability of claims per mile may decrease with additional miles driven. マイルの増加をリスク低減とみなすべきではない、なぜなら、より多くのマイルを走行することを決めたドライバーは、元の駆動距離に対して固定されたクレーム確率を持ち、追加された距離は、マイル当たりのクレームの限界的な増加は、追加駆動により減少する可能性があるにもかかわらず、その確率を増大させることができるからである。
訳抜け防止モード: 議論では、マイル数の増加はリスク低減と見なすべきではない。 走行距離を増やそうと 決めたドライバーは 元の運転距離を 固定する確率があるから 余分な距離は その確率を増大させるだけでは ありませんが 1マイル当たりのクレームの 限界的な増加は 余分なマイル駆動で減少する
0.77
Some studies have examined drowsiness detection using wearable headbands [7], or fatigue using computer vision techniques [8]. ウェアラブルヘッドバンドを用いた眠気検出 [7] や,コンピュータビジョン技術を用いた疲労 [8] について検討した研究もある。 0.63
There have been studies analyzing driver behavior using information acquired from a vehicle’s CAN bus, detailing sequences of actions including braking and turning events, steering wheel angle, and vehicle speed, most often in an attempt to identify drivers based on the information obtained from the CAN bus. 車両のCANバスから取得した情報を用いて運転者の行動を分析し、ブレーキや旋回イベント、ステアリングホイール角、車両速度などの一連の動作を詳述し、CANバスから取得した情報に基づいて運転者を特定する試みがしばしば行われている。 0.79
Carfora et al used a combination of mobile GPS data along with information from the CAN bus to derive two clusters which they identify as highway driving and urban road driving [9]. Carforaらは、モバイルGPSデータとCANバスの情報を組み合わせて、高速道路運転と都市交通運転の2つのクラスタを抽出した[9]。
訳抜け防止モード: Carforaらは、CANバスの情報とモバイルGPSデータを組み合わせて、2つのクラスタを導出した。 高速道路運転と都市道路運転と 同一視されています [9]
0.69
Machine learning approaches have been applied to the task of predicting claims from features derived from telematics. テレマティクスから派生した特徴からクレームを予測するタスクに機械学習アプローチが適用されている。 0.70
Most papers have focused on the task of predicting which drivers are likely to have a claim. ほとんどの論文は、どのドライバーがクレームを持っているかを予測するタスクに焦点を当てている。
訳抜け防止モード: ほとんどの論文はタスクに重点を置いている どのドライバーにクレームがあるか予測します
0.69
Pesantez-Narvarez, Guillen, and Alcanez explored both logistic regression and XGBoost on a small dataset to predict the existence of claims. Pesantez-Narvarez、Guillen、Alcanezはロジスティック回帰とXGBoostの両方を小さなデータセットで探索し、クレームの存在を予測した。 0.58
They found that XGBoost performed favorably, but noted a difficulty in interpretation of XGBoost when tree models are used as the base learner due to the difficulty in extracting model coefficients. XGBoostは, モデル係数の抽出が困難であるため, 木モデルをベース学習者として使用する場合, XGBoostの解釈が困難であることに気付いた。 0.88
They argue that the modest performance gain of XGBoost over logistic regression on their dataset did not justify its use over logistic regression given the relatively lower interpretability of results. 結果の比較的低い解釈性を考えると、データセット上のロジスティック回帰に対するXGBoostの性能向上は、ロジスティック回帰に対するその使用を正当化するものではない、と彼らは主張する。 0.59
They also note the need for careful hyperparameter optimization with XGBoost due to its many hyperparameters and its ability to determine complex nonlinear decision boundaries [10]. 彼らはまた、xgboostの多くのハイパーパラメータと複雑な非線形決定境界を決定する能力のために、注意深いハイパーパラメータ最適化の必要性も指摘している [10]。 0.62
Several other authors have also had success using an XGBoost classifier for claims prediction using telematics data on datasets of up to 30, 000 rows [11,12]. 他の著者たちも、30万行までのデータセットのテレマティクスデータを使用してクレーム予測にxgboost分類器を使って成功した[11,12]。 0.70
Our use of telematics data is different from the above in that we predict claims at multiple levels of resolution and recombine the individual classifier outputs in order to predict which journeys occur immediately before a claim, so that we can identify periods of relatively higher risk for a driver, in the hopes that an intervention can be made and the increased risk can be mitigated. テレマティクスデータの利用は,複数のレベルの解像度でクレームを予測し,個々の分類器出力を再結合することにより,クレームの直前に発生した行程を予測することにより,ドライバーに対して比較的リスクの高い期間を識別し,介入が可能でリスクの増大を軽減できる点において,上記のものと異なる。 0.83
1.3.2. Imbalanced Data 1.3.2. 不均衡データ 0.53
Insurance claims prediction is an example of a classification task in which data is almost always strongly class imbalanced. 保険請求予測は、データがほぼ常に強固なクラス不均衡である分類タスクの例である。 0.80
A dataset is considered to be class imbalanced if one class occurs much more often than the others. あるクラスが他のクラスよりも頻繁に発生する場合、データセットはクラス不均衡とみなされる。 0.77
In a binary classification task the minority class is often referred to as the positive class, while the majority class is called the negative class. 二項分類タスクでは、少数クラスはしばしば正のクラスと呼ばれ、多数クラスは負のクラスと呼ばれる。 0.74
The focus of this section and the remainder of the paper will be on binary classification rather than multiclass classification. この節と論文の残りは、マルチクラス分類ではなくバイナリ分類に焦点が当てられる。 0.72
Learning from imbalanced datasets presents several challenges and there have 不均衡データセットからの学習にはいくつかの課題があり 0.62
英語(論文から抽出)日本語訳スコア
been a variety of tools developed to address these challenges. これらの課題に対処するために 様々なツールが開発されました 0.56
Many classifiers will learn the majority class more effectively than the minority class, and will misclassify examples of the minority class more often than they do examples of the majority class. 多くの分類器はマイノリティクラスよりもマジョリティクラスを効果的に学習し、マイノリティクラスの例をマジョリティクラスの例よりも頻繁に誤分類する。
訳抜け防止モード: 多くの分類器は少数派よりも多数派を効果的に学習する。 マイノリティクラスの例を、多数派クラスの例よりも頻繁に誤分類します。
0.80
Moreover in domains where imbalanced data is common, it is often the case that correctly classifying minority class (positive) examples is more important than correctly classifying majority class (negative) examples [13]. さらに、不均衡データが一般的である領域では、少数派(正)の例を正しく分類することが、多数派(負)の例を正しく分類するよりも重要である場合が多い[13]。 0.79
Class imbalanced datasets often arise when the event that is to be detected is rare, so in addition to the relative scarcity of samples in the minority class in comparison to samples of the majority class, there may also be an inadequate number of samples of the minority class for the minority class which creates a difficulty in distinguishing signatures of the minority class from dataset noise [14]. 検出すべき事象が稀な場合には、クラス不均衡データセットが発生することが多いため、マイノリティクラスのサンプルが多数派クラスのサンプルと比較した場合、マイノリティクラスのサンプルが比較的少ないことに加えて、マイノリティクラスのマイノリティクラスのサンプルが不足している場合もあり、マイノリティクラスの署名とデータセットノイズの区別が困難になる可能性がある[14]。 0.74
See Figure 1 for an illustration of the class imbalance problem. クラス不均衡問題の図式については、図1を参照してください。 0.63
A related problem is class overlap. 関連する問題はクラスオーバーラップです。 0.77
Overlap is said to occur when there are regions in the オーバーラップは、地域に地域があるときに起こるという。 0.57
3 of 14 Figure 1. 14人中3人 図1に示す。 0.58
Plots of example datasets demonstrating varying levels of class imbalance. クラス不均衡のさまざまなレベルを示す例データセットのプロット。 0.72
The different colors represent examples of different classes. 異なる色は異なるクラスの例を示す。 0.82
In the leftmost plot the classes are completely balanced, the next two figures show progressively more severe class imbalance. 最左端のプロットではクラスは完全に均衡しており、次の2つの数字は徐々に厳しいクラス不均衡を示している。 0.59
feature space with similar proportions of minority samples and majority samples. 少数サンプルと多数サンプルの比率が類似した特徴空間。 0.85
If a dataset is separable in the feature space then there is no class overlap; on the other hand, if examples of the two classes are distributed uniformly over the feature space then there is maximal class overlap. データセットが機能空間で分離可能であれば、クラス重複は発生しない。一方、2つのクラスの例が機能空間上で一様に分散されている場合、最大クラス重複が存在する。 0.83
See Figure 2 for an illustration of the concept of class overlap. クラス重複の概念の例については、図2を参照してください。 0.64
Class overlap alone is a significant problem for classification however it presents even greater difficulties in the presence of class imbalance. クラス重複のみは分類において重大な問題であるが、クラス不均衡の存在がさらに困難である。 0.83
Denil and Treppenberg explored the relationship between class imbalance and class overlap and found then when each was examined separately class overlap presented much more serious difficulties than class imbalance, and that the presence of both class imbalance and class overlap presented unique and catastrophic difficulties that did not occur with either class imbalance or class overlap alone [15]. デニルとトレッペンベルクはクラス不均衡とクラス重なりの関係を考察し、クラス重なりがクラス不均衡よりもはるかに深刻な問題を示し、クラス不均衡とクラス重なりの両方の存在がクラス不均衡とクラス重なりだけでは起こり得ない独特で破滅的な困難をもたらした[15]ことを突き止めた。 0.70
Class Imbalance and class overlap can be addressed at multiple different levels. クラス不均衡とクラスオーバーラップは、複数の異なるレベルで対処できる。 0.80
At the data level sampling methods can be used to increase the proportion of minority class examples. データレベルでのサンプリング手法は、マイノリティクラスのサンプルの割合を増やすために使用することができる。 0.70
Some of the simplest sampling techniques are random over/under sampling, in which either some samples from the minority class are chosen at random to be repeated in the training set, or samples from the majority class are chosen at random to be omitted from the training set. 最も単純なサンプリング手法のいくつかはランダムオーバーアンダーサンプリングであり、マイノリティクラスからのサンプルがランダムに選択されてトレーニングセットで繰り返されるか、多数クラスのサンプルがランダムに選択されてトレーニングセットから省略される。 0.75
A problem with the random oversampling approach is that it does not often aid in recognition of ランダムなオーバーサンプリングアプローチの問題は、それがしばしば認識に役立たないことである。 0.77
英語(論文から抽出)日本語訳スコア
4 of 14 Figure 2. 14人中4人 図2。 0.66
Plots of example datasets demonstrating varying levels of class overlap. クラスオーバーラップのさまざまなレベルを示す例データセットのプロット。 0.75
The different colors represent examples of different classes. 異なる色は異なるクラスの例を示す。 0.82
In the leftmost plot the classes are completely separable, in the center plot there are regions with similar densities of each class, creating difficult regions in the feature space for classification, and in the rightmost plot the classes overlap significantly, making them extremely difficult to successfully classify based on these features. 最左のプロットではクラスは完全に分離可能であり、中央のプロットにはそれぞれのクラスに類似した密度を持つ領域があり、分類のための特徴空間において難しい領域を形成し、最右のプロットではクラスが著しく重なり合うため、これらの特徴に基づいて分類を成功させるのは非常に困難である。 0.67
the minority class, rather forces the decision boundary to be focused on more specific areas within the feature space [16]. 少数派はむしろ、決定境界を機能領域内のより特定の領域に集中させます [16]。 0.66
Alternatively oversampling techniques like SMOTE and its many variants produce new minority class samples thereby expanding the decision boundary and often aiding in the recognition of the minority class. あるいは、SMOTEとその多くの変種のようなオーバーサンプリング技術は、新しいマイノリティクラスサンプルを生成し、それによって決定境界を広げ、しばしばマイノリティクラスの認識を支援する。
訳抜け防止モード: あるいは、SMOTEとその多くの変種のようなオーバーサンプリング技術は、新しいマイノリティクラスサンプルを生成し、決定境界を広げる。 少数民族の認識を 支えることもしばしばあります
0.70
SMOTE, in particular, works by selecting k nearest neighbors for each minority sample (where k is a hyperparameter) and for some proportion of these neighbors randomly choosing a point along the line connecting the minority sample with its neighbor and adding a new sample at that point, thereby augmenting the training data and expanding the decision boundary. 特に、SMOTEは、各少数サンプル(k はハイパーパラメータ)に対して k 近くの隣人を選別し、これらの隣人の一部の比率は、少数サンプルと隣人を結ぶ線に沿った点をランダムに選択し、その点において新しいサンプルを追加することにより、トレーニングデータを増強し、決定境界を拡張する。 0.74
Tomek link removal is a method for undersampling which can also help to address the class overlap problem [17]. Tomekリンクの削除はアンダーサンプリングの方法であり、クラスオーバーラップの問題にも対処するのに役立ちます [17]。 0.68
A Tomeklink is a pair of samples who are each other’s 1−nearest neighbor but have opposite class labels. トメクリンク(Tomeklink)は、互いに1-アネレストの隣人であるが、反対のクラスラベルを持つサンプルである。
訳抜け防止モード: tomeklinkは一対のサンプルで 互いに1-nearestの隣人ですが、反対のクラスラベルがあります。
0.80
Formally in the finite dataset M ⊆ X × Y where X is a population of samples and Y = {0, 1} the corresponding labels, write n = |M|, let 1 ≤ i < j ≤ n, and let M(cid:48) i,j = x1, . . . , xi−1, xi+1, . . . , xj−1, xj+1, . . . , xn}, that is M(cid:48) is the projection of M \ {(xi, yi), (xj, yj)} onto X . X をサンプルの集団とし、Y = {0, 1} に対応するラベルを書けば n = |M|, 1 ≤ i < j ≤ n とし、M(cid:48) i,j = x1, . . . . , xi−1, xi+1, . . . , xj−1, xj+1, . . . . , xn} を M(cid:48) は M \ {(xi, yi), (xj, yj)} の X への射影とする。 0.83
Then the pair (xi, yi), (xj, yj) are a Tomek link if yi (cid:54)= yj and このとき、対 (xi, yi) と (xj, yj) は yi (cid:54)= yj のとき、トメックリンクである。 0.77
∀xk ∈ M(cid:48) xk ∈ m(cid:48) である。 0.41
i,j : d(xk, xi) > d(xi, xj) and d(xk, xj) > d(xi, xj) i,j : d(xk, xi) > d(xi, xj) および d(xk, xj) > d(xi, xj) 0.85
Where d is any metric, often Euclidean distance. d は任意の計量であり、しばしばユークリッド距離である。 0.60
Another level at which the class imbalance problem can be addressed is at the classifier level. クラス不均衡問題に対処できる別のレベルは、分類器のレベルである。 0.79
Often a weight is applied to samples in the minority class so that misclassification of minority samples is weighted more heavily in the loss function. マイノリティクラスのサンプルに重みを付けて、マイノリティのサンプルの誤分類が損失関数に重み付けされることが多い。
訳抜け防止モード: マイノリティクラスのサンプルに重みが適用されることが多いので、 少数サンプルの誤分類は損失関数に重み付けされている。
0.80
Another commonly used method of dealing with class imbalance at the classifier level is ensemble classifiers. 分類器レベルでクラス不均衡を扱う他の一般的な方法はアンサンブル分類器である。 0.73
Most often these involve either bagging or boosting ensembles. 多くの場合、これらは袋詰めやアンサンブルの強化にかかわる。 0.40
Bagging (Bootstrap Aggregating) is an ensemble method in which a dataset is split into multiple datasets by sampling with replacement (Bootstrapping) and models are trained on each of the bootstrap samples, then at prediction time the predictions of each of the models is aggregated in some way (this could Bagging (Bootstrap Aggregating)は、データセットを複数のデータセットに分割し(Bootstrapping)、各ブートストラップサンプル上でモデルをトレーニングし、予測時に各モデルの予測を何らかの方法で集約するアンサンブル手法である。
訳抜け防止モード: Bagging (Bootstrap Aggregating )は、データセットを複数のデータセットに分割し、置換してサンプリングするアンサンブル手法である(Bootstrapping )。 ブートストラップのサンプルで モデルが訓練されます そして予測時、各モデルの予測は何らかの方法で集約されます。 これなら
0.84
英語(論文から抽出)日本語訳スコア
5 of 14 be a majority vote, an average, or more complex aggregation methods). 14人中5人 多数決、平均、またはより複雑な集計方法である) 0.64
Boosting is another ensemble method that iteratively trains a collection of weak learners and aggregates their predictions to form a more powerful ensemble. boostingは、弱い学習者の集まりを反復的に訓練し、それらの予測を集約してより強力なアンサンブルを形成する別のアンサンブル手法である。 0.51
The weights of samples are chosen in each boosting round to incentivize the correct classification of samples which had been misclassified by the weak learners in earlier boosting rounds. サンプルの重みは各ブースティングラウンドで選択され、以前のブースティングラウンドでは弱い学習者が誤分類していたサンプルの正しい分類を動機付ける。
訳抜け防止モード: サンプルの重量は各ブースティングラウンドで選択される 前の強化ラウンドで弱い学習者によって誤分類された サンプルの正しい分類を動機付けました
0.82
The weight of each classifier toward the final prediction is inversely proportional to its error [18]. 最終予測に対する各分類器の重みは、その誤差[18]に逆比例する。 0.75
2. METHODS Herein we describe the data, methods, and validation approach used to develop models 2.方法 ここでは,モデル開発に用いるデータ,手法,検証手法について述べる。 0.71
that assess the risk of driver- and journey-level claims using telematics data. テレマティクスデータを用いて、ドライバーや旅行レベルの請求のリスクを評価する。 0.60
2.1. Data All data for this study was sourced from CSAA Insurance Group. 2.1. データ この調査のデータはすべてCSAA Insurance Groupから得られたものだ。 0.61
Our dataset consisted of 3, 354, 578 journeys taken by 5, 649 distinct drivers. うちのデータセットは3,354,578回の旅行を5,649名のドライバーが行った。 0.60
For each journey, telematics features are derived from data collected from users’ smartphones by the telematics data collection and processing company The Floow. 各旅行ごとに、telematicsの機能は、telematics data collection and processing companyのthe floowがユーザーのスマートフォンから収集したデータから得られる。 0.73
The telematics data are represented as a collection of scores and event counts. テレマティクスデータはスコアとイベントカウントのコレクションとして表現される。 0.68
We do not use any traditional insurance features such as age or gender in this study [19]. 本研究では, 年齢, 性別などの従来の保険制度は使用していない[19]。 0.82
2.2. Outcome For model development purposes, our outcome of interest were two binary variables that indicated the existence or absence of a claim at the driver and journey resolutions. 2.2. 結果 モデル開発のために、私たちの興味のある結果は2つのバイナリ変数で、ドライバーのクレームの有無と旅の解決度を示しています。 0.48
A journey’s class label is set to 1 if the following journey resulted in a claim for that driver while the driver’s class label is set to 1 if the driver had a claim on any recorded journey. journeyのクラスラベルは、次の旅がドライバーのクレームになった場合1に設定され、ドライバーのクラスラベルは、ドライバーが記録された旅のクレームを持っていれば1に設定される。 0.69
Our outcome was strongly class imbalanced; only 181 of the 3, 354, 578 journeys (and drivers) had in a claim. 3,354,578回の走行(および運転者)のうち181回に過ぎなかった。
訳抜け防止モード: 私たちの成果は 階級的不均衡が強く 3,354,578回の走行(および運転者)のうち181人のみが主張していた。
0.67
2.3. Features The telematics data are represented as a collection of scores and event counts. 2.3. 特徴 テレマティクスデータはスコアとイベントカウントのコレクションとして表現される。 0.60
The telematic scores summarize the driving habits based on characteristics such as a drivers tendency toward distraction, fatigue, and time of day - metrics which have been shown previously to be associated with risk propensity. テレマティックスコアは、運転者の気を散らす傾向や疲労、日中の時間といった特性に基づいて、運転習慣を要約する。
訳抜け防止モード: テレマティックスコアは,運転者の気晴らし傾向,疲労傾向,日時などの特性に基づいて,運転習慣を要約する。 以前 リスクの傾向に関係していると 示されていました
0.67
Scores are computed at two different levels: globally (at the driver level) and locally (at the trip level). スコアは、グローバル(ドライバーレベル)とローカル(トリップレベル)の2つの異なるレベルで計算される。 0.69
The trip level scores are computed for each trip taken at the conclusion of the trip and thus can change significantly even for the same driver on different trips, and the driver level scores are global scores for a driver summarizing his or her driving more succinctly. 旅行終了時の走行毎に走行レベルスコアを算出し、異なる旅行で同じ運転者であっても大幅に変化させることができるので、運転レベルスコアは、より簡潔に運転を要約する運転者のためのグローバルスコアである。 0.65
There are six scores for each driver, and six scores for each journey. 各ドライバーには6つのスコアがあり、各ドライバーには6つのスコアがある。 0.59
The data providers of this study informed us that higher scores are considered better in all categories, i.e, a driver with an Overall score of 90 is considered to be less risky than a driver with an Overall score of 70, if all else is equal. 本研究のデータ提供者は,すべてのカテゴリーにおいて,上位のスコアが良好である,すなわち,総合得点90のドライバは,他のすべてのスコアが等しい場合,総合得点70のドライバよりもリスクが低い,と報告した。 0.82
The telematic event counts are computed for each trip for categories like braking, acceleration, and cornering; for each of these events, an intensity level ranging from mild to extreme is also captured. テレマティックなイベントカウントは、ブレーキ、加速度、コーナーなどのカテゴリごとに計算され、これらのイベントごとに、軽度から極度の強度レベルもキャプチャされる。 0.65
We also use aggregate measurements like the number of trips a driver has taken, or the number of miles the driver has driven as features for the assessment of driver risk propensity and the distance and duration of a trip for the assessment of relative riskiness of the trip. また、ドライバーが乗った走行回数や、ドライバーが運転した走行距離などの総合的な測定を、ドライバーの危険度や走行距離、走行の相対的な危険度を評価するための特徴として使用しています。
訳抜け防止モード: 私たちはまた、ドライバーが行ったトリップの数のような総合的な測定も使用しています。 ドライバーの危険度評価のための特徴として 運転者が運転した距離を そして、旅行の相対的な危険度を評価するための旅行の距離と期間。
0.68
2.3.1. Driver Risk Assessment 2.3.1. ドライバのリスクアセスメント 0.53
To assess the risk profile of drivers we take into account the global scores provided for each driver, the number of miles driven, the number of discrete trips taken, and the days since the last heartbeat (a periodic signal used to verify connectivity between the driver’s mobile device and the company’s receiver). ドライバーのリスクプロファイルを評価するために、各ドライバーのグローバルスコア、走行距離、走行距離、走行回数、前回の心拍数(運転者のモバイルデバイスと同社の受信機との接続を検証するために使用される定期的な信号)を考慮に入れます。 0.59
We divide these features into two distinct subsets, those これらの特徴を2つの異なる部分集合に分けます 0.68
英語(論文から抽出)日本語訳スコア
derived from a driver’s behavior and those measuring a driver’s risk exposure (See table 1 for a list of scores and summary statistics). 運転者の行動と運転者のリスク露光を測定することに由来する(スコアと要約統計のリストの表1を参照)。 0.71
6 of 14 Mean Stdev Table 1. 14人中6人 stdev table 1 の略。 0.64
Summary statistics for driver level scores and exposure measures in our dataset 我々のデータセットにおけるドライバーレベルスコアと露出測定の統計統計 0.78
418.01 435.79 418.01 435.79 0.25
71.30 8.54 71.30 8.54 0.25
86.33 9.14 86.33 9.14 0.25
75.53 3.41 75.53 3.41 0.25
Fatigue 83.59 9.17 疲労83.59 9.17 0.26
Speed Driven Journeys Miles Driven 79.90 5.18 速度駆動走行距離79.90.18マイル 0.60
3991.22 5123.85 3991.22 5123.85 0.25
Smooth Driving Mobile Distraction Time of Day 平滑な移動移動移動時の気晴らし時間 0.58
Overall 80.61 5.28 2.3.2. 全80.61.28 2.3.2. 0.39
Journey Risk Assessment 旅のリスクアセスメント 0.77
Journey scores are provided as a sequence of scores and event counts for each driver (See 走行スコアは各ドライバーのスコアとイベントカウントのシーケンスとして提供される(参照)。 0.72
Table 1 for a list of behavioral scores and summary statistics). 表1 行動スコアと要約統計のリストについて)。 0.72
Journey Smooth Driving Mobile Distraction Time of Day 旅 平滑な移動移動移動時の気晴らし時間 0.44
Mean Stdev Max. ストデフ・マックス。 0.53
Min. 80.04 9.19 100 13.90 ミン 80.04 9.19 100 13.90 0.30
68.92 12.85 100 6.98 68.92 12.85 100 6.98 0.27
3.0 Table 2. 3.0 テーブル2。 0.77
Summary statistics for journey level scores and exposure measures in our dataset データセットにおける旅程レベルスコアと露出指標の要約統計 0.80
86.53 14.99 100 21.88 86.53 14.99 100 21.88 0.27
76.22 6.72 93.28 21.85 76.22 6.72 93.28 21.85 0.23
Fatigue 93.81 6.66 100 42.86 疲労93.81 6.66 100 42.86 0.26
Speed Duration (min) Miles 9.71 81.78 19.43 10.05 841.3 100 37.50 0.0 9.71マイル 81.78 19.43 10.05 841.3 100 37.50 0.0 0.55
18.02 25.33 18.02 25.33 0.25
2,204.08 Because we want to determine patterns in scores which are indicative of future claims we expand samples to include features from the previous 4 trips, including their labels, and we also provide 1st and 2nd order differences in scores to the classifier (see Figure 3 for an abbreviated illustraion of the dataset widening process described.) 2,204.08 将来的な主張を示すスコアのパターンを決定したいので、サンプルをラベルを含むこれまでの4回の旅行の特徴を含むように拡張し、また分類器にスコアの1次と2次の違いも与えます(図3では、データセット拡大プロセスの略図を参照)。 0.48
Figure 3. Illustration of the process used to create our dataframe. 図3。 データフレームの作成に使われたプロセスのイラスト。 0.78
first differences are taken between features on trip t and those on trip t − 1 (where t ranges from 1 to the total number of trips recorded for a driver, Note: The difference is not available if there is no data for trip t − 1 like when t = 1), then the raw features and differences for previous rows is appended to each row. trip t − 1 の特徴と trip t − 1 の特徴(t = 1 の場合のように trip t − 1 のデータがない場合、t が 1 からドライバーが記録したトリップの総数までの範囲)の間には、まず違いが生じ、その後、前の行の生の特徴と差異が各行に追加される。 0.79
In our model differences were added again after step 2 for the the new difference columns created in step 2, and in step 3 four preceding rows of features were appended to each row. モデルでは,ステップ2で作成した新しい差分列に対して,ステップ2以降に再度差分を追加し,ステップ3では各行に4つの前の特徴列を付加した。 0.84
This process multiplied the feature count by 15 and was followed by the feature selection process described in this section. このプロセスでは、特徴数を15倍にし、その後、このセクションで説明した特徴選択プロセスが続いた。 0.68
英語(論文から抽出)日本語訳スコア
7 of 14 2.4. 14人中7人 2.4. 0.47
Model We use XGBoost as the classifier to predict driver- and journey-level claims using the telematics features. モデル 我々はXGBoostを分類器として利用し、テレマティクス機能を用いて運転者および旅行者レベルのクレームを予測する。 0.66
[20]. XGBoost was chosen for its simplicity of use, interpretability, and ability to natively handle missing data. [20]. XGBoostは、使用の単純さ、解釈可能性、欠落したデータをネイティブに処理できることから選ばれた。 0.48
The process of stacking rows and taking differences necessarily creates a lot of missing cells (see Figure 3), and in this setting the missing cells carry information. 行を積み重ねて違いを取るプロセスは、必然的に多くの欠落した細胞を生み出します(図3参照)。
訳抜け防止モード: 行を積み重ねて違いを取る過程は、必然的に多くの欠損細胞を生み出す (図3参照) この環境では 行方不明の細胞が情報を運ぶ
0.78
For example the missing data created by taking differences and stacking rows conveys that there is no previous trip taken by the same driver. 例えば、違いと積み重ね列によって生成された不足データは、同じドライバーによる以前のトリップがないことを示している。 0.68
For the driver classification task we train two XGBoost models on different features and stack their outputs with a final logistic regression classifier. ドライバ分類タスクでは、2つのXGBoostモデルを異なる機能でトレーニングし、最終的なロジスティック回帰分類器で出力を積み重ねます。 0.70
We also examine the performance of weighted and l2-regularized logistic regression. また,重み付きおよびl2正規化ロジスティック回帰の性能についても検討した。 0.52
For the journey-level claims classification task we employ a model which combines the output of the driver and journey level classifiers. 走行レベルのクレーム分類タスクでは,運転者と走行レベルの分類器の出力を組み合わせたモデルを用いる。 0.78
See Figure 4 for an illustration of our proposed final model for predicting journey risk. 旅行リスクを予測するための最終モデルを示す図4を参照してください。 0.76
Logistic regression comes with a natural means of extracting feature importances, namely its coefficients. ロジスティック回帰は、特徴的重要性、すなわち係数を抽出する自然な手段が伴う。 0.73
Coefficients with a large magnitude are stronly associated with the target, and those with a low magnitude are not as important to the target prediction. 大きな大きさの係数はターゲットにのみ関連付けられており、低い大きさの係数はターゲットの予測にはあまり重要ではない。 0.78
Negative coefficients are inversely asoociated with target. 負の係数は逆に目標と結合する。 0.64
XGboost provides a variety of feature importance scores, including cover, weight, and gain. XGboostは、カバー、ウェイト、ゲインなど、さまざまな重要なスコアを提供する。 0.70
Gain refers to the improvement in classification results obtained by splitting a decision tree on a particular feature. ゲインとは、特定の特徴に対して決定木を分割して得られる分類結果の改善を指す。 0.71
In the case of XGBoost there are many decision trees, and the gain feature importance score for each feature is averaged across all splits in which that feature is used. xgboostの場合、多くの決定木があり、各機能に対するゲイン機能の重要性スコアは、その機能を使用するすべての分割に対して平均される。 0.76
See [20] for an in-depth treatment of the objective function used by XGBoost and the types of feature importances it provides. XGBoostが使用する目的関数の詳細な処理と、それが提供する機能の重要性のタイプについては、[20]を参照してください。 0.62
2.5. Performance Metric and Validation Approach 2.5. パフォーマンスメトリクスと検証手法 0.53
The model is evaluated by area under the receiver-operator characteristic, but crossvalidation is done across drivers rather trips, using grouped stratified 10 − f old cross validation, where journeys are grouped by driver ID. モデルは受信者-操作特性の下で評価されるが、クロスバリデーションはドライバー間で行われ、グループ化された10-fのクロスバリデーションを使用して、ドライバーIDによってトリップがグループ化される。
訳抜け防止モード: モデルは、受信機 - 演算子特性の下での領域によって評価される。 しかし クロスバリデーションは むしろ ドライバー間で行われます grouped Stratified 10 − f old cross Validationを使用する。
0.76
Much like standard k-fold cross validation each journey is used exactly once in a test set, but in the grouped k-fold cross validation setting a driver’s trips are treated as a unit. 標準的なkフォールドのクロス検証と同様に、各走行はテストセットで1回だけ使用されるが、グループ化されたkフォールドのクロス検証では、ドライバーの旅行を単位として扱う。 0.62
Given an arbitrary driver ID, all trips taken by that driver ID will appear either in the test set or training set, and will never be split across the two sets. 任意のドライバーIDが与えられた場合、そのドライバーIDによって取られた全ての旅行はテストセットまたはトレーニングセットに表示され、2つのセットに分割されることはない。 0.73
In this case it is also true that each driver appears in the test set for exactly one of the k folds. この場合、各ドライバがkの折りたたみのちょうど1つのテストセットに現れることも事実である。 0.69
2.5.1. Feature Selection 2.5.1. 特徴選択 0.51
We reduce the dimensionality of the feature space by fitting the XGBoost classifier to the training data with a small subset of features chosen for each tree and selecting the features preferred by the classifier based on average gain of a feature across all splits. 我々は、XGBoost分類器を訓練データに各木に選択された機能の小さなサブセットに合わせることで特徴空間の次元を小さくし、全ての分割で特徴の平均ゲインに基づいて分類器が好む特徴を選択する。 0.83
2.5.2. Addressing Class Imbalance 2.5.2. クラス不均衡に対処する 0.37
A significant challenge in this classification task is the class imbalance, as the vast majority of drivers have not had a claim. この分類タスクにおける重要な課題はクラス不均衡であり、ほとんどのドライバーは主張を持っていない。 0.74
In order to address this challenge we use two sampling techniques: an oversampling technique call Synthetic Minority Oversampling TEchnique (SMOTE), followed by undersampling technique called Tomek link removal. この課題に対処するためには、SMOTE(Synthetic Minority Oversampling TEchnique)と呼ばれるオーバーサンプリングテクニックと、Tomekリンク削除と呼ばれるアンダーサンプリングテクニックの2つを使用します。 0.69
In our case, we remove the majority class member of each Tomek-link pair. この場合、各Tomek-linkペアの多数クラスメンバを削除します。 0.68
We also make use of modified scikit-learn pipelines provided by the imbalanced-learn package, and many preprocessing utilities from the scikit-learn package [21–23]. 我々はまた、不均衡学習パッケージが提供する修正シキト学習パイプラインと、シキト学習パッケージ [21–23] から多くの前処理ユーティリティを利用する。 0.63
2.6. Combination of Journey-Driver Risk Assessment 2.6. 走行-ドライバーリスクアセスメントの組合せ 0.51
After training the driver- and journey-level models separately, we trained a third model that combined the risk assessment from both models to provide an enhanced measure of risk at the journey-level. ドライバレベルとジャーニーレベルのモデルを別々にトレーニングした後、両方のモデルからリスクアセスメントを組み合わせることで、ジャーニーレベルにおけるリスクの指標を強化した第3のモデルをトレーニングしました。
訳抜け防止モード: トレーニングの後、ドライバーとジャーニー - レベルモデルが別々に。 両モデルのリスク評価を 組み合わせた第3のモデルを訓練しました 旅程レベルにおけるリスクの強化尺度を提供する。
0.74
英語(論文から抽出)日本語訳スコア
8 of 14 Figure 4. 14人中8人 図4。 0.66
Illustration of the proposed model. 提案されたモデルの図示。 0.64
The dataset is initially split into driver and journey feature sets creating two datasets of different sizes. データセットは最初、ドライバとジャーニー機能セットに分割され、異なるサイズの2つのデータセットを生成する。 0.59
The driver dataset is further decomposed into exposure features and behavioral features. ドライバデータセットはさらに、露光機能と行動機能に分解される。 0.76
XGBoost models are trained on each of these subsets of dataset and the two driver prediction models’ outputs are stacked with a final logistic regression classifier. xgboostモデルはデータセットの各サブセットでトレーニングされ、2つのドライバ予測モデルの出力は最終的なロジスティック回帰分類器で積み重ねられる。 0.80
This stacking classifier is shaded in green. この積み重ね分類器は緑色に塗られている。 0.67
Finally the outputs of the journey risk classifier and stacked driver risk classifiers are stacked with a final XGBoost model which provides the final prediction. 最後に、走行リスク分類器と積み重ねドライバーリスク分類器の出力を最終XGBoostモデルで積み重ねて最終的な予測を行う。 0.79
That is, we use the driver risk scores estimated by the driver classifier, and the journey risk scores estimated by the journey classifier as input into a third classifier that predicts the same target as the journey classifier. すなわち、ドライバー分類器が推定するドライバーリスクスコアと、旅分類器が推定する旅行リスクスコアを、旅分類器と同じ目標を予測する第3分類器の入力として使用する。 0.73
We use an XGBoost classifier for this classification as well, and evaluate based on the same metrics with grouped stratified 10 − f old cross validation. この分類にはXGBoost分類器も使用し、グループ化された層状10-fのクロスバリデーションと同じ測定値に基づいて評価する。 0.83
3. Results Table 3 gives an snapshot of the results obtained by each classifier trained in this study. 3.結果 表3は、この研究で訓練された各分類器によって得られた結果のスナップショットを示す。 0.50
The following subsections provide individual results of the classifiers. 以下の節は分類器の個々の結果である。 0.72
Model Target Mean AUROC モデル ターゲット AUROC (複数形 AUROCs) 0.59
Logistic Regression 0.69±0.10 0.70±0.12 0.70±0.11 0.59±0.03 0.62±0.05 Table 3. ロジスティック回帰 0.69±0.10 0.70±0.12 0.70±0.11 0.59±0.03 0.62±0.05 Table 3. 0.45
List of Classifiers, their targets and AUROC achieved (±1 standard deviation) 分類器のリストとそのターゲットおよびAUROC(±1標準偏差) 0.81
Driver Claims XGBoost (Exposure features) Driver Claims Driver Claims Journey Risk Journey Risk ドライバークレーム XGBoost (露出機能)ドライバークレーム ドライバークレーム ジャーニーリスク ジャーニーリスク 0.63
Combined Classifier Stacking Classifier 複合分類器 スタック分類器 0.68
XGBoost XGBoost 0.42
英語(論文から抽出)日本語訳スコア
3.1. Driver Classification Results 3.1. ドライバーの分類結果 0.58
Our final driver-level model had an AUROC of 0.70 ± 0.11 across the ten test-set folds. 最終ドライバーレベルモデルは10つのテストセットで0.70 ± 0.11のaurocを持っていた。 0.62
Additionally we obtained an area under the receiver-operator characteristic in the driver classification task of 0.70 ± 0.12 using only exposure features (i.e, Driven Journeys, Driven Distance, and Heartbeat Days Elapsed). また,0.70±0.12のドライバ分類タスクにおいて,被曝特性(駆動ジャーニー,駆動距離,心拍日経過)のみを用いて受信者-操作特性の領域を得た。 0.86
We were unable to achieve an AUROC higher than 0.6 using behavior features alone. 行動特徴だけではAUROCを0.6以上達成できなかった。 0.66
We find that scores are the most predictive in addition to either number of driven journeys, or total distance driven in miles. スコアは、駆動される旅の数、またはマイルで駆動される距離のどちらかに加えて、最も予測可能なものである。 0.62
See Figure 5 for an illustration of the relative feature importance in the driver classification models. ドライバ分類モデルにおける相対的な特徴の重要性を示す図5を参照してください。 0.80
9 of 14 Figure 5. 14人中9人 図5。 0.67
Top 5 highest magnitude coefficients for Logistic Regression in the Driver Claim Prediction Task, both positive and negative. ドライバクレーム予測タスクにおけるロジスティック回帰の最大5大係数は、正と負の両方である。 0.74
3.2. Journey Classification Results 3.2. Journeyの分類結果 0.60
Our journey-level model had an AUROC of 0.59 ± 0.03 for the journey classification task in the absence of driver features. 走行レベルモデルでは,運転者の特徴がない場合,走行分類タスクのaurocが0.09 ± 0.03であった。 0.59
See figure 8 for a listing of feature importance scores from an XGBoost model trained on journey features. トラベル機能に基づいてトレーニングされたXGBoostモデルの重要度スコアの一覧は、図8を参照してください。 0.67
英語(論文から抽出)日本語訳スコア
10 of 14 Figure 6. 14人中10人 図6。 0.64
Receiver-Operator characteristic over 10-fold cross validation for the stacking classifier in the driver classification task. ドライバ分類タスクにおけるスタック化分類器の10倍クロス検証に対する受信-オペレータ特性 0.78
The ROC for each of the ten folds is drawn in light colors. 各10折りのROCは明るい色で描画される。 0.66
Mean AUC across the ten folds is 0.70 with the mean ROC curve drawn in dark blue, and ±1 standard deviation is shaded in grey. 10 つの折りたたみ平均 auc は 0.70 で、平均 roc 曲線は暗青色で、±1 の標準偏差は灰色で色付けされる。 0.76
英語(論文から抽出)日本語訳スコア
11 of 14 Figure 7. 14人中11人 図7。 0.66
Receiver-Operator characteristic over 10-fold cross validation for an XGBoost model trained only on exposure features in the driver classification task. ドライバ分類タスクの露出特性のみに基づいてトレーニングされたxgboostモデルの10倍のクロス検証に対する受信-オペレータ特性。 0.76
The ROC for each of the ten folds is drawn in light colors. 各10折りのROCは明るい色で描画される。 0.66
Mean AUC across the ten folds is 0.70 with the mean ROC curve drawn in dark blue, and ±1 standard deviation is shaded in grey. 10 つの折りたたみ平均 auc は 0.70 で、平均 roc 曲線は暗青色で、±1 の標準偏差は灰色で色付けされる。 0.76
Figure 8. Top Five Feature importance scores for an XGBoost model trained on journey features. 図8。 トラベル機能に基づいてトレーニングされたXGBoostモデルの重要点のトップ5。 0.75
3.2.1. Combination of Journey-Driver Risk Assessment Results 3.2.1. 走行運転者リスクアセスメント結果の組合せ 0.49
We report an area under the receiver-operator characteristic of 0.62 ± 0.05 with the majority of the importance placed on the journey risk rather than the driver risk. 運転者リスクよりも走行リスクに重きを置いている場合,0.62 ± 0.05の受信者-操作特性の領域を報告した。 0.76
See table 3 for a summary of classifiers used, their targets, and area under the receiver-operator characteristic achieved. 使用する分類器、そのターゲット、受信者-操作特性の下の領域の要約の表3を参照。 0.75
英語(論文から抽出)日本語訳スコア
12 of 14 4. Discussion 14人中12人 4.討論 0.48
In this paper we have presented a model which is able to predict the likelihood on the next trip a driver takes with an AUROC of 0.62. 本稿では,運転者がAUROCの0.62で行う次の旅行の確率を予測できるモデルを提案する。 0.70
We have also explored a stacked model composed of XGBoost classifiers which was able to slightly improve the AUROC and tighten the ROC variance compared to a classifier trained on exposure features alone. また,露光特性のみを訓練した分類器と比較して,AUROCをわずかに改善し,ROCのばらつきを緩和できるXGBoost分類器からなる重ねモデルについても検討した。 0.78
We have shown that telematics derived features are predictive of claims propensity for drivers, and that the risk of a claim can be predicted in advance with some level of accuracy, even with data computed only nightly rather than real-time data. 我々は,リアルタイムデータよりも夜間にのみ計算されたデータであっても,テレマティクスがドライバのクレームの妥当性を予測すること,クレームのリスクをある程度の精度で予測できることを実証した。 0.82
Ultimately the prediction of claims risk in the near-future would allow an intervention and ideally a prevention of the claim. 最終的に、近未来におけるクレームリスクの予測は、介入と理想的にはクレームの予防を可能にする。 0.60
We note the significance of the work, some limitations and exciting possibilities for future work below. 作業の重要性、いくつかの制限、そして次の作業に対するエキサイティングな可能性に注目します。 0.57
4.1. Significance Much of the work in telematics has been around the derivation of features from raw data or the use of features to classify risky drivers for insurance premium pricing. 4.1. 意義 テレマティクスにおける作業の多くは、生データからの機能の派生や、リスクの高いドライバーを保険料の価格に分類するための機能の使用に関するものだった。
訳抜け防止モード: 4.1. 意義 テレマティクスの仕事の多くは、生データから特徴を導出することに関するものです 特徴の使用や 保険料価格のリスクの高いドライバを分類する。
0.55
We have shown that these features can be used to predict claims in advance, which opens the possibility of preventing that claim. これらの特徴が事前にクレームを予測するために有効であることを示しており、このクレームを防止できる可能性が開けている。 0.62
Claims range in severity but can cost tens of thousands of dollars and can result in injury or death of the driver or others. クレームは重大だが、何万ドルもの費用がかかる可能性があり、ドライバーの怪我や死亡につながる可能性がある。 0.58
Since telematics data is already being collected and stored such a claims prevention model would be inexpensive to implement but could have a great benefit to both the insurer and the insured. テレマティクスのデータはすでに収集され、保存されているので、そのような請求防止モデルは実装に安価であるが、保険会社と保険業者の両方にとって大きな利益がある。 0.56
4.2. Limitations The most important limitation of the present work is that it used black-box scores as features for classification, and data provided only at the trip level, rather than real-time. 4.2. 制限 この研究で最も重要な制限は、ブラックボックススコアを分類の特徴として使用し、リアルタイムではなくトリップレベルでのみ提供されるデータを使用することである。 0.60
Although our model was able to predict risky trips with a surprisingly high AUROC using trip level data, examination of real-time driving behavior would allow exploration of patterns in driving behavior immediately before incidents resulting in claims occurred and could further improve the classificaton results. 我々のモデルはトリップレベルデータを用いて驚くほど高いaurocでリスクの高いトリップを予測できたが、リアルタイム運転行動の検証により、事故発生直前の運転行動パターンの探索が可能となり、さらにクラスフィカトン結果を改善することができた。 0.73
Secondly, our risk analysis is based on population level statistics, which could be improved by using a more individual and personalized assessment of risk. 第2に、リスク分析は、より個人的でパーソナライズされたリスク評価を使用することで、人口レベルの統計に基づく。 0.66
There is an analogy with personalized nutrition, where it is likely that personalized advice may outperform advice based solely on population level statistics [24]. パーソナライズされた栄養の類推があり、パーソナライズされたアドバイスは、人口統計のみに基づくアドバイスよりも優れていると考えられる[24]。 0.64
In our case this introduces the questions • 私たちの場合、これは質問を紹介します。• 0.56
does influencing a driver away from patterns associated with claims at the population level decrease the claims propensity of that driver? ドライバーに集団レベルでの 主張のパターンからの影響は ドライバーの主張の妥当性を低下させるのか? 0.76
how can we best combine insights from population level studies and and personalized advice derived from a drivers own data only? 人口レベルの研究と、ドライバーのデータのみから導かれるパーソナライズされたアドバイスをどう組み合わせれば良いでしょうか? 0.75
• 4.3. Future Directions • 4.3. 今後の方向 0.48
An interesting direction for future research would be to experimentally test whether influencing drivers toward scores associated with lower risk could truly reduce their claims propensity. 将来の研究で興味深い方向は、低いリスクに関連するスコアにドライバーが影響するかどうかを実験的に検証することである。 0.69
Experimentally testing intervention strategies could address questions like 介入戦略を実験的にテストすれば 0.69
1. 2. 3. After identifying that a driver is at increased risk, what is the best method of intervention? 1. 2. 3. ドライバーがリスクが高いことを認識した後、介入の最良の方法は何ですか? 0.52
Does the timing of the intervention influence its effectiveness in reducing a driver’s risk? 介入のタイミングは、運転者のリスクを軽減する効果に影響しますか? 0.74
Can we identify the reason why the driver was considered to be at risk, and personalize the intervention to that individual? ドライバーが危険にさらされていると考えられる理由を特定し、その個人への介入をパーソナライズできますか? 0.73
(e.g, are there signatures in the data indicative of anger, alcohol consumption or extreme stress?) (例えば、怒り、アルコール摂取、極端なストレスを示すデータにサインがありますか?) 0.63
Another exciting direction for future work is the expansion of the statistics used in the classification of the journey risk. 将来の研究のもう一つのエキサイティングな方向は、旅行リスクの分類に使用される統計の拡張である。 0.72
In our case, we used differences and stacked frames to allow the classifier which expects IID tabular data to use the sequences of data. 本例では差分と重み付きフレームを用いて,ID 表データに対してデータのシーケンスを期待する分類を行う。 0.68
英語(論文から抽出)日本語訳スコア
13 of 14 Finally we found that oversampling was helpful in classifying driver risk, especially when using behavioral variables, where the minority class was oversampled to produce approximately a 1:3 ratio of positive to negative samples, but due to the grouped and sequential nature of the journey classification task, we did not use any oversampling for the journey classification task. 14人中13人 最後に、過サンプリングはドライバーリスクの分類に役立ち、特にマイノリティクラスをオーバーサンプリングして負のサンプルと正のサンプルの約1:3の比率を生成する行動変数を使用する場合には有効であったが、旅の分類タスクの集団的かつ逐次的な性質のため、旅の分類タスクのオーバーサンプリングは使用しなかった。 0.68
A suitable combination of oversampling and undersampling techniques may be of great use on such an imbalanced dataset. オーバーサンプリングとアンダーサンプリングの適切な組み合わせは、そのような不均衡データセットで非常に有用である。 0.62
It would be worthwhile to explore dataset augmentation with generative sequence models that fit this use case and examine their efficacy as a preprocessing tool in the journey prediction task. このユースケースに適合する生成シーケンスモデルによるデータセット拡張を探求し、旅程予測タスクにおける前処理ツールとしての有効性を検討する価値があるだろう。 0.78
Author Contributions: ‘Conceptualization, A.R.W. and M.G.; methodology, A.R.W., M.G., and T.A.; software, A.R.W and Y.J; validation, A.R.W, M.G.;investigation, M.G. and A.R.W.; resources, Y.J.; data curation, A.D, Y.J.; writing—original draft preparation, A.R.W; writing—review and editing, M.G, A.D.; visualization, A.R.W; supervision, M.G.; funding acquisition, M.G. All authors have read and agreed to the published version of the manuscript. 著者の貢献: 'conceptualization, a.r.w. and m.g.; methodology, a.r.w., m.g., and t.a.; software, a.r.w. and y.j; validation, a.r.w., m.g.;investigation, m.g. and a.r.w.; resources, y.j.; data curation, a.d, y.j.; writing— original draft prepared, a.r.w; writing—review and edit, m.g, a.d.; visualization, a.r.w; supervisor, m.g.;funding, m.g.g.; すべての著者は、原稿の公開版を読んで同意した。
訳抜け防止モード: 著者寄稿 : ‘概念化, A.R.W., M.G.; 方法論, A.R.W., M.G., T.A.; ソフトウェア, A.R.W, Y.J.; 検証 A.R.W, M.G.; investigation, M.G. and A.R.W.; resources, Y.J.; data curation, A.D. Y.J.; write – original draft prepared, A.R.W ; writing – review and editing, M.G. A.D.; visualization, A.R.W;監督、M.G.;資金調達、M.G. 原稿の出版版に 同意しました。
0.73
” Funding: This work was funded by a grant from the CSAA Insurance Group ” 資金提供:この仕事はCSAA保険会社の助成金で賄われた。 0.53
Institutional Review Board Statement: Not Applicable Institutional Review Boardの声明: 適用不可能 0.89
Informed Consent Statement: Not Applicable インフォームド・コンセント・ステートメント:適用不可能 0.53
Data Availability Statement: Due to the nature of this research, participants of this study did not agree for their data to be shared publicly, so supporting data is not available. データ可用性のステートメント: この調査の性質から、この調査の参加者は、データを公開して共有することに同意しておらず、データのサポートはできない。 0.78
Conflicts of Interest: Y.J. and A.D. Were employed by the funding company at the time research was conducted. 利益相反:y.j.とa.d.は、研究が行われた時点で資金会社に雇われていた。 0.63
References 1. Arumugam, S. 第1回参照。 Arumugam, S。 0.41
; Bhargavi, R. A survey on driving behavior analysis in usage based insurance using big data. Bhargavi, R. A Survey on driving behavior analysis in usage based insurance using big data。
訳抜け防止モード: ;Bhargavi, R. A survey on ビッグデータを用いた利用保険における運転行動分析
0.85
Journal of Big Data 2019, 6, 1–21. journal of big data 2019, 6, 1–21を参照。 0.76
Tselentis, D.I.; Yannis, G. tselentis, d.i.; yannis, g. 0.41
; Vlahogianni, E.I. Innovative insurance schemes: pay as/how you drive. Vlahogianni, E.I. Innovative Insurance schemes: pay as/how you driving. 0.47
Transportation Research Procedia 2016, 14, 362–371. 交通研究プロセディア2016、14、362-371。 0.58
Litman, T. Pay-as-you-drive pricing for insurance affordability. Litman, T. Pay-as-drive pricing for insurance available。 0.35
Victoria Transport Policy Institute (www. vtpi. org) 2004. Victoria Transport Policy Institute (www. vtpi. org) 2004年。 0.87
Guillen, M. ; Nielsen, J.P.; Ayuso, M. ギレン、m。 Nielsen, J.P., Ayuso, M。 0.66
; Pérez-Marín, A.M. Pérez-Marín, A.M。 0.74
The use of telematics devices to improve automobile insurance rates. 自動車保険率向上のためのテレマティクス装置の使用。 0.79
Risk analysis 2019, 39, 662–672. リスク分析 2019, 39, 662-672。 0.78
Boucher, J.P.; Côté, S. Boucher, J.P.; Côté, S. 0.48
; Guillen, M. Exposure as duration and distance in telematics motor insurance using generalized additive models. 一般化付加モデルを用いたテレマティクスモータ保険の持続時間と距離としてのGuillen, M. Exposure 0.79
Risks 2017, 5, 54. 2017年5月、54位。 0.57
Boucher, J.P.; Turcotte, R. A longitudinal analysis of the impact of distance driven on the probability of car accidents. Boucher, J.P.; Turcotte, R. 自動車事故発生確率に及ぼす距離の影響の経時的解析 0.78
Risks 2020, 8, 91. リスク2020,8,91。 0.58
Rohit, F. ; Kulathumani, V. ロヒト、f。 ; Kulat humani, V。 0.45
; Kavi, R. ; Elwarfalli, I. とkavi, r。 とElwarfalli, I。 0.61
; Kecojevic, V. は、Kecojevic, V。 0.90
; Nimbarte, A. Real-time drowsiness detection using wearable, lightweight brain sensing headbands. Nimbarte, A. ウェアラブルで軽量な脳波センサーヘッドバンドによるリアルタイムの眠気検出 0.66
IET Intelligent Transport Systems 2017, 11, 255–263. ietintelligent transport systems 2017年11月255-263日。 0.81
Abulkhair, M.F.; Salman, H.A.; Ibrahim, L.F. Using mobile platform to detect and alerts driver fatigue. Abulkhair, M.F.; Salman, H.A.; Ibrahim, L.F. モバイルプラットフォームを使用してドライバーの疲労を検出し警告する。 0.73
International Journal of Computer Applications 2015, 123. International Journal of Computer Applications 2015 123参照。 0.73
Carfora, M.F.; Martinelli, F. Carfora, M.F.; Martinelli, F. 0.47
; Mercaldo, F. ; Nardone, V. メルカルド,f。 Nardone, V。 0.39
; Orlando, A. ; Santone, A. オーランド、A。 サントーン、a。 0.47
; Vaglini, G. A “pay-how-you-drive” car insurance approach through cluster analysis. vagliniは、クラスタ分析による自動車保険の “pay-how-you-drive” アプローチを例に挙げている。 0.51
Soft Computing 2019, 23, 2863–2875. ソフトコンピューティング 2019, 23, 2863-2875。 0.75
2. 3. 4. 5. 2. 3. 4. 5. 0.43
6. 7. 8. 9. 6. 7. 8. 9. 0.42
10. Pesantez-Narvaez, J. 10. Pesantez-Narvaez, J。 0.43
; Guillen, M. ; Alcañiz, M. Predicting motor insurance claims using telematics data—XGBoost versus logistic ギレン, m。 テレマティクスデータを用いた自動車保険請求の予測―XGBoost対ロジスティック 0.55
regression. Risks 2019, 7, 70. レグレッション 2019年は7,70。 0.39
11. Hanafy, M. 11.ハナフィー、M。 0.60
; Ming, R. Machine learning approaches for auto insurance big data. 自動車保険ビッグデータのための機械学習アプローチ。 0.59
Risks 2021, 9, 42. リスク2021, 9, 42 0.58
12. Abdelhadi, S. 12. アブデルハーディ、s。 0.50
; Elbahnasy, K. エルバーナシー、K。 0.65
; Abdelsalam, M. A proposed model to predict auto insurance claims using machine learning techniques. abdelsalam, m. 機械学習手法を用いて, 自動車保険請求の予測モデルを提案する。 0.72
Journal of Theoretical and Applied Information Technology 2020, 98. The Journal of Theory and Applied Information Technology 2020, 98 (英語) 0.81
13. López, V. 13.López, V。 0.70
; Fernández, A. フェルナンデス (Fernández, A)。 0.50
; García, S. ガルシア (García, S。 0.60
; Palade, V. ; Herrera, F. An insight into classification with imbalanced data: Empirical results and プラーデ、v。 ;Herrera, F.不均衡データの分類に関する洞察:実証結果と考察 0.65
current trends on using data intrinsic characteristics. データ固有の特性の利用に関する現在のトレンド。 0.69
Information sciences 2013, 250, 113–141. 情報科学、2013年、250、113-141。 0.57
14. Haixiang, G. 14.haixiang,g。 0.68
; Yijing, L. と、Yijing, L。 0.64
; Shang, J. ; Mingyun, G. チャン、j。 ミンジュン、G。 0.58
; Yuanyue, H. ; Bing, G. Learning from class-imbalanced data: Review of methods and ユアニー、H。 ; Bing, G. クラス不均衡データから学ぶ:方法と方法のレビュー 0.70
applications. Expert systems with applications 2017, 73, 220–239. アプリケーション。 アプリケーションを持つエキスパートシステム 2017 73, 220–239。 0.80
15. Denil, M. 15) Denil, M。 0.74
; Trappenberg, T. Overlap versus imbalance. ; トラッペンバーグ, t. 重なりは不均衡である。 0.53
Canadian conference on artificial intelligence. 人工知能に関するカナダの会議。 0.70
Springer, 2010, pp. 220–231. 2010年、p.220-231。 0.61
16. Chawla, N.V.; Bowyer, K.W.; Hall, L.O.; Kegelmeyer, W.P. SMOTE: synthetic minority over-sampling technique. 16. Chawla, N.V.; Bowyer, K.W.; Hall, L.O.; Kegelmeyer, W.P. SMOTE: 合成マイノリティオーバーサンプリング技術 0.84
Journal of artificial journal of artificial(英語) 0.54
intelligence research 2002, 16, 321–357. 2002年、16, 321-357頁。 0.49
英語(論文から抽出)日本語訳スコア
17. Kotsiantis, S. 17) Kotsiantis, S。 0.35
; Kanellopoulos, D. カネッロプルロス, d。 0.43
; Pintelas, P. ; Pintelas, P。 0.39
; et al Handling imbalanced datasets: A review. バランスのとれないデータセットを扱う et al: レビュー。 0.70
GESTS international transactions on computer science and engineering 2006, 30, 25–36. GESTS国際取引 コンピュータ科学、工学、2006年、30年、25-36年。 0.56
Shalev-Shwartz, S. Shalev-Shwartz, S。 0.39
; Ben-David, S. Understanding machine learning: From theory to algorithms; Cambridge university press, 2014. Ben-David, S. Understanding Machine Learning: From theory to algorithm; Cambridge University Press, 2014 0.43
18. 19. Ma, Y.L.; Zhu, X. 18. 19. Ma, Y.L., Zhu, X 0.42
; Hu, X. ; Chiu, Y.C. The use of context-sensitive insurance telematics data in auto insurance rate making. は、Hu, X。 chiu, y.c. 自動車保険率作成におけるコンテキストセンシティブな保険テレマティクスデータの利用 0.77
Transportation Research Part A: Policy and Practice 2018, 113, 243–258. 交通 研究部 a:政策と実践 2018, 113, 243–258。 0.61
20. Chen, T. ; Guestrin, C. XGBoost: A Scalable Tree Boosting System. 20.チェン、t. Guestrin, C. XGBoost: スケーラブルなツリーブースティングシステム。 0.69
Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining; ACM: New York, NY, USA, 2016; KDD ’16, pp. 785–794. 第22回知識発見とデータマイニングに関する国際会議(sigkdd international conference on knowledge discovery and data mining; acm: new york, ny, usa, 2016; kdd ’16, pp. 785-794)の開催報告
訳抜け防止モード: 第22回ACM SIGKDD International Conference on Knowledge Discovery and Data Mining; ACM : New York, NY USA, 2016; KDD' 16, pp. 785–794.
0.83
doi:10.1145/2939672. 2939785. doi:10.1145/2939672. 2939785 0.15
21. Kovács, G. smote-variants: a Python Implementation of 85 Minority Oversampling Techniques. 21. kovács, g. smote-variants: 85のマイノリティオーバーサンプリング技術によるpythonの実装。 0.66
Neurocomputing 2019, 366, 352–354. ニューロコンピューティング2019, 366, 352–354。 0.58
(IF-2019=4.07), doi:10.1016/j.neucom .2019.06.100. (IF-2019=4.07), doi:10.1016/j.neucom .2019.06.100) 0.16
22. Lemaître, G. 22.レメートル、g。 0.59
; Nogueira, F. Nogueira, F。 0.33
; Aridas, C.K. Imbalanced-learn: A Python Toolbox to Tackle the Curse of Imbalanced Datasets in Machine aridas, c.k. imbalanced-learn: マシン内の不均衡データセットの呪いに取り組むpythonツールボックス 0.78
Learning. Journal of Machine Learning Research 2017, 18, 1–5. 学習。 Journal of Machine Learning Research 2017, 18, 1-5。 0.59
23. Pedregosa, F. 23. Pedregosa, F。 0.41
; Varoquaux, G. 英: Varoquaux, G。 0.37
; Gramfort, A. Gramfort, A。 0.64
; Michel, V. ; Thirion, B. ミシェル、V。 チリオン,b。 0.48
; Grisel, O. ; Blondel, M. グリセル、o。 ブロンデル (Blondel, M)。 0.39
; Prettenhofer, P. ; プレッテンホーファー, p。 0.45
; Weiss, R. ; Dubourg, V. Weiss, R。 ドゥブール(Dubourg, V)。 0.50
; et al 24. ; et al 24. 0.43
Scikit-learn: Machine Learning in Python. scikit-learn: pythonのマシンラーニング。 0.83
Journal of Machine Learning Research 2011, 12, 2825–2830. Journal of Machine Learning Research 2011, 12, 2825–2830。 0.46
Jinnette, R. ; Narita, A. ジネット、R。 成田,A。 0.37
; Manning, B. は、Manning, B。 0.74
; McNaughton, S.A.; Mathers, J.C.; Livingstone, K.M. Does personalized nutrition advice improve dietary intake in healthy adults? mcnaughton, s.a.; mathers, j.c.; livingstone, k.m. パーソナライズされた栄養アドバイスは健常成人の食事摂取を改善するか? 0.61
A systematic review of randomized controlled trials. ランダム化対照試験の体系的レビュー。 0.52
Advances in Nutrition 2021, 12, 657–669. 栄養2021年、1257-669年。 0.54
14 of 14 14人中14人 0.60
                             ページの最初に戻る

翻訳にはFugu-Machine Translatorを利用しています。