論文の概要: Evaluating the Determinants of Mode Choice Using Statistical and Machine
Learning Techniques in the Indian Megacity of Bengaluru
- arxiv url: http://arxiv.org/abs/2401.13977v1
- Date: Thu, 25 Jan 2024 06:37:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 15:34:40.101076
- Title: Evaluating the Determinants of Mode Choice Using Statistical and Machine
Learning Techniques in the Indian Megacity of Bengaluru
- Title(参考訳): ベンガルのインドの都市における統計的・機械学習技術を用いたモード選択の決定要因の評価
- Authors: Tanmay Ghosh and Nithin Nagaraj
- Abstract要約: 本研究はバンガロール市の低所得層と低所得層に属する1350ドル世帯のデータセットを利用した。
精度の面では、ランダムフォレストモデルは、他のすべてのモデルと比較して、トレーニングデータで0.788ドル、テストデータで0.605ドルと最高のパフォーマンスを示した。
この研究は、特徴の重要性や個々の条件予測プロットのような近代的な解釈可能性技術を採用してきた。
- 参考スコア(独自算出の注目度): 1.8130068086063336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The decision making involved behind the mode choice is critical for
transportation planning. While statistical learning techniques like discrete
choice models have been used traditionally, machine learning (ML) models have
gained traction recently among the transportation planners due to their higher
predictive performance. However, the black box nature of ML models pose
significant interpretability challenges, limiting their practical application
in decision and policy making. This study utilised a dataset of $1350$
households belonging to low and low-middle income bracket in the city of
Bengaluru to investigate mode choice decision making behaviour using
Multinomial logit model and ML classifiers like decision trees, random forests,
extreme gradient boosting and support vector machines. In terms of accuracy,
random forest model performed the best ($0.788$ on training data and $0.605$ on
testing data) compared to all the other models. This research has adopted
modern interpretability techniques like feature importance and individual
conditional expectation plots to explain the decision making behaviour using ML
models. A higher travel costs significantly reduce the predicted probability of
bus usage compared to other modes (a $0.66\%$ and $0.34\%$ reduction using
Random Forests and XGBoost model for $10\%$ increase in travel cost). However,
reducing travel time by $10\%$ increases the preference for the metro ($0.16\%$
in Random Forests and 0.42% in XGBoost). This research augments the ongoing
research on mode choice analysis using machine learning techniques, which would
help in improving the understanding of the performance of these models with
real-world data in terms of both accuracy and interpretability.
- Abstract(参考訳): 交通計画にはモード選択の背後にある意思決定が不可欠である。
離散選択モデルのような統計的学習手法は伝統的に用いられてきたが、機械学習(ml)モデルは高い予測性能のために近年輸送計画家の間で注目を集めている。
しかし、MLモデルのブラックボックスの性質は重要な解釈可能性の問題を引き起こし、意思決定や政策決定における実践的応用を制限している。
本研究は,ベンガルル市の低中所得層に属する1350ドル世帯のデータセットを用いて,多項ロジットモデルと決定木,ランダム林,極勾配ブースティング,サポートベクターマシンなどのml分類器を用いたモード選択意思決定行動を調査した。
正確性という点では、ランダムフォレストモデルは、他の全てのモデルと比較して、最高(トレーニングデータに0.788ドル、テストデータに0.605ドル)を達成した。
本研究は、MLモデルを用いた意思決定行動を説明するために、特徴重要度や個別条件予測プロットのような現代的な解釈可能性技術を採用した。
旅行費が高くなると、他のモードと比較して予測されるバス利用の確率が大幅に減少する(ランダム森林とxgboostモデルを用いた0.66\%$と0.34\%$$で旅行費が10\%上昇する)。
しかし、移動時間を10\%$に短縮すると、メトロの好みが向上する(ランダム森林では0.16\%$、xgboostでは0.142%)。
この研究は、機械学習技術を用いたモード選択分析に関する現在進行中の研究を強化し、正確性と解釈可能性の両方の観点から、これらのモデルのパフォーマンスの理解を改善するのに役立つ。
関連論文リスト
- Language models scale reliably with over-training and on downstream tasks [121.69867718185125]
スケーリング法則は、高価なトレーニング実行を引き出すための有用なガイドである。
しかし、現在の研究と言語モデルがどのように訓練されているかには差がある。
対照的に、スケーリング法則は主に推論における損失を予測するが、モデルは通常下流のタスクのパフォーマンスで比較される。
論文 参考訳(メタデータ) (2024-03-13T13:54:00Z) - Fast Model Debias with Machine Unlearning [54.32026474971696]
ディープニューラルネットワークは多くの現実世界のシナリオでバイアスのある振る舞いをする。
既存のデバイアス法は、バイアスラベルやモデル再トレーニングのコストが高い。
バイアスを特定し,評価し,除去するための効率的なアプローチを提供する高速モデル脱バイアスフレームワーク(FMD)を提案する。
論文 参考訳(メタデータ) (2023-10-19T08:10:57Z) - COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically
for Model-Based RL [50.385005413810084]
ダイナスタイルのモデルベース強化学習には、ポリシー学習と実環境探索のためのサンプルを生成するモデルロールアウトという2つのフェーズが含まれる。
$textttCOPlanner$は、不正確な学習された動的モデル問題に対処するモデルベースのメソッドのための計画駆動フレームワークである。
論文 参考訳(メタデータ) (2023-10-11T06:10:07Z) - Anytime Model Selection in Linear Bandits [61.97047189786905]
ALEXPは,その後悔に対するM$への依存を指数関数的に改善した。
提案手法は,オンライン学習と高次元統計学の新たな関連性を確立するために,ラッソの時間的一様解析を利用する。
論文 参考訳(メタデータ) (2023-07-24T15:44:30Z) - Model-based micro-data reinforcement learning: what are the crucial
model properties and which model to choose? [0.2836066255205732]
我々は,マイクロデータモデルに基づく強化学習(MBRL)に寄与する。
マルチモーダルな後続予測を必要とする環境では、混合密度ネットは他のモデルよりも大きなマージンで優れていることがわかった。
また、決定論的モデルは同等であり、実際、確率論的モデルよりも一貫して(非目立ったことではないが)優れていることも見出した。
論文 参考訳(メタデータ) (2021-07-24T11:38:25Z) - Exploring Sparse Expert Models and Beyond [51.90860155810848]
Mixture-of-Experts (MoE) モデルは、無数のパラメータを持つが、一定の計算コストで有望な結果が得られる。
本稿では,専門家を異なるプロトタイプに分割し,上位1ドルのルーティングに$k$を適用する,エキスパートプロトタイピングというシンプルな手法を提案する。
この戦略は, モデル品質を向上させるが, 一定の計算コストを維持するとともに, 大規模モデルのさらなる探索により, 大規模モデルの訓練に有効であることが示唆された。
論文 参考訳(メタデータ) (2021-05-31T16:12:44Z) - Using Adversarial Attacks to Reveal the Statistical Bias in Machine
Reading Comprehension Models [4.769747792846005]
我々は,MDCモデルを攻撃し,これらのモデルにおける統計的バイアスを明らかにするための,単純かつ効果的な手法を実証する。
BERT、ALBERT、RoBERTaなど、事前訓練済みの言語モデルでは、これらのオプションが問題に無関係である場合でも、いくつかのオプションに対して一貫した好みを示すことが判明した。
しかし、人間読者はこれらの無関係な選択肢の影響をはっきりと受けていない。
論文 参考訳(メタデータ) (2021-05-24T07:35:56Z) - VAE-LIME: Deep Generative Model Based Approach for Local Data-Driven
Model Interpretability Applied to the Ironmaking Industry [70.10343492784465]
モデル予測だけでなく、その解釈可能性も、プロセスエンジニアに公開する必要があります。
LIMEに基づくモデルに依存しない局所的解釈可能性ソリューションが最近出現し、元の手法が改良された。
本稿では, 燃焼炉で生成する高温金属の温度を推定するデータ駆動型モデルの局所的解釈可能性に関する新しいアプローチ, VAE-LIMEを提案する。
論文 参考訳(メタデータ) (2020-07-15T07:07:07Z) - Learning the Stein Discrepancy for Training and Evaluating Energy-Based
Models without Sampling [30.406623987492726]
非正規化密度モデルの評価と訓練のための新しい手法を提案する。
データ密度$p(x)$とデータのベクトル関数で定義されるモデル密度$q(x)$とのスタイン差を推定する。
これは、既存の手法を高次元データで上回る、新しい適合性テストをもたらす。
論文 参考訳(メタデータ) (2020-02-13T16:39:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。