論文の概要: RaX-Crash: A Resource Efficient and Explainable Small Model Pipeline with an Application to City Scale Injury Severity Prediction
- arxiv url: http://arxiv.org/abs/2512.07848v1
- Date: Wed, 26 Nov 2025 00:05:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 04:16:52.512622
- Title: RaX-Crash: A Resource Efficient and Explainable Small Model Pipeline with an Application to City Scale Injury Severity Prediction
- Title(参考訳): RaX-Crash: 資源効率よく説明可能な小型モデルパイプラインと都市規模傷害重症度予測への応用
- Authors: Di Zhu, Chen Xie, Ziwei Wang, Haoyun Zhang,
- Abstract要約: RaX-Crashは、構造化損傷重症度予測のためのリソース効率が高く説明可能な小型モデルパイプラインである。
RaX-Crashは3つの連結テーブルと数千万のレコードを統合し、分割ストレージに統一された機能スキーマを構築し、コンパクトなツリーベースのアンサンブルを訓練する。
XGBoost と Random Forest は 0.7828 と 0.7794 の精度を達成し、明らかに SLM を上回っている。
- 参考スコア(独自算出の注目度): 8.426572292158992
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: New York City reports over one hundred thousand motor vehicle collisions each year, creating substantial injury and public health burden. We present RaX-Crash, a resource efficient and explainable small model pipeline for structured injury severity prediction on the official NYC Motor Vehicle Collisions dataset. RaX-Crash integrates three linked tables with tens of millions of records, builds a unified feature schema in partitioned storage, and trains compact tree based ensembles (Random Forest and XGBoost) on engineered tabular features, which are compared against locally deployed small language models (SLMs) prompted with textual summaries. On a temporally held out test set, XGBoost and Random Forest achieve accuracies of 0.7828 and 0.7794, clearly outperforming SLMs (0.594 and 0.496); class imbalance analysis shows that simple class weighting improves fatal recall with modest accuracy trade offs, and SHAP attribution highlights human vulnerability factors, timing, and location as dominant drivers of predicted severity. Overall, RaX-Crash indicates that interpretable small model ensembles remain strong baselines for city scale injury analytics, while hybrid pipelines that pair tabular predictors with SLM generated narratives improve communication without sacrificing scalability.
- Abstract(参考訳): ニューヨーク市は毎年10万台以上の自動車事故を報告しており、重傷と公衆衛生上の負担を負っている。
本稿では, 資源効率が高く説明可能な小型モデルパイプラインであるRaX-Crashについて, 公式のNYC Motor Vehicle Collisionsデータセット上での損傷重大度予測について紹介する。
RaX-Crashは3つの連結テーブルを数千万のレコードと統合し、分割ストレージに統一された機能スキーマを構築し、木ベースのアンサンブル(ランサムフォレストとXGBoost)を設計したタブ形式の機能で訓練する。
XGBoost と Random Forest は、時間的に維持されたテストセットにおいて、0.7828 と 0.7794 の精度を達成し、SLM を明らかに上回り(0.594 と 0.496 )、クラス不均衡分析により、単純なクラス重み付けは致命的なリコールを適度な精度で改善し、SHAP の帰属は人間の脆弱性要因、タイミング、位置を予測された重症度の主要な要因として強調している。
全体として、RaX-Crashは、解釈可能な小さなモデルのアンサンブルは、都市規模のケガ分析の強力なベースラインであり、一方SLMと表層予測器を組み合わせたハイブリッドパイプラインは、スケーラビリティを犠牲にすることなく通信を改善することを示唆している。
関連論文リスト
- Modest-Align: Data-Efficient Alignment for Vision-Language Models [67.48633659305592]
クロスモーダルアライメントモデルは、リソース制約のある環境での運用において、過信と劣化したパフォーマンスに悩まされることが多い。
我々は,ロバスト性と効率性に配慮した軽量アライメントフレームワークであるModest-Alignを提案する。
本手法は,実世界の低リソースシナリオにおけるクロスモーダルアライメントを実現するための,実用的でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-10-24T16:11:10Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Tabular Data with Class Imbalance: Predicting Electric Vehicle Crash Severity with Pretrained Transformers (TabPFN) and Mamba-Based Models [0.9874634324357792]
本研究では,テキサスから2023年までの現実の事故データを用いて,電気自動車(EV)衝突事故の事故重大度を予測する枠組みを提案する。
3つの最先端の深層表モデル、TabPFN、MambaNet、MambaAttentionが重度予測のためにベンチマークされた。
MambaAttentionは、注意に基づく特徴再重み付けによる重傷症例の分類において優れた性能を示した。
論文 参考訳(メタデータ) (2025-09-14T21:46:17Z) - Predicting and Explaining Traffic Crash Severity Through Crash Feature Selection [1.0941365324532635]
この研究は、オハイオ州で6~2022年に起きた事故に300万人以上の人が関わったデータセットを紹介します。
主な貢献は、自動機械学習(AutoML)と説明可能な人工知能(AI)を組み合わせて、深刻なクラッシュに関連する主要なリスク要因を特定し、解釈する、透過的で再現可能な方法論である。
主な特徴は、人口統計、環境、車両、人的および運用上のカテゴリーで、位置タイプや投稿速度、居住年齢の最小化、クレーシュ前の行動などが含まれる。
論文 参考訳(メタデータ) (2025-08-15T14:31:26Z) - LLMs as World Models: Data-Driven and Human-Centered Pre-Event Simulation for Disaster Impact Assessment [6.787695140978638]
本研究では,複数の大規模言語モデル(LLM)について検討し,地震の影響を推定する。
我々のフレームワークは、ジップコードと郡規模で修正メルカリー強度(MMI)予測を生成する。
2014年ナパ地震と2019年リッジクレスト地震のUSGS'Did You Feel It?
論文 参考訳(メタデータ) (2025-06-02T22:07:53Z) - Enhancing Crash Frequency Modeling Based on Augmented Multi-Type Data by Hybrid VAE-Diffusion-Based Generative Neural Networks [25.772405506451204]
衝突頻度モデリングにおける重要な課題は、過剰なゼロ観測の頻度である。
我々は、ゼロ観測を減らすために、ハイブリッドなVAE拡散ニューラルネットワークを提案する。
我々は、類似性、正確性、多様性、構造的整合性といった指標を用いて、このモデルによって生成された合成データ品質を評価する。
論文 参考訳(メタデータ) (2025-01-17T07:53:27Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study [61.65123150513683]
CLIPのようなマルチモーダル基盤モデルは、最先端のゼロショット結果を生成する。
これらのモデルは、ImageNetでトレーニングされた教師付きモデルのパフォーマンスを一致させることで、ロバスト性ギャップを埋めることが報告されている。
CLIPは、ベンチマーク上の教師付きImageNetモデルと比較して、かなりの堅牢性低下をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-15T17:33:49Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - ParkPredict: Motion and Intent Prediction of Vehicles in Parking Lots [65.33650222396078]
我々は、駐車場環境を開発し、人間の駐車操作のデータセットを収集する。
本稿では,多モード長短期記憶(LSTM)予測モデルと畳み込みニューラルネットワークLSTM(CNN-LSTM)を物理ベースの拡張カルマンフィルタ(EKF)ベースラインと比較する。
以上の結果から,1) 意図をよく推定できる(LSTMとCNN-LSTMモデルによる約85% のトップ1精度と100% トップ3精度),2) 運転者の意図する駐車場所の知識が駐車軌跡の予測に大きく影響すること,3) 環境の意味的表現について考察した。
論文 参考訳(メタデータ) (2020-04-21T20:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。