論文の概要: Multi-Scenario Highway Lane-Change Intention Prediction: A Temporal Physics-Informed Multi-Modal Framework
- arxiv url: http://arxiv.org/abs/2512.24075v1
- Date: Tue, 30 Dec 2025 08:36:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.328182
- Title: Multi-Scenario Highway Lane-Change Intention Prediction: A Temporal Physics-Informed Multi-Modal Framework
- Title(参考訳): テンポラル物理インフォームド・マルチモーダル・フレームワークによるマルチシナリオハイウェイレーンチェンジインテンション予測
- Authors: Jiazhao Shi, Ziyu Wang, Yichen Lin, Shoufeng Lu,
- Abstract要約: 車線変更意図予測は、自動運転とADASにとって安全に欠かせないものである。
本稿では,物理に着想を得たインタラクションキューと深部時間表現を融合するハイブリッドフレームワークであるTPI-AIを提案する。
TPI-AIはスタンドアローンのLightGBMとBi-LSTMベースラインより優れており、マクロF1は0.9562、0.9124、0.8345、ハイDは0.9247、0.8197、0.7605、T = 1, 2, 3 sである。
- 参考スコア(独自算出の注目度): 7.719990052862356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lane-change intention prediction is safety-critical for autonomous driving and ADAS, but remains difficult in naturalistic traffic due to noisy kinematics, severe class imbalance, and limited generalization across heterogeneous highway scenarios. We propose Temporal Physics-Informed AI (TPI-AI), a hybrid framework that fuses deep temporal representations with physics-inspired interaction cues. A two-layer bidirectional LSTM (Bi-LSTM) encoder learns compact embeddings from multi-step trajectory histories; we concatenate these embeddings with kinematics-, safety-, and interaction-aware features (e.g., headway, TTC, and safe-gap indicators) and train a LightGBM classifier for three-class intention recognition (No-LC, Left-LC, Right-LC). To improve minority-class reliability, we apply imbalance-aware optimization including resampling/weighting and fold-wise threshold calibration. Experiments on two large-scale drone-based datasets, highD (straight highways) and exiD (ramp-rich environments), use location-based splits and evaluate prediction horizons T = 1, 2, 3 s. TPI-AI outperforms standalone LightGBM and Bi-LSTM baselines, achieving macro-F1 of 0.9562, 0.9124, 0.8345 on highD and 0.9247, 0.8197, 0.7605 on exiD at T = 1, 2, 3 s, respectively. These results show that combining physics-informed interaction features with learned temporal embeddings yields robust multi-scenario lane-change intention prediction.
- Abstract(参考訳): 車線変更意図予測は、自律走行とADASにとって安全に欠かせないものであるが、騒音のキネマティクス、厳密な階級不均衡、異種高速道路のシナリオにおける限定的な一般化により、自然主義的な交通では依然として困難である。
本稿では,物理に着想を得たインタラクションキューと深部時間表現を融合するハイブリッドフレームワークであるTPI-AIを提案する。
双方向LSTM(Bi-LSTM)エンコーダは、多段階の軌道履歴からコンパクトな埋め込みを学習し、これらの埋め込みをキネマティクス、安全、相互作用認識機能(例えば、ヘッドウェイ、TTC、セーフギャップインジケータ)と結合し、3種類の意図認識のためのLightGBM分類器(No-LC、Left-LC、Right-LC)を訓練する。
少数クラスの信頼性を向上させるために,再サンプリング/重み付けと折り畳みしきい値のキャリブレーションを含む不均衡対応最適化を適用した。
2つの大規模なドローンベースのデータセット、HighD(直線ハイウェイ)とexiD(ランプリッチ環境)の実験では、位置ベースの分割を使用し、予測水平線T = 1, 2, 3 sを評価する。
TPI-AIはスタンドアローンのLightGBMとBi-LSTMベースラインを上回り、それぞれT = 1, 2, 3 sで0.9562, 0.9124, 0.8345、exiDで0.9247, 0.8197, 0.7605のマクロF1を達成する。
これらの結果から,物理インフォームド相互作用と学習時相埋め込みを組み合わせることで,ロバストなマルチシナリオレーン変化の意図予測が得られた。
関連論文リスト
- Empower Low-Altitude Economy: A Reliability-Aware Dynamic Weighting Allocation for Multi-modal UAV Beam Prediction [57.04985443535312]
低高度経済(LAE)は、都市空気移動、ロジスティクスドローン、空中センシングによって急速に拡大している。
現在の研究は、シングルシグナルからマルチモーダルコラボレーティブアプローチにシフトしている。
セマンティック・アウェアなマルチモーダルビーム予測フレームワークSaM2Bに,信頼性を考慮した動的重み付け手法を提案する。
論文 参考訳(メタデータ) (2025-12-30T16:24:34Z) - DiffusionDriveV2: Reinforcement Learning-Constrained Truncated Diffusion Modeling in End-to-End Autonomous Driving [65.7087560656003]
エンドツーエンドの自動運転のための生成拡散モデルは、しばしばモード崩壊に悩まされる。
強化学習を利用して低品質モードを制約し,優れた軌道探索を行うDiffusionDriveV2を提案する。
これにより、そのコアであるガウス混合モデル固有の多重モード性を維持しながら、全体的な出力品質が大幅に向上する。
論文 参考訳(メタデータ) (2025-12-08T17:29:52Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Multi-Scenario Highway Lane-Change Intention Prediction: A Physics-Informed AI Framework for Three-Class Classification [12.163383643700785]
車線変更操作は高速道路事故の主要な原因である。
本稿では,車体キネマティクス,インタラクション実現可能性,およびトラフィック安全メトリクスを学習プロセスに統合する物理インフォームドAIフレームワークを提案する。
99.8%の精度、93.6%のマクロF1、96.1%の精度、88.7%のマクロF1を1秒の地平線で表す。
論文 参考訳(メタデータ) (2025-09-22T05:17:54Z) - KEPT: Knowledge-Enhanced Prediction of Trajectories from Consecutive Driving Frames with Vision-Language Models [19.625631486595505]
本稿では,知識に富んだ視覚言語フレームワークであるKEPTを紹介する。
連続するフロントビュー駆動フレームから直接エゴ軌道を予測する。
オープンループプロトコル間の最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-09-03T03:10:42Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.776472262857045]
本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:07:49Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。