論文の概要: MOTOR: A Multimodal Dataset for Two-Wheeler Rider Behavior Understanding
- arxiv url: http://arxiv.org/abs/2605.22550v1
- Date: Thu, 21 May 2026 14:32:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.583678
- Title: MOTOR: A Multimodal Dataset for Two-Wheeler Rider Behavior Understanding
- Title(参考訳): MOTOR:二輪ライダー動作理解のためのマルチモーダルデータセット
- Authors: Varun A. Paturkar, Shankar Gangisetty, C. V. Jawahar,
- Abstract要約: グローバル・サウスでは2輪車が道路死傷者の不当な割合を占めている。
しかし、二輪ライダーの挙動に関する研究は四輪車よりはるかに遅れている。
大規模かつ多視点のマルチモーダルリソースであるMOtorized TwO-wheeler Rider データセットについて述べる。
- 参考スコア(独自算出の注目度): 17.259627750358046
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Two-wheelers account for a disproportionately high share of road fatalities in the Global South. Research on two-wheeler rider behavior, however, lags far behind four-wheelers, where multimodal datasets have driven major advances in Advanced Driver Assistance Systems (ADAS). To address this gap, we present the MOtorized TwO-wheeler Rider (MOTOR) dataset, the first large-scale, multi-view, multimodal resource dedicated to two-wheelers in dense, unstructured traffic. MOTOR comprises 1,629 sequences (25+ hours of video data) collected from 16 riders and integrates synchronized front, rear, and helmet videos, rider eye-gaze from wearable trackers, on-road audio, and telemetry (GPS, accelerometer, gyroscope). Rich annotations capture traffic context, rider state, 12 riding maneuvers spanning conventional and unconventional behaviors, and legality labels (Legal, Illegal, Unspecified). We benchmark rider behavior recognition and maneuver legality classification using state-of-the-art video action recognition backbones (CNN and Transformer-based), extended with multimodal fusion, and find that combining RGB, gaze, and telemetry consistently yields the best performance. MOTOR thus provides a unique foundation for advancing safety-critical understanding of two-wheeler riding. It offers the research community a benchmark to develop and evaluate models for behavior analysis, legality-aware prediction, and intelligent transportation systems. Dataset and code is available at https: //varuniiith.github.io/MOTOR-Dataset/
- Abstract(参考訳): グローバル・サウスでは2輪車が道路死傷者の不当な割合を占めている。
しかし、二輪車ライダーの挙動の研究は、4輪車よりもはるかに遅れており、マルチモーダルデータセットはアドバンスト・ドライバー・アシスト・システム(ADAS)に大きな進歩をもたらした。
このギャップに対処するため,モータライズTwO-wheeler Rider (motoR) データセットを提示する。
MOTORは16人のライダーから収集された1,629のシーケンス(25時間以上のビデオデータ)と、同期された前、後、ヘルメットのビデオ、ウェアラブルトラッカーからのライダー視線、オンロードオーディオ、テレメトリ(GPS、加速度計、ジャイロスコープ)を統合している。
リッチアノテーションは、交通状況、ライダーの状態、従来と非伝統的な行動にまたがる12の乗馬操作、および合法性ラベル(Legal, Illegal, Unspecified)をキャプチャする。
我々は,最新の映像行動認識バックボーン(CNNとTransformerベース)を用いて,ライダーの動作認識と動作の合法性分類をベンチマークし,マルチモーダル融合により拡張し,RGB,視線,テレメトリを組み合わせることで,常に最高のパフォーマンスが得られることを発見した。
したがって、MOTORは二輪車の安全性を批判的に理解するためのユニークな基盤を提供する。
研究コミュニティに行動分析、合法性を考慮した予測、インテリジェント交通システムのためのモデルの開発と評価のためのベンチマークを提供する。
dataset and code are available at https: //varuniiith.github.io/motoR-Dataset/
関連論文リスト
- BATON: A Multimodal Benchmark for Bidirectional Automation Transition Observation in Naturalistic Driving [18.15118596168445]
既存の運転自動化(DA)システムは、DAにいつ参加するかを決めるために人間のドライバーに依存している。
BATONは127人のドライバーと136.6時間の運転における現実のDA使用量を自然言語で分析するデータセットである。
データセットは、フロントビュービデオ、キャビン内ビデオ、デコードされたCANバス信号、レーダーベースのリード車間相互作用、GPSからのルートコンテキストを同期する。
その結果、フロントビュービデオは運転状態ではなく道路状況を捉え、インキャビンビデオは運転準備を反映するが、外部シーンは反映しないことがわかった。
論文 参考訳(メタデータ) (2026-04-08T16:29:24Z) - HetroD: A High-Fidelity Drone Dataset and Benchmark for Autonomous Driving in Heterogeneous Traffic [49.31491001465465]
HetroDは、異種環境で自律走行システムを開発するためのデータセットとベンチマークである。
HetroDは、VRU(vulner- able road users)が支配する現実の異種交通のナビゲーティングにおける重要な課題をターゲットにしている。
論文 参考訳(メタデータ) (2026-02-03T12:12:47Z) - BikeActions: An Open Platform and Benchmark for Cyclist-Centric VRU Action Recognition [0.2339805471804333]
FUSE-Bikeは、その種の最初の完全にオープンな認識プラットフォームである。
BikeActionsは5つのアクションクラスにわたる852の注釈付きサンプルからなる、新しいマルチモーダルデータセットである。
我々は、公開されたデータ分割に基づいて、最先端のグラフ畳み込みとトランスフォーマーベースのモデルを評価することで、厳密なベンチマークを確立する。
論文 参考訳(メタデータ) (2026-01-15T15:47:46Z) - myEye2Wheeler: A Two-Wheeler Indian Driver Real-World Eye-Tracking Dataset [0.0]
本稿では,2輪運転者の実世界の視線行動のユニークなリソースであるmyEye2Wheelerデータセットを提案する。
われわれのデータセットは、インド人の二輪運転者の意思決定に関するユニークな視覚的注意パターンと洞察に重要なレンズを提供する。
論文 参考訳(メタデータ) (2025-02-18T10:39:00Z) - DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments [60.69159598130235]
Vulnerable Road Users (VRU) の高表現による認識手法の評価を目的とした新しいデータセット DAVE を提案する。
DAVEは16種類のアクターカテゴリー(動物、人間、車など)と16種類のアクションタイプ(カットイン、ジグザグ運動、Uターンなど、複雑で稀なケース)を手動でアノテートしたデータセットである。
実験の結果,既存の手法はDAVEで評価すると性能の劣化に悩まされ,将来的なビデオ認識研究のメリットを浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2024-12-28T06:13:44Z) - M2DA: Multi-Modal Fusion Transformer Incorporating Driver Attention for Autonomous Driving [11.36165122994834]
自律運転にドライバ注意(M2DA)を組み込んだ多モード核融合トランスを提案する。
ドライバーの注意を取り入れることで、自動運転車に人間のようなシーン理解能力を付与し、重要な領域を正確に特定し、安全性を確保する。
論文 参考訳(メタデータ) (2024-03-19T08:54:52Z) - Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。
データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。