論文の概要: RailSafeNet: Visual Scene Understanding for Tram Safety
- arxiv url: http://arxiv.org/abs/2509.12125v1
- Date: Mon, 15 Sep 2025 16:51:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.410237
- Title: RailSafeNet: Visual Scene Understanding for Tram Safety
- Title(参考訳): RailSafeNet: トラフィックの安全性を視覚的に理解する
- Authors: Ing. Ondrej Valach, Ing. Ivan Gruber,
- Abstract要約: RailSafeNetは、セマンティックセグメンテーション、オブジェクト検出と距離アセスメントを融合してトラックの侵入をハイライトするリアルタイムフレームワークである。
モノクロビデオのみを使用して、システムはレールを特定し、近くの物体をローカライズし、投影された距離を標準の1435mmレールゲージと比較することでリスクを分類する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tram-human interaction safety is an important challenge, given that trams frequently operate in densely populated areas, where collisions can range from minor injuries to fatal outcomes. This paper addresses the issue from the perspective of designing a solution leveraging digital image processing, deep learning, and artificial intelligence to improve the safety of pedestrians, drivers, cyclists, pets, and tram passengers. We present RailSafeNet, a real-time framework that fuses semantic segmentation, object detection and a rule-based Distance Assessor to highlight track intrusions. Using only monocular video, the system identifies rails, localises nearby objects and classifies their risk by comparing projected distances with the standard 1435mm rail gauge. Experiments on the diverse RailSem19 dataset show that a class-filtered SegFormer B3 model achieves 65% intersection-over-union (IoU), while a fine-tuned YOLOv8 attains 75.6% mean average precision (mAP) calculated at an intersection over union (IoU) threshold of 0.50. RailSafeNet therefore delivers accurate, annotation-light scene understanding that can warn drivers before dangerous situations escalate. Code available at https://github.com/oValach/RailSafeNet.
- Abstract(参考訳): トラムと人間の相互作用の安全性は重要な課題であり、路面電車は人口密度の高い地域で頻繁に運行され、衝突は軽傷から致命的な結果まで様々である。
本稿では, 歩行者, ドライバー, サイクリスト, ペット, 路面電車利用者の安全を向上するために, デジタル画像処理, ディープラーニング, 人工知能を活用したソリューションの設計の観点から, この問題に対処する。
セマンティックセグメンテーション、オブジェクト検出、ルールベースの距離評価を融合したリアルタイムフレームワークであるRailSafeNetを紹介します。
モノクロビデオのみを使用して、システムはレールを特定し、近くの物体をローカライズし、投影された距離を標準の1435mmレールゲージと比較することでリスクを分類する。
多様なRailSem19データセットの実験では、クラスフィルタのSegFormer B3モデルが65%の交叉結合(IoU)を実現し、微調整のYOLOv8は75.6%の平均精度(mAP)が結合(IoU)閾値0.50で計算された。
そのため、RailSafeNetは、危険な状況がエスカレートする前にドライバーに警告できる正確な、アノテーションによるシーン理解を提供する。
コードはhttps://github.com/oValach/RailSafeNet.comで公開されている。
関連論文リスト
- Safety-Critical Learning for Long-Tail Events: The TUM Traffic Accident Dataset [6.420737230522813]
我々は,現実の高速道路事故の集合体であるTUM交通事故データセットを提示する。
294,924のラベル付き2Dと93,012のラベル付き3Dボックスと48,144のラベル付きフレームのトラックIDが4台の路面カメラとLiDARから10Hzで記録されている。
本稿では,ルールに基づくアプローチと学習に基づくアプローチを組み合わせた事故検出モデルであるAccid3nDを提案する。
論文 参考訳(メタデータ) (2025-08-20T09:38:50Z) - DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments [60.69159598130235]
Vulnerable Road Users (VRU) の高表現による認識手法の評価を目的とした新しいデータセット DAVE を提案する。
DAVEは16種類のアクターカテゴリー(動物、人間、車など)と16種類のアクションタイプ(カットイン、ジグザグ運動、Uターンなど、複雑で稀なケース)を手動でアノテートしたデータセットである。
実験の結果,既存の手法はDAVEで評価すると性能の劣化に悩まされ,将来的なビデオ認識研究のメリットを浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2024-12-28T06:13:44Z) - TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes [49.43995864524434]
本稿では,画像間クラウド登録(I2P)手法であるTrafficLocを提案する。
大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。
我々のTrafficLocは、Carla Intersection上でSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータに対してよく一般化する。
論文 参考訳(メタデータ) (2024-12-13T17:42:53Z) - Intelligent Railroad Grade Crossing: Leveraging Semantic Segmentation and Object Detection for Enhanced Safety [0.11999555634662631]
RHGCの事故と遅れは、アメリカ合衆国連邦鉄道管理局(FRA)に重大な安全上の懸念をもたらす。
本研究では、機械学習とコンピュータビジョン技術を活用してRHGCの安全性を高めるインテリジェントシステムを提案する。
論文 参考訳(メタデータ) (2024-03-17T02:15:15Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - CabiNet: Scaling Neural Collision Detection for Object Rearrangement
with Procedural Scene Generation [54.68738348071891]
私たちはまず、さまざまな日常環境において、650万以上の散らばったシーン(前よりも桁違いに多い)を生成します。
このデータから合成部分点雲をレンダリングし、それをCabiNetモデルアーキテクチャのトレーニングに使用します。
CabiNetは、オブジェクトとシーンポイントの雲を受け入れる衝突モデルである。
論文 参考訳(メタデータ) (2023-04-18T21:09:55Z) - Rail Detection: An Efficient Row-based Network and A New Benchmark [16.811407800603664]
7432対のイメージとアノテーションを備えた実世界の鉄道データセットRail-DBを提示する。
軽量な畳み込みバックボーンとアンカー分類器を備えた効率的な行ベースレール検出手法であるRail-Netを提案する。
我々はRail-Net on Rail-DBについて,ResNetからVision Transformerに至るまでのクロスシーン設定やネットワークバックボーンを含む広範な実験により評価した。
論文 参考訳(メタデータ) (2023-04-12T07:44:50Z) - Infrastructure-based End-to-End Learning and Prevention of Driver
Failure [68.0478623315416]
フェールネットは、規模が拡大したミニ都市において、名目上と無謀なドライバーの両方の軌道上で、エンドツーエンドでトレーニングされた、繰り返しニューラルネットワークである。
制御障害、上流での認識エラー、ドライバーのスピードを正確に識別し、名目運転と区別することができる。
速度や周波数ベースの予測器と比較すると、FailureNetのリカレントニューラルネットワーク構造は予測能力を向上し、ハードウェアにデプロイすると84%以上の精度が得られる。
論文 参考訳(メタデータ) (2023-03-21T22:55:51Z) - TPE-Net: Track Point Extraction and Association Network for Rail Path
Proposal Generation [1.9181913148426697]
本稿では,TPE-Netと呼ばれる畳み込み型エンコーダデコーダアーキテクチャを提案する。
カメラパラメータや3Dデータ、幾何学的制約に依存することなく、強力な鉄道経路仮説を生成する。
論文 参考訳(メタデータ) (2023-02-11T22:49:06Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - Identifying safe intersection design through unsupervised feature
extraction from satellite imagery [9.306618776574025]
世界保健機関(WHO)は、より安全な交差点の設計を、世界の道路トラウマを減らす重要な介入として挙げている。
およそ90万枚の衛星画像がオーストラリアのすべての交差点でダウンロードされ、道路インフラを強調したコンピュータビジョン技術がカスタマイズされた。
ディープオートエンコーダは、交差点のタイプ、サイズ、形状、レーンマーキング、複雑さなどの高レベルな特徴を抽出した。
論文 参考訳(メタデータ) (2020-10-29T03:42:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。