論文の概要: TPE-Net: Track Point Extraction and Association Network for Rail Path
Proposal Generation
- arxiv url: http://arxiv.org/abs/2302.05803v1
- Date: Sat, 11 Feb 2023 22:49:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 18:24:04.244087
- Title: TPE-Net: Track Point Extraction and Association Network for Rail Path
Proposal Generation
- Title(参考訳): TPE-Net:レールパス提案生成のためのトラックポイント抽出とアソシエーションネットワーク
- Authors: Jungwon Kang, Mohammadjavad Ghorbanalivakili, Gunho Sohn, David Beach,
and Veronica Marin
- Abstract要約: 本稿では,TPE-Netと呼ばれる畳み込み型エンコーダデコーダアーキテクチャを提案する。
カメラパラメータや3Dデータ、幾何学的制約に依存することなく、強力な鉄道経路仮説を生成する。
- 参考スコア(独自算出の注目度): 1.9181913148426697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One essential feature of an autonomous train is minimizing collision risks
with third-party objects. To estimate the risk, the control system must
identify topological information of all the rail routes ahead on which the
train can possibly move, especially within merging or diverging rails. This
way, the train can figure out the status of potential obstacles with respect to
its route and hence, make a timely decision. Numerous studies have successfully
extracted all rail tracks as a whole within forward-looking images without
considering element instances. Still, some image-based methods have employed
hard-coded prior knowledge of railway geometry on 3D data to associate
left-right rails and generate rail route instances. However, we propose a rail
path extraction pipeline in which left-right rail pixels of each rail route
instance are extracted and associated through a fully convolutional
encoder-decoder architecture called TPE-Net. Two different regression branches
for TPE-Net are proposed to regress the locations of center points of each rail
route, along with their corresponding left-right pixels. Extracted rail pixels
are then spatially clustered to generate topological information of all the
possible train routes (ego-paths), discarding non-ego-path ones. Experimental
results on a challenging, publicly released benchmark show true-positive-pixel
level average precision and recall of 0.9207 and 0.8721, respectively, at about
12 frames per second. Even though our evaluation results are not higher than
the SOTA, the proposed regression pipeline performs remarkably in extracting
the correspondences by looking once at the image. It generates strong rail
route hypotheses without reliance on camera parameters, 3D data, and
geometrical constraints.
- Abstract(参考訳): 自律列車の重要な特徴の1つは、サードパーティの物体との衝突リスクを最小化することである。
リスクを見積もるために、制御システムは、特に合併または分岐するレール内で、列車が移動可能な全ての鉄道ルートの位相情報を識別する必要がある。
このようにして、列車は経路に関する潜在的な障害の状況を把握し、時間的に決定することができる。
多数の研究が、要素のインスタンスを考慮せずに、前方の画像全体から全ての線路を抽出した。
それでも、画像ベースの手法では、3dデータ上の鉄道形状の事前知識をハードコードし、左側のレールを関連付けて鉄道路線インスタンスを生成する方法もある。
しかし,tpe-netと呼ばれる完全畳み込みエンコーダ・デコーダアーキテクチャにより,各線路インスタンスの左レール画素を抽出・関連付けるレールパス抽出パイプラインを提案する。
TPE-Netの2つの異なる回帰枝は、各路線の中央点の位置を、対応する左右の画素と共に回帰するために提案されている。
抽出されたレールピクセルは空間的にクラスタ化され、すべての列車経路(エゴパス)のトポロジー情報を生成し、非エゴパス経路を破棄する。
挑戦的な公開ベンチマークの実験結果は、それぞれ0.9207と0.8721の真正画素平均精度とリコールを1秒あたり12フレーム程度で示した。
評価結果はSOTAよりは高くないが,提案した回帰パイプラインは,一度画像を見て対応を抽出する上で顕著に機能する。
カメラパラメータや3Dデータ、幾何学的制約に依存することなく、強力な鉄道経路仮説を生成する。
関連論文リスト
- PillarTrack: Redesigning Pillar-based Transformer Network for Single Object Tracking on Point Clouds [5.524413892353708]
LiDARベースの3Dオブジェクトトラッキング(3D SOT)は、ロボット工学と自動運転において重要な問題である。
柱型3Dオブジェクト追跡フレームワークであるPillarTrackを提案する。
PillarTrackは、KITTIとnuScenesデータセットで最先端のパフォーマンスを実現し、リアルタイムトラッキング速度を実現する。
論文 参考訳(メタデータ) (2024-04-11T06:06:56Z) - 3DMOTFormer: Graph Transformer for Online 3D Multi-Object Tracking [15.330384668966806]
最先端の3Dマルチオブジェクト追跡(MOT)アプローチは通常、Kalman Filterのような非学習モデルベースのアルゴリズムに依存している。
本稿では3DMOTFormerを提案する。この3D MOTフレームワークはトランスフォーマーアーキテクチャをベースに構築されている。
提案手法は, nuScenesバリデーションとテストスプリットでそれぞれ71.2%, AMOTA68.2%を達成している。
論文 参考訳(メタデータ) (2023-08-12T19:19:58Z) - An Efficient Transformer for Simultaneous Learning of BEV and Lane
Representations in 3D Lane Detection [55.281369497158515]
3次元車線検出のための効率的な変圧器を提案する。
バニラ変圧器と異なり、我々のモデルは車線とBEVの表現を同時に学習するクロスアテンション機構を含んでいる。
本手法は,2次元および3次元の車線特徴を画像ビューとBEVの特徴にそれぞれ適用することにより,2次元および3次元車線予測を実現する。
論文 参考訳(メタデータ) (2023-06-08T04:18:31Z) - Rail Detection: An Efficient Row-based Network and A New Benchmark [16.811407800603664]
7432対のイメージとアノテーションを備えた実世界の鉄道データセットRail-DBを提示する。
軽量な畳み込みバックボーンとアンカー分類器を備えた効率的な行ベースレール検出手法であるRail-Netを提案する。
我々はRail-Net on Rail-DBについて,ResNetからVision Transformerに至るまでのクロスシーン設定やネットワークバックボーンを含む広範な実験により評価した。
論文 参考訳(メタデータ) (2023-04-12T07:44:50Z) - 3D Data Augmentation for Driving Scenes on Camera [50.41413053812315]
本稿では,Drive-3DAugと呼ばれる3次元データ拡張手法を提案する。
まずNeural Radiance Field(NeRF)を用いて,背景および前景の3次元モデルの再構成を行う。
そして、予め定義された背景の有効領域に適応した位置と向きの3Dオブジェクトを配置することにより、拡張駆動シーンを得ることができる。
論文 参考訳(メタデータ) (2023-03-18T05:51:05Z) - Detecting train driveshaft damages using accelerometer signals and
Differential Convolutional Neural Networks [67.60224656603823]
本稿では,高度2次元畳み込みニューラルネットワーク(CNN)アーキテクチャに基づく鉄道軸状態監視システムの開発を提案する。
その結果,鉄道軸受振動信号を時間周波数領域表現,すなわち分光図に変換し,そのひび割れに応じて2次元CNNを訓練する。
論文 参考訳(メタデータ) (2022-11-15T15:04:06Z) - JPerceiver: Joint Perception Network for Depth, Pose and Layout
Estimation in Driving Scenes [75.20435924081585]
JPerceiverは、モノクロビデオシーケンスからスケール認識深度とVOとBEVレイアウトを同時に推定することができる。
クロスビュー幾何変換(CGT)を利用して、絶対スケールを道路レイアウトから奥行きとVOに伝播させる。
Argoverse、Nuscenes、KITTIの実験は、上記の3つのタスクの全てにおいて、既存のメソッドよりもJPerceiverの方が優れていることを示している。
論文 参考訳(メタデータ) (2022-07-16T10:33:59Z) - Simple and Effective Synthesis of Indoor 3D Scenes [78.95697556834536]
1枚以上の画像から3D屋内シーンを没入する問題について検討する。
我々の狙いは、新しい視点から高解像度の画像とビデオを作成することである。
本稿では,不完全点雲の再投影から高解像度のRGB-D画像へ直接マップするイメージ・ツー・イメージのGANを提案する。
論文 参考訳(メタデータ) (2022-04-06T17:54:46Z) - Real-time Rail Recognition Based on 3D Point Clouds [3.0980025155565376]
3次元点雲に基づくリアルタイム鉄道認識手法を提案し, 乱れや不均一密度, 点雲の大量化といった課題を解決する。
各ボクセルとレール位置の予測結果を生成するために,マルチスケールニューラルネットワークを提案する。
その結果, この手法は直線, 曲線, その他の複雑なトポロジを検出するのに優れた性能を示した。
論文 参考訳(メタデータ) (2022-01-08T01:42:02Z) - Intelligent Railway Foreign Object Detection: A Semi-supervised
Convolutional Autoencoder Based Method [7.557470133155959]
本研究では,鉄道軌道画像のみを必要とする半教師付き畳み込みオートエンコーダに基づくフレームワークを開発した。
提案するフレームワークは,IoT(Internet-of-Things)システムのデータ分析に有用である。
論文 参考訳(メタデータ) (2021-08-05T07:32:23Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。