論文の概要: Novelty Detection and Analysis of Traffic Scenario Infrastructures in
the Latent Space of a Vision Transformer-Based Triplet Autoencoder
- arxiv url: http://arxiv.org/abs/2105.01924v1
- Date: Wed, 5 May 2021 08:24:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 12:55:01.506961
- Title: Novelty Detection and Analysis of Traffic Scenario Infrastructures in
the Latent Space of a Vision Transformer-Based Triplet Autoencoder
- Title(参考訳): 視覚トランスフォーマによるトリプレットオートエンコーダの潜在空間における交通シナリオ基盤の新規検出と解析
- Authors: Jonas Wurst, Lakshman Balasubramanian, Michael Botsch and Wolfgang
Utschick
- Abstract要約: インフラストラクチャイメージに基づいて新たなトラフィックシナリオを検出する手法を提案する。
オートエンコーダ三重項ネットワークは、外乱検出に使用されるインフラストラクチャイメージの潜在表現を提供する。
提案手法は他の最先端の異常検出手法よりも優れている。
- 参考スコア(独自算出の注目度): 12.194597074511863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting unknown and untested scenarios is crucial for scenario-based
testing. Scenario-based testing is considered to be a possible approach to
validate autonomous vehicles. A traffic scenario consists of multiple
components, with infrastructure being one of it. In this work, a method to
detect novel traffic scenarios based on their infrastructure images is
presented. An autoencoder triplet network provides latent representations for
infrastructure images which are used for outlier detection. The triplet
training of the network is based on the connectivity graphs of the
infrastructure. By using the proposed architecture, expert-knowledge is used to
shape the latent space such that it incorporates a pre-defined similarity in
the neighborhood relationships of an autoencoder. An ablation study on the
architecture is highlighting the importance of the triplet autoencoder
combination. The best performing architecture is based on vision transformers,
a convolution-free attention-based network. The presented method outperforms
other state-of-the-art outlier detection approaches.
- Abstract(参考訳): 未知および未テストのシナリオの検出は、シナリオベースのテストに不可欠である。
シナリオベースのテストは、自動運転車を検証するためのアプローチであると考えられている。
トラフィックシナリオは複数のコンポーネントで構成され、インフラストラクチャはその1つです。
本研究では,インフラストラクチャイメージに基づいて新たなトラフィックシナリオを検出する手法を提案する。
オートエンコーダ三重項ネットワークは、外乱検出に使用されるインフラストラクチャイメージの潜在表現を提供する。
ネットワークのトリプレットトレーニングは、インフラストラクチャの接続グラフに基づいている。
提案したアーキテクチャを用いて,オートエンコーダの近傍関係に予め定義された類似性を組み込んだ潜在空間を形成する。
アーキテクチャに関するアブレーション研究は、三重項オートエンコーダの組み合わせの重要性を強調している。
最高のアーキテクチャは、畳み込みのない注意に基づくネットワークであるビジョントランスフォーマーに基づいている。
提案手法は他の最先端の異常検出手法よりも優れている。
関連論文リスト
- Cross-Domain Transfer Learning using Attention Latent Features for Multi-Agent Trajectory Prediction [4.292918274985369]
本稿では,トランスフォーマーモデルにおけるアテンション表現に対して,クロスドメイン適応を行う新しい時空間軌道予測フレームワークを提案する。
グラフ畳み込みネットワークは、マルチエージェント車両間の複雑な時空間相互作用を正確にモデル化する動的グラフ特徴埋め込みを構築するためにも統合される。
論文 参考訳(メタデータ) (2024-11-09T06:39:44Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - Traffic Light Recognition using Convolutional Neural Networks: A Survey [4.451479907610764]
我々は畳み込みニューラルネットワーク(CNN)を用いた交通信号認識手法の総合的な調査と分析を行う。
基盤となるアーキテクチャに基づいて、メソッドを3つの主要なグループにクラスタ化します。
各クラスタで最も重要な作業について説明し、データセットの使用方法について議論し、研究ギャップを特定します。
論文 参考訳(メタデータ) (2023-09-05T11:50:38Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Collaborative 3D Object Detection for Automatic Vehicle Systems via
Learnable Communications [8.633120731620307]
本稿では,3つのコンポーネントから構成される新しい3次元オブジェクト検出フレームワークを提案する。
実験結果と帯域使用量分析により,本手法は通信コストと計算コストを削減できることを示した。
論文 参考訳(メタデータ) (2022-05-24T07:17:32Z) - A Hierarchical Terminal Recognition Approach based on Network Traffic
Analysis [0.48298211429517085]
本稿では,グリッドデータの詳細を適用した階層型端末認識手法を提案する。
我々はグリッドデータをセグメント化して2段階のモデル構造を構築した。
特徴の選定と再構築により、3つのアルゴリズムを組み合わせて端末の型を正確に識別する。
論文 参考訳(メタデータ) (2022-04-16T05:33:01Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Intelligent Railway Foreign Object Detection: A Semi-supervised
Convolutional Autoencoder Based Method [7.557470133155959]
本研究では,鉄道軌道画像のみを必要とする半教師付き畳み込みオートエンコーダに基づくフレームワークを開発した。
提案するフレームワークは,IoT(Internet-of-Things)システムのデータ分析に有用である。
論文 参考訳(メタデータ) (2021-08-05T07:32:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。