Fugu-MT 論文翻訳(概要): Event-based YOLO Object Detection: Proof of Concept for Forward Perception System

論文の概要: Event-based YOLO Object Detection: Proof of Concept for Forward Perception System

arxiv url: http://arxiv.org/abs/2212.07181v1
Date: Wed, 14 Dec 2022 12:12:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-15 15:13:49.469272
Title: Event-based YOLO Object Detection: Proof of Concept for Forward Perception System
Title（参考訳）: イベントに基づくヨーロ物体検出:前方知覚システムのための概念実証
Authors: Waseem Shariff, Muhammad Ali Farooq, Joe Lemley and Peter Corcoran
Abstract要約: 本研究では,道路側物体検出にニューロモルフィック事象データを活用することに焦点を当てた。本稿では、イベントシミュレートされたA2D2データセットを2つのYOLOv5ネットワークで手動でアノテートし、トレーニングする。
参考スコア（独自算出の注目度）: 0.3058685580689604
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Neuromorphic vision or event vision is an advanced vision technology, where in contrast to the visible camera that outputs pixels, the event vision generates neuromorphic events every time there is a brightness change which exceeds a specific threshold in the field of view (FOV). This study focuses on leveraging neuromorphic event data for roadside object detection. This is a proof of concept towards building artificial intelligence (AI) based pipelines which can be used for forward perception systems for advanced vehicular applications. The focus is on building efficient state-of-the-art object detection networks with better inference results for fast-moving forward perception using an event camera. In this article, the event-simulated A2D2 dataset is manually annotated and trained on two different YOLOv5 networks (small and large variants). To further assess its robustness, single model testing and ensemble model testing are carried out.
Abstract（参考訳）: ニューロモルフィックビジョン(英: neuromorphic vision)またはイベントビジョン(英: event vision)は、ピクセルを出力する可視カメラとは対照的に、視野の特定の閾値を超える輝度変化が発生するたびに、イベントビジョンがニューロモルフィックイベントを生成する高度なビジョン技術である。本研究では,道路側物体検出におけるニューロモルフィック事象データの利用に焦点を当てた。これは、先進的な車両用アプリケーションのための前方認識システムに使用できる人工知能(AI)ベースのパイプラインを構築するための概念実証である。その焦点は、イベントカメラを使って高速に前進する知覚に対する推論結果を改善する、効率的な最先端オブジェクト検出ネットワークの構築である。本稿では、イベントシミュレートされたA2D2データセットを、2つの異なるYOLOv5ネットワーク(小さくて大きなバリエーション)で手動で注釈付けし、トレーニングする。その堅牢性をさらに評価するために、単一モデルテストとアンサンブルモデルテストを実行する。

関連論文リスト

EMF: Event Meta Formers for Event-based Real-time Traffic Object Detection [5.143097874851516]
イベントカメラは時間分解能が高く、従来のRGBカメラに比べてストレージと帯域幅は少ない。イベントベースのオブジェクト検出における最近のアプローチは、計算コストの高いトランスフォーマーベースのソリューションを用いることで、このギャップを埋めようとしている。提案するEMFは,最も効率的なイベントベース物体検出器の性能を向上し,ドメイン内で最速のプログレッシオンベースアーキテクチャとなる。
論文参考訳（メタデータ） (2025-04-05T09:48:40Z)
Distractor-aware Event-based Tracking [45.07711356111249]
本稿では,シームズネットワークアーキテクチャ(DANet)にトランスフォーマーモジュールを導入するイベントベースのトラッカーを提案する。本モデルは主にモーション認識ネットワークとターゲット認識ネットワークで構成され,イベントデータから動作キューとオブジェクトの輪郭の両方を同時に活用する。私たちのDANetは、後処理なしでエンドツーエンドでトレーニングでき、単一のV100上で80FPS以上で実行できます。
論文参考訳（メタデータ） (2023-10-22T05:50:20Z)
Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。 GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。 BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文参考訳（メタデータ） (2023-04-06T14:33:05Z)
Recurrent Vision Transformers for Object Detection with Event Cameras [62.27246562304705]
本稿では,イベントカメラを用いた物体検出のための新しいバックボーンであるリカレントビジョントランス (RVT) を提案する。 RVTは、イベントベースのオブジェクト検出で最先端のパフォーマンスに到達するために、ゼロからトレーニングすることができる。私たちの研究は、イベントベースのビジョンを超えた研究に役立ち得る効果的なデザイン選択に、新たな洞察をもたらします。
論文参考訳（メタデータ） (2022-12-11T20:28:59Z)
Recent Trends in 2D Object Detection and Applications in Video Event Recognition [0.76146285961466]
物体検出における先駆的な研究について論じるとともに,近年のディープラーニングを活用したブレークスルーも取り上げている。本稿では、画像とビデオの両方で2次元物体検出のための最近のデータセットを強調し、様々な最先端物体検出技術の比較性能の概要を示す。
論文参考訳（メタデータ） (2022-02-07T14:15:11Z)
One-Shot Object Affordance Detection in the Wild [76.46484684007706]
Affordance Detectionは、画像内のオブジェクトの潜在的なアクション可能性を特定することを指す。我々は、人間の行動目的を推定し、それを転送して、すべての候補画像から共通価格を検出するワンショットアフォーダンス検出ネットワーク(OSAD-Net)を考案する。複雑なシーンと豊富なアノテーションによって、当社のPADv2データセットは、アベイランス検出メソッドをベンチマークするためのテストベッドとして使用することができます。
論文参考訳（メタデータ） (2021-08-08T14:53:10Z)
Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。私達のアプローチは人間の相互作用なしで完全に自動です。 VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文参考訳（メタデータ） (2020-12-15T03:03:38Z)
Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2020-10-16T12:36:23Z)
Event-based Robotic Grasping Detection with Neuromorphic Vision Sensor and Event-Stream Dataset [8.030163836902299]
ニューロモルフィック・ビジョンは、小さくて若い研究コミュニティである。従来のフレームベースのコンピュータビジョンと比較すると、ニューロモルフィック・ビジョンは小さくて若い研究コミュニティである。 91個のオブジェクトからなるイベントストリームデータセットという,ロボットによる把握データセットを構築した。リードが高周波でブリンクするため、Event-Streamデータセットは1kHzの高周波でアノテートされる。我々は、角度学習問題を回帰ではなく分類として考慮した、検出を把握するためのディープニューラルネットワークを開発した。
論文参考訳（メタデータ） (2020-04-28T16:55:19Z)
Traffic Signs Detection and Recognition System using Deep Learning [0.0]
本稿では,交通標識をリアルタイムに検出・認識するためのアプローチについて述べる。マルチオブジェクト検出システムの最先端技術を用いて,交通信号検出問題に取り組む。この論文の焦点は、F-RCNN Inception v2とTiny YOLO v2が最高の結果を得たときのものである。
論文参考訳（メタデータ） (2020-03-06T14:54:40Z)
Training-free Monocular 3D Event Detection System for Traffic Surveillance [93.65240041833319]
既存のイベント検出システムは、主に学習ベースであり、大量のトレーニングデータが利用可能な場合、十分なパフォーマンスを実現している。現実のシナリオでは、十分なラベル付きトレーニングデータの収集は高価であり、時には不可能である。本稿では,交通監視のためのトレーニング不要な単眼3Dイベント検出システムを提案する。
論文参考訳（メタデータ） (2020-02-01T04:42:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。