論文の概要: TL-GAN: Improving Traffic Light Recognition via Data Synthesis for
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2203.15006v1
- Date: Mon, 28 Mar 2022 18:12:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-30 14:02:45.961456
- Title: TL-GAN: Improving Traffic Light Recognition via Data Synthesis for
Autonomous Driving
- Title(参考訳): tl-gan: 自動運転のためのデータ合成による交通光認識の改善
- Authors: Danfeng Wang and Xin Ma and Xiaodong Yang
- Abstract要約: 本稿では,交通信号の自律運転における音声認識を改善するために,レアクラスのデータを合成するための新しい交通信号生成手法TL-GANを提案する。
画像合成段階では、条件付き生成により、生成したトラフィック光画像の色を完全に制御できる。
シーケンス組み立て段階では、現実的で多様なトラフィック光シーケンスを合成するためのスタイル混合および適応テンプレートを設計する。
- 参考スコア(独自算出の注目度): 8.474436072102844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic light recognition, as a critical component of the perception module
of self-driving vehicles, plays a vital role in the intelligent transportation
systems. The prevalent deep learning based traffic light recognition methods
heavily hinge on the large quantity and rich diversity of training data.
However, it is quite challenging to collect data in various rare scenarios such
as flashing, blackout or extreme weather, thus resulting in the imbalanced
distribution of training data and consequently the degraded performance in
recognizing rare classes. In this paper, we seek to improve traffic light
recognition by leveraging data synthesis. Inspired by the generative
adversarial networks (GANs), we propose a novel traffic light generation
approach TL-GAN to synthesize the data of rare classes to improve traffic light
recognition for autonomous driving. TL-GAN disentangles traffic light sequence
generation into image synthesis and sequence assembling. In the image synthesis
stage, our approach enables conditional generation to allow full control of the
color of the generated traffic light images. In the sequence assembling stage,
we design the style mixing and adaptive template to synthesize realistic and
diverse traffic light sequences. Extensive experiments show that the proposed
TL-GAN renders remarkable improvement over the baseline without using the
generated data, leading to the state-of-the-art performance in comparison with
the competing algorithms that are used for general image synthesis and data
imbalance tackling.
- Abstract(参考訳): 自動運転車の知覚モジュールの重要な要素である交通光認識は、インテリジェントな輸送システムにおいて重要な役割を果たす。
一般的なディープラーニングベースのトラヒック光認識手法は、トレーニングデータの大量かつ豊富な多様性に大きく依存している。
しかし, 点滅, ブラックアウト, 極端な天候などの稀なシナリオでデータを収集することは極めて困難であり, 結果としてトレーニングデータの不均衡分布が生じ, 希少なクラスを認識する上での劣化性能が低下する。
本稿では,データ合成を活用し,交通光認識の改善を目指す。
我々は、gans(generative adversarial networks)に触発されて、希少クラスのデータを合成し、自動運転のための交通光認識を改善する新しい交通光生成手法tl-ganを提案する。
TL-GANは、トラフィック光シーケンス生成を画像合成とシーケンス組み立てに切り離す。
画像合成段階では、条件付き生成により生成された交通光画像の色をフルに制御できる。
シーケンス合成段階において,スタイル混合と適応テンプレートをデザインし,リアルで多様な交通光列を合成する。
大規模な実験により,提案したTL-GANは,生成したデータを用いることなく,ベースラインに対して顕著な改善を施し,一般画像合成やデータ不均衡処理に使用される競合アルゴリズムと比較して最先端の性能が向上することが示された。
関連論文リスト
- Analysis of Classifier Training on Synthetic Data for Cross-Domain Datasets [4.696575161583618]
本研究は、高度な運転支援システムと自律運転のためのカメラベースの交通標識認識アプリケーションに焦点を当てた。
合成データセットの増補パイプラインは、構造化影やガウスの特異なハイライトのような新しい増補プロセスを含む。
実験の結果、クロスドメインテストデータセットに適用した場合、ほとんどの場合、合成画像ベースアプローチは実際の画像ベーストレーニングよりも優れていた。
論文 参考訳(メタデータ) (2024-10-30T07:11:41Z) - Optical Flow Matters: an Empirical Comparative Study on Fusing Monocular Extracted Modalities for Better Steering [37.46760714516923]
本研究は、単眼カメラからのマルチモーダル情報を利用して、自動運転車のステアリング予測を改善する新しいエンドツーエンド手法を提案する。
本稿では,RGB画像と深度補完情報や光フローデータとの融合に着目し,これらのモダリティを早期・ハイブリッド融合技術によって統合する枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-18T09:36:24Z) - Cross-domain Few-shot In-context Learning for Enhancing Traffic Sign Recognition [49.20086587208214]
交通信号認識の強化を目的としたMLLMに基づくドメイン間数ショットインコンテキスト学習手法を提案する。
記述テキストを使用することで、テンプレートと実際の交通標識のドメイン間差を低減することができる。
提案手法は,大規模交通標識画像やラベルを必要とせず,単純かつ均一なテキスト表示のみを必要とする。
論文 参考訳(メタデータ) (2024-07-08T10:51:03Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Decoupled Dynamic Spatial-Temporal Graph Neural Network for Traffic
Forecasting [27.82230529014677]
道路網における交通状況を予測する能力は重要な機能であり、課題である。
近年の時空間グラフニューラルネットワークの提案は,交通データにおける複雑な時空間相関のモデル化において大きな進歩を遂げている。
本稿では,データ駆動方式で拡散と固有トラフィック情報を分離する分散空間時間フレームワーク(DSTF)を提案する。
論文 参考訳(メタデータ) (2022-06-18T04:14:38Z) - ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal
Control [5.219291917441908]
本稿では,交通信号制御のためのモデルベースメタ強化学習フレームワーク(ModelLight)を提案する。
ModelLight内では、道路交差点のためのモデルのアンサンブルと最適化に基づくメタラーニング法を用いて、RLベースのトラヒックライト制御方式のデータ効率を改善する。
実世界のデータセットの実験では、ModelLightが最先端のトラヒックライト制御アルゴリズムより優れていることが示されている。
論文 参考訳(メタデータ) (2021-11-15T20:25:08Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - Deep traffic light detection by overlaying synthetic context on
arbitrary natural images [49.592798832978296]
深部交通光検出器のための人工的な交通関連トレーニングデータを生成する手法を提案する。
このデータは、任意の画像背景の上に偽のトラフィックシーンをブレンドするために、基本的な非現実的なコンピュータグラフィックスを用いて生成される。
また、交通信号データセットの本質的なデータ不均衡問題にも対処し、主に黄色い状態のサンプルの少なさによって引き起こされる。
論文 参考訳(メタデータ) (2020-11-07T19:57:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。