論文の概要: Traffic Sign Recognition Dataset and Data Augmentation
- arxiv url: http://arxiv.org/abs/2303.18037v1
- Date: Fri, 31 Mar 2023 13:14:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 13:54:15.328104
- Title: Traffic Sign Recognition Dataset and Data Augmentation
- Title(参考訳): 交通標識認識データセットとデータ拡張
- Authors: Jingzhan Ge
- Abstract要約: トラフィックサイン認識のために収集されたデータセットは少ない。
ディープラーニングは、実際の使用のためにモデルをトレーニングするための、ほとんど唯一の方法です。
特定のシグネチャクラスでは、そのシグネチャの意味がデータセットに十分なインスタンスを取得できないように運命付けられています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although there are many datasets for traffic sign classification, there are
few datasets collected for traffic sign recognition and few of them obtain
enough instances especially for training a model with the deep learning method.
The deep learning method is almost the only way to train a model for real-world
usage that covers various highly similar classes compared with the traditional
way such as through color, shape, etc. Also, for some certain sign classes,
their sign meanings were destined to can't get enough instances in the dataset.
To solve this problem, we purpose a unique data augmentation method for the
traffic sign recognition dataset that takes advantage of the standard of the
traffic sign. We called it TSR dataset augmentation. We based on the benchmark
Tsinghua-Tencent 100K (TT100K) dataset to verify the unique data augmentation
method. we performed the method on four main iteration version datasets based
on the TT100K dataset and the experimental results showed our method is
efficacious. The iteration version datasets based on TT100K, data augmentation
method source code and the training results introduced in this paper are
publicly available.
- Abstract(参考訳): トラヒックサイン分類のためのデータセットは数多く存在するが、トラヒックサイン認識のために収集されたデータセットは少なく、特にディープラーニング法でモデルをトレーニングするための十分なインスタンスが得られていない。
深層学習法は、色や形状などの伝統的な方法と比較して、様々な非常に類似したクラスをカバーする実世界のモデルのトレーニング方法として、ほぼ唯一のものである。
また、いくつかのサインクラスでは、それらのサインの意味はデータセットで十分なインスタンスを取得できない運命にあった。
この問題を解決するために,トラヒックサインの標準を活用し,トラヒックサイン認識データセットのためのユニークなデータ拡張手法を提案する。
私たちはこれをTSRデータセット拡張と呼びました。
ベンチマークtsinghua-tencent 100k(tt100k)データセットに基づいて,ユニークなデータ拡張手法を検証する。
本手法は,tt100kデータセットに基づく4つの反復型データセット上で実施し,本手法の有効性を実験的に示した。
TT100Kに基づく反復版データセット、データ拡張手法のソースコードおよび本論文で紹介したトレーニング結果が公開されている。
関連論文リスト
- Replication: Contrastive Learning and Data Augmentation in Traffic
Classification Using a Flowpic Input Representation [47.95762911696397]
同じデータセット上で[16]を再現し、3つの追加の公開データセット上で最も健全なアスペクト(データ拡張の重要性)を複製します。
元の結果のほとんどを確認できたが、元のデータセットにデータシフトがあったため、調査されたシナリオの20%の精度低下が判明した。
論文 参考訳(メタデータ) (2023-09-18T12:55:09Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Traffic Context Aware Data Augmentation for Rare Object Detection in
Autonomous Driving [5.037913689432052]
本稿では,自律運転におけるまれな物体検出のための簡易なコピー・ペーストデータ拡張に関する体系的研究を提案する。
具体的には、リアルなレアなオブジェクトマスクを生成するために、局所適応型インスタンスレベルの画像変換を導入する。
我々は10kのトレーニング画像と4kの検証画像と対応するラベルからなるNM10kという新しいデータセットを構築した。
論文 参考訳(メタデータ) (2022-05-01T01:45:00Z) - PreTraM: Self-Supervised Pre-training via Connecting Trajectory and Map [58.53373202647576]
軌道予測のための自己教師付き事前学習方式であるPreTraMを提案する。
1) トラジェクティブ・マップ・コントラクティブ・ラーニング(トラジェクティブ・コントラクティブ・ラーニング)、(2) トラジェクティブ・ラーニング(トラジェクティブ・コントラクティブ・ラーニング)、(2) トラジェクティブ・ラーニング(トラジェクティブ・ラーニング)、(2) トラジェクティブ・コントラクティブ・ラーニング(トラジェクティブ・ラーニング)、(2) トラジェクティブ・コントラクティブ・ラーニング(トラジェクティブ・ラーニング)の2つのパートから構成される。
AgentFormerやTrajectron++といった一般的なベースラインに加えて、PreTraMは、挑戦的なnuScenesデータセット上で、FDE-10でパフォーマンスを5.5%と6.9%向上させる。
論文 参考訳(メタデータ) (2022-04-21T23:01:21Z) - Cross-Dataset Collaborative Learning for Semantic Segmentation [17.55660581677053]
我々は、Cross-Dataset Collaborative Learning (CDCL) と呼ばれる、単純で柔軟で汎用的なセマンティックセグメンテーション手法を提案する。
複数のラベル付きデータセットを付与することで、各データセット上の特徴表現の一般化と識別を改善することを目指しています。
単一データセットとクロスデータセットの設定で,Cityscapes,BDD100K,CamVid,COCO Stuffという4つの多様なデータセットに対して,広範な評価を行う。
論文 参考訳(メタデータ) (2021-03-21T09:59:47Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Radioactive data: tracing through training [130.2266320167683]
本稿では,このデータセットに認識不能な変化を生じさせる新しい手法であるEmphradioactive dataを提案する。
訓練されたモデルにより, 放射能データの利用を検知し, 信頼度(p-値)のレベルを提供する。
提案手法はディープネットワーク最適化におけるデータ拡張とバックドア性に対して堅牢である。
論文 参考訳(メタデータ) (2020-02-03T18:41:08Z) - Overcoming Noisy and Irrelevant Data in Federated Learning [13.963024590508038]
フェデレーション学習は、クライアントデバイスが収集したローカルデータから、機械学習モデルを分散的にトレーニングする効果的な方法である。
そこで我々は,小さなベンチマークデータセットに基づいてトレーニングされたベンチマークモデルを用いて,関連するデータを分散的に選択する手法を提案する。
提案手法の有効性は,多数のクライアントを持つシミュレーションシステムにおいて,複数の実世界の画像データセット上で評価される。
論文 参考訳(メタデータ) (2020-01-22T22:28:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。