論文の概要: A New Method for Vehicle Logo Recognition Based on Swin Transformer
- arxiv url: http://arxiv.org/abs/2401.15458v1
- Date: Sat, 27 Jan 2024 16:46:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 18:13:52.532251
- Title: A New Method for Vehicle Logo Recognition Based on Swin Transformer
- Title(参考訳): swin変換器を用いた車両のロゴ認識の一手法
- Authors: Yang Li, Doudou Zhang, Jianli Xiao
- Abstract要約: 車両ロゴ認識(VLR)は、道路上の車両を識別することで、効率的な管理と監視を可能にする。
近年のTransformerモデルの増加は、VLRに新たな機会をもたらしている。
Swin Transformerは、効率的な計算とグローバル機能モデリング機能を備えた、困難な条件下でのCNNよりも優れています。
- 参考スコア(独自算出の注目度): 2.615648035076649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent Transportation Systems (ITS) utilize sensors, cameras, and big
data analysis to monitor real-time traffic conditions, aiming to improve
traffic efficiency and safety. Accurate vehicle recognition is crucial in this
process, and Vehicle Logo Recognition (VLR) stands as a key method. VLR enables
effective management and monitoring by distinguishing vehicles on the road.
Convolutional Neural Networks (CNNs) have made impressive strides in VLR
research. However, achieving higher performance demands significant time and
computational resources for training. Recently, the rise of Transformer models
has brought new opportunities to VLR. Swin Transformer, with its efficient
computation and global feature modeling capabilities, outperforms CNNs under
challenging conditions. In this paper, we implement real-time VLR using Swin
Transformer and fine-tune it for optimal performance. Extensive experiments
conducted on three public vehicle logo datasets (HFUT-VL1, XMU, CTGU-VLD)
demonstrate impressive top accuracy results of 99.28%, 100%, and 99.17%,
respectively. Additionally, the use of a transfer learning strategy enables our
method to be on par with state-of-the-art VLR methods. These findings affirm
the superiority of our approach over existing methods. Future research can
explore and optimize the application of the Swin Transformer in other vehicle
vision recognition tasks to drive advancements in ITS.
- Abstract(参考訳): インテリジェントトランスポーテーションシステム(ITS)は、センサー、カメラ、ビッグデータ分析を使用してリアルタイムの交通状況を監視し、交通効率と安全性の向上を目指している。
このプロセスでは正確な車両認識が重要であり、車両のロゴ認識(vlr)が鍵となる。
VLRは、道路上の車両を識別することで、効率的な管理と監視を可能にする。
畳み込みニューラルネットワーク(CNN)は、VLR研究において顕著な進歩を遂げている。
しかし、より高いパフォーマンスを達成するには、トレーニングにかなりの時間と計算資源が必要となる。
近年、Transformerモデルの台頭はVLRに新たな機会をもたらしている。
Swin Transformerは、効率的な計算とグローバル機能モデリング機能を備えた、困難な条件下でのCNNよりも優れています。
本稿では,Swin Transformer を用いてリアルタイム VLR を実装し,最適な性能を実現する。
3つの公共車両のロゴデータセット(HFUT-VL1、XMU、CTGU-VLD)で実施された大規模な実験では、それぞれ99.28%、100%、99.17%の最高精度が得られた。
さらに、転送学習戦略を用いることで、我々の手法は最先端のVLR手法と同等になる。
これらの結果は,既存手法よりもアプローチが優れていることを裏付けるものである。
将来の研究は、他の車両の視覚認識タスクにおけるSwin Transformerの応用を探索し、最適化し、ITSの進歩を推し進めることができる。
関連論文リスト
- Traffic control using intelligent timing of traffic lights with reinforcement learning technique and real-time processing of surveillance camera images [0.0]
信号機の最適タイミングを判定し、複数のパラメータに従って適用する。
YOLOv9-Cモデルを用いた車両検出には深層学習法が用いられた。
イランの車の画像にトランスファーラーニングとモデルの再訓練を併用することで、モデルの精度が向上した。
論文 参考訳(メタデータ) (2024-05-22T00:04:32Z) - Real-Time Detection and Analysis of Vehicles and Pedestrians using Deep Learning [0.0]
現在の交通監視システムは、小さな物体や歩行者をリアルタイムで効果的に認識する上で大きな困難に直面している。
本研究は、車や人の正確なリアルタイム認識のための複雑な視覚入力を処理できる高度なディープラーニングフレームワークの作成と検証に重点を置いている。
YOLOv8 大型モデルは、特に歩行者認識において最も効果的で、精度と堅牢性が高いことが判明した。
論文 参考訳(メタデータ) (2024-04-11T18:42:14Z) - Traffic Sign Recognition Using Local Vision Transformer [1.8416014644193066]
本稿では,交通信号認識のための畳み込み型ネットワークと変圧器型ネットワークの両利点を融合した新しいモデルを提案する。
提案モデルには、局所的相関をキャプチャする畳み込みブロックと、グローバルな依存関係を学習するトランスフォーマーベースのブロックが含まれる。
実験により, 局所性モジュールを用いたハイブリッドネットワークは, 純粋なトランスフォーマーモデルおよび最も優れた畳み込みネットワークよりも精度が高いことを示した。
論文 参考訳(メタデータ) (2023-11-11T19:42:41Z) - Efficient Vision Transformer for Accurate Traffic Sign Detection [0.0]
本研究では,自動運転車や運転支援システムにおける交通標識検出の課題について論じる。
この課題に対処するため、Transformerモデル、特にVision Transformerの派生版が導入された。
本研究はトランスフォーマーモデルの効率を高めるために,局所性帰納バイアスとトランスフォーマーモジュールを統合する新しい戦略を提案する。
論文 参考訳(メタデータ) (2023-11-02T17:44:32Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - StRDAN: Synthetic-to-Real Domain Adaptation Network for Vehicle
Re-Identification [16.14221315208939]
車両の再識別は、車両の画像から同じ車両を取得することを目的としている。
これは、市内の交通の流れを分析し予測するのには不可欠である。
本稿では,低コストで大規模な合成・実データを用いて学習し,性能を向上させる合成・実領域適応ネットワーク(StRDAN)を提案する。
論文 参考訳(メタデータ) (2020-04-25T01:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。