論文の概要: DS MYOLO: A Reliable Object Detector Based on SSMs for Driving Scenarios
- arxiv url: http://arxiv.org/abs/2409.01093v1
- Date: Mon, 2 Sep 2024 09:22:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 07:26:52.414269
- Title: DS MYOLO: A Reliable Object Detector Based on SSMs for Driving Scenarios
- Title(参考訳): DS MYOLO: シナリオ駆動のためのSSMに基づく信頼性の高いオブジェクト検出器
- Authors: Yang Li, Jianli Xiao,
- Abstract要約: 我々は,マンバの卓越した性能にインスパイアされた,新しいリアルタイム物体検出器DS MYOLOを提案する。
この検出器は、単純化された選択的走査型融合ブロック(SimVSS Block)を通してグローバルな特徴情報をキャプチャし、ネットワークの深い特徴を効果的に統合する。
CCTSDB 2021とVLD-45の駆動シナリオの実験は、DS MYOLOが大きな可能性と競争上の優位性を示すことを示した。
- 参考スコア(独自算出の注目度): 2.615648035076649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate real-time object detection enhances the safety of advanced driver-assistance systems, making it an essential component in driving scenarios. With the rapid development of deep learning technology, CNN-based YOLO real-time object detectors have gained significant attention. However, the local focus of CNNs results in performance bottlenecks. To further enhance detector performance, researchers have introduced Transformer-based self-attention mechanisms to leverage global receptive fields, but their quadratic complexity incurs substantial computational costs. Recently, Mamba, with its linear complexity, has made significant progress through global selective scanning. Inspired by Mamba's outstanding performance, we propose a novel object detector: DS MYOLO. This detector captures global feature information through a simplified selective scanning fusion block (SimVSS Block) and effectively integrates the network's deep features. Additionally, we introduce an efficient channel attention convolution (ECAConv) that enhances cross-channel feature interaction while maintaining low computational complexity. Extensive experiments on the CCTSDB 2021 and VLD-45 driving scenarios datasets demonstrate that DS MYOLO exhibits significant potential and competitive advantage among similarly scaled YOLO series real-time object detectors.
- Abstract(参考訳): 正確なリアルタイムオブジェクト検出により、高度な運転支援システムの安全性が向上し、運転シナリオに不可欠なコンポーネントとなる。
ディープラーニング技術の急速な発展に伴い、CNNベースのリアルタイムオブジェクト検出器YOLOが注目されている。
しかし、CNNのローカルな焦点はパフォーマンスのボトルネックをもたらす。
検出器性能をさらに向上するため、研究者らはグローバルな受容場を利用するトランスフォーマーベースの自己認識機構を導入したが、その2次複雑さは計算コストを大幅に上回っている。
最近、マンバは線形複雑であり、地球規模の選択的走査によって大きな進歩を遂げた。
マンバの卓越した性能に触発されて,我々は新しい物体検出器DS MYOLOを提案する。
この検出器は、単純化された選択的走査型融合ブロック(SimVSS Block)を通してグローバルな特徴情報をキャプチャし、ネットワークの深い特徴を効果的に統合する。
さらに,計算複雑性を低く保ちながら,チャネル間の特徴的相互作用を向上させる効率的なチャネルアテンション畳み込み(ECAConv)を導入する。
CCTSDB 2021およびVLD-45駆動シナリオデータセットの大規模な実験により、DS MYOLOは、同様のスケールのYOLOシリーズのリアルタイムオブジェクト検出器において、大きな可能性と競争上の優位性を示すことが示された。
関連論文リスト
- How Important are Data Augmentations to Close the Domain Gap for Object Detection in Orbit? [15.550663626482903]
宇宙空間におけるコンピュータビジョンの領域ギャップを埋めるためのデータ拡張の有効性について検討する。
本稿では,軌道画像に観察される視覚効果をエミュレートするために開発された2つの新しいデータ拡張法を提案する。
論文 参考訳(メタデータ) (2024-10-21T08:24:46Z) - Real-Time Detection for Small UAVs: Combining YOLO and Multi-frame Motion Analysis [0.8971132850029493]
無人航空機(UAV)検出技術は、セキュリティリスクの軽減と、軍用および民間の双方のアプリケーションにおけるプライバシーの保護において重要な役割を担っている。
従来の検出手法は、長距離で非常に小さなピクセルを持つUAVターゲットを識別する上で重要な課題に直面している。
我々は,YOLO(You Only Look Once)オブジェクト検出と多フレームモーション検出を併用したGlobal-Local YOLO-Motion(GL-YOMO)検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-10T14:30:50Z) - EMDFNet: Efficient Multi-scale and Diverse Feature Network for Traffic Sign Detection [11.525603303355268]
小さな物体、特に交通標識の検出は、物体の検出と自律運転において重要なサブタスクである。
これらの課題に乗じて,EMDFNet(Efficient Multi-scale and Diverse Feature Network)という新しいオブジェクト検出ネットワークを提案する。
EMDFNetはAugmented Shortcut ModuleとEfficient Hybridを統合し、上記の問題に同時に対処する。
論文 参考訳(メタデータ) (2024-08-26T11:26:27Z) - Deep Learning-Based Robust Multi-Object Tracking via Fusion of mmWave Radar and Camera Sensors [6.166992288822812]
複雑なトラフィックシナリオを通じて、より安全で効率的なナビゲーションを実現する上で、マルチオブジェクトトラッキングは重要な役割を果たす。
本稿では,自律走行システムにおける複数物体追跡の精度とロバスト性を高めるために,レーダデータとカメラデータを統合した新しいディープラーニング方式を提案する。
論文 参考訳(メタデータ) (2024-07-10T21:09:09Z) - FedPylot: Navigating Federated Learning for Real-Time Object Detection in Internet of Vehicles [5.803236995616553]
フェデレートラーニングは、車載ネットワークで洗練された機械学習モデルをトレーニングするための有望なソリューションである。
我々は、フェデレーションオブジェクト検出実験をシミュレートする軽量MPIベースのプロトタイプであるFedPylotを紹介する。
本研究は, 精度, 通信コスト, 推論速度に影響を及ぼし, 自動運転車が直面する課題に対するバランスのとれたアプローチを示す。
論文 参考訳(メタデータ) (2024-06-05T20:06:59Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and
Multispectral Data Fusion [54.668445421149364]
HSI(Deep Learning-based Hyperspectral Image)は、HSI(Hyperspectral Image)とMSI(Multispectral Image)を深層ニューラルネットワーク(DNN)に融合させることにより、高空間分解能HSI(HR-HSI)を生成することを目的としている。
本稿では, HSI-MSI 融合のためのデータ多様性を向上するために, HSI-MSI サンプルペアの自動最適化と拡張を行う新しい逆自動データ拡張フレームワーク ADASR を提案する。
論文 参考訳(メタデータ) (2023-10-11T07:30:37Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device [53.323878851563414]
本稿では,強化学習技術を用いたネットワーク拡張とpruning検索を組み込んだコンパイラ対応統一フレームワークを提案する。
具体的には,リカレントニューラルネットワーク(RNN)を用いて,ネットワークの強化とプルーニングの両面での統一的なスキームを自動で提供する。
提案手法は,モバイルデバイス上でのリアルタイム3次元物体検出を実現する。
論文 参考訳(メタデータ) (2020-12-26T19:41:15Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。