論文の概要: Enhancing Vehicle Detection under Adverse Weather Conditions with Contrastive Learning
- arxiv url: http://arxiv.org/abs/2509.21916v1
- Date: Fri, 26 Sep 2025 05:55:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.216741
- Title: Enhancing Vehicle Detection under Adverse Weather Conditions with Contrastive Learning
- Title(参考訳): コントラスト学習による逆気象条件下での車両検出の強化
- Authors: Boying Li, Chang Liu, Petter Kyösti, Mattias Öhman, Devashish Singha Roy, Sofia Plazzi, Hamam Mokayed, Olle Hagner,
- Abstract要約: 軽量モデルを用いた車両検出のためのサイドロード-CL適応フレームワークを提案する。
提案したサイドロード-CL適応モデルにより,NVDデータセット上のmAP50で検出性能が3.8%から9.5%向上する。
- 参考スコア(独自算出の注目度): 4.675616844059
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aside from common challenges in remote sensing like small, sparse targets and computation cost limitations, detecting vehicles from UAV images in the Nordic regions faces strong visibility challenges and domain shifts caused by diverse levels of snow coverage. Although annotated data are expensive, unannotated data is cheaper to obtain by simply flying the drones. In this work, we proposed a sideload-CL-adaptation framework that enables the use of unannotated data to improve vehicle detection using lightweight models. Specifically, we propose to train a CNN-based representation extractor through contrastive learning on the unannotated data in the pretraining stage, and then sideload it to a frozen YOLO11n backbone in the fine-tuning stage. To find a robust sideload-CL-adaptation, we conducted extensive experiments to compare various fusion methods and granularity. Our proposed sideload-CL-adaptation model improves the detection performance by 3.8% to 9.5% in terms of mAP50 on the NVD dataset.
- Abstract(参考訳): 小型でスパースな目標や計算コストの制限のようなリモートセンシングの一般的な課題は別として、北欧地域のUAV画像から車両を検出することは、さまざまなレベルの積雪によって引き起こされる強力な可視性課題とドメインシフトに直面している。
注釈付きデータは高価だが、無人でドローンを飛ばすだけで、注釈なしのデータを得ることができる。
本研究は,軽量モデルを用いた車両検出のための非注釈データの利用を可能にするサイドロード-CL適応フレームワークを提案する。
具体的には、事前訓練段階における無注釈データに対するコントラスト学習を通じてCNNベースの表現抽出器を訓練し、微調整段階において凍結したYOLO11nのバックボーンにサイドロードすることを提案する。
強靭なサイドロード-CL適応を求めるため,様々な融合法と粒度の比較実験を行った。
提案したサイドロード-CL適応モデルにより,NVDデータセット上のmAP50で検出性能が3.8%から9.5%向上する。
関連論文リスト
- Overtake Detection in Trucks Using CAN Bus Signals: A Comparative Study of Machine Learning Methods [51.28632782308621]
ボルボグループが提供する5台の車載トラックから収集した制御エリアネットワーク(CAN)バスデータを用いたオーバーテイク検出に焦点を当てた。
車両操作検出、ニューラルネットワーク(ANN)、ランダムフォレスト(RF)、サポートベクトルマシン(SVM)の3つの共通分類器の評価を行った。
当社のパートラック分析では、特にオーバーテイクにおいて、車両毎のトレーニングデータの量に依存する分類精度も明らかにしています。
論文 参考訳(メタデータ) (2025-07-01T09:20:41Z) - Training a Distributed Acoustic Sensing Traffic Monitoring Network With Video Inputs [0.0]
本稿では,DASデータと協調した視覚情報を統合する新しい概念を提案する。
本モデルでは,検出と分類において94%以上の性能を示し,約1.2%の誤警報率を示す。
論文 参考訳(メタデータ) (2024-12-17T10:06:42Z) - Cross-Camera Distracted Driver Classification through Feature Disentanglement and Contrastive Learning [13.613407983544427]
ドライバ行動監視ネットワーク(DBMNet)は軽量のバックボーンに依存しており、カメラのビュー情報を破棄するためにアンタングルモジュールを統合する。
DBMNetは、既存のアプローチと比較して、Top-1の精度が7%向上している。
論文 参考訳(メタデータ) (2024-11-20T10:27:12Z) - Effective and Efficient Adversarial Detection for Vision-Language Models via A Single Vector [97.92369017531038]
Diverse hArmful Responses (RADAR) を用いた新しい laRge-scale Adervsarial 画像データセットを構築した。
そこで我々は,視覚言語モデル (VLM) の隠れ状態から抽出した1つのベクトルを利用して,入力中の良質な画像に対して対向画像を検出する,新しいiN時間埋め込み型AdveRSarial Image Detectction (NEARSIDE) 法を開発した。
論文 参考訳(メタデータ) (2024-10-30T10:33:10Z) - Improved Anomaly Detection through Conditional Latent Space VAE Ensembles [49.1574468325115]
条件付きラテント空間変分オートエンコーダ(CL-VAE)は、既知の不整形クラスと未知の不整形クラスを持つデータに対する異常検出のための前処理を改善した。
モデルでは異常検出の精度が向上し、MNISTデータセットで97.4%のAUCが達成された。
さらに、CL-VAEは、アンサンブルの利点、より解釈可能な潜在空間、モデルサイズに制限のある複雑なデータでパターンを学習する能力の増大を示す。
論文 参考訳(メタデータ) (2024-10-16T07:48:53Z) - Real-Time Dynamic Scale-Aware Fusion Detection Network: Take Road Damage Detection as an example [3.334973867478745]
道路被害検知(RDD)は,都市部における日常のメンテナンスと安全のために重要である。
現在のUAVベースのRDD研究は、まだ多くの課題に直面している。
背景干渉を自動的に除去できるマルチスケール適応道路損傷検出モデルを設計する。
論文 参考訳(メタデータ) (2024-09-04T09:03:47Z) - Towards Viewpoint Robustness in Bird's Eye View Segmentation [85.99907496019972]
AV知覚モデルがカメラ視点の変化にどのように影響するかを考察する。
投機時のピッチ、ヨー、深さ、高さへの小さな変化は、大きな性能低下につながる。
本稿では,新しいビュー合成技術を導入し,収集したデータをターゲットリグの視点に変換する手法を提案する。
論文 参考訳(メタデータ) (2023-09-11T02:10:07Z) - Object-Size-Driven Design of Convolutional Neural Networks: Virtual Axle Detection based on Raw Data [0.0]
本研究では,橋梁上に任意に設置したセンサを用いた列車軸受のリアルタイム検出手法を提案する。
VADER(Virtual Axle Detector with Enhanced Receptive Field)の開発は、単線鉄道橋上で検証されている。
生データを入力として使用することで、最先端のスペクトログラムベースの手法をスピードとメモリ使用率の両方で99%向上させた。
論文 参考訳(メタデータ) (2023-09-04T12:53:54Z) - Inertial Hallucinations -- When Wearable Inertial Devices Start Seeing
Things [82.15959827765325]
環境支援型生活(AAL)のためのマルチモーダルセンサフュージョンの新しいアプローチを提案する。
我々は、標準マルチモーダルアプローチの2つの大きな欠点、限られた範囲のカバレッジ、信頼性の低下に対処する。
我々の新しいフレームワークは、三重項学習によるモダリティ幻覚の概念を融合させ、異なるモダリティを持つモデルを訓練し、推論時に欠落したセンサーに対処する。
論文 参考訳(メタデータ) (2022-07-14T10:04:18Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。