論文の概要: 15,500 Seconds: Lean UAV Classification Using EfficientNet and Lightweight Fine-Tuning
- arxiv url: http://arxiv.org/abs/2506.11049v4
- Date: Thu, 14 Aug 2025 14:50:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 13:42:23.331636
- Title: 15,500 Seconds: Lean UAV Classification Using EfficientNet and Lightweight Fine-Tuning
- Title(参考訳): 15500秒 - 効率的なネットと軽量ファインチューニングを用いたリーンUAV分類
- Authors: Andrew P. Berg, Qian Zhang, Mia Y. Wang,
- Abstract要約: 本稿では,UAV音声分類におけるデータ不足の課題について,先行作業の拡大による検討を行う。
私たちは、31種類のドローンにまたがる3,100UAVオーディオクリップ(15,500秒)のカスタムデータセットを使用します。
5倍のクロスバリデーション,精度評価,トレーニング効率,堅牢性試験を行った。
- 参考スコア(独自算出の注目度): 2.3354223046061016
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: As unmanned aerial vehicles (UAVs) become increasingly prevalent in both consumer and defense applications, the need for reliable, modality-specific classification systems grows in urgency. This paper addresses the challenge of data scarcity in UAV audio classification by expanding on prior work through the integration of pre-trained deep learning models, parameter-efficient fine-tuning (PEFT) strategies, and targeted data augmentation techniques. Using a custom dataset of 3,100 UAV audio clips (15,500 seconds) spanning 31 distinct drone types, we evaluate the performance of transformer-based and convolutional neural network (CNN) architectures under various fine-tuning configurations. Experiments were conducted with five-fold cross-validation, assessing accuracy, training efficiency, and robustness. Results show that full fine-tuning of the EfficientNet-B0 model with three augmentations achieved the highest validation accuracy (95.95), outperforming both the custom CNN and transformer-based models like AST. These findings suggest that combining lightweight architectures with PEFT and well-chosen augmentations provides an effective strategy for UAV audio classification on limited datasets. Future work will extend this framework to multimodal UAV classification using visual and radar telemetry.
- Abstract(参考訳): 無人航空機(UAV)は、消費者および防衛用途の両方でますます普及しているため、信頼性の高いモダリティ固有の分類システムの必要性は緊急時に増大する。
本稿では,事前学習型深層学習モデル,パラメータ効率向上型微調整(PEFT)戦略,および対象データ拡張手法を統合することで,UAV音声分類におけるデータ不足の課題に対処する。
31種類の異なるドローンにまたがる3,100UAVオーディオクリップ(15,500秒)のカスタムデータセットを使用して、様々な微調整構成でトランスフォーマーベースおよび畳み込みニューラルネットワーク(CNN)アーキテクチャの性能を評価する。
5倍のクロスバリデーション,精度評価,トレーニング効率,堅牢性試験を行った。
その結果、3つの拡張されたEfficientNet-B0モデルの完全な微調整は高い検証精度(95.95)を達成し、カスタムCNNとASTのようなトランスフォーマーベースのモデルの両方を上回った。
これらの結果は,PEFT と well-chosen augmentations を組み合わせた軽量アーキテクチャが,限られたデータセット上でのUAV音声分類に有効な戦略であることを示唆している。
今後の研究は、この枠組みを視覚およびレーダーテレメトリを用いたマルチモーダルUAV分類に拡張する予定である。
関連論文リスト
- 4,500 Seconds: Small Data Training Approaches for Deep UAV Audio Classification [2.3354223046061016]
本研究では,UAV分類における深層学習のアプローチについて,データ不足の重要な問題に着目して検討する。
合計4,500秒のオーディオサンプルを使用してモデルをトレーニングし、9クラスのデータセットに均等に分散する。
我々は、畳み込みニューラルネットワーク(CNN)とアテンションベースのトランスフォーマーの使用を比較した。
論文 参考訳(メタデータ) (2025-05-21T22:34:07Z) - Towards Building Secure UAV Navigation with FHE-aware Knowledge Distillation [0.0]
本稿では,セキュアなUAVナビゲーションの実現性を高めるため,知識蒸留を活用した革新的なアプローチを提案する。
RLとFHEを統合することで、我々のフレームワークは、暗号化されたUAVカメラフィードのリアルタイム処理を可能にしながら、敵攻撃に対する脆弱性に対処する。
FHEのレイテンシを軽減するために、知識蒸留を用いてネットワークを圧縮し、性能を損なうことなく18倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2024-11-01T07:04:24Z) - SOAR: Self-supervision Optimized UAV Action Recognition with Efficient Object-Aware Pretraining [65.9024395309316]
無人航空機(UAV)が捉えた航空映像の自己監督型事前学習アルゴリズムについて紹介する。
我々は,UAVビデオの事前学習効率と下流行動認識性能を向上させるために,事前学習プロセスを通じて人体知識を取り入れた。
論文 参考訳(メタデータ) (2024-09-26T21:15:22Z) - Securing the Skies: An IRS-Assisted AoI-Aware Secure Multi-UAV System with Efficient Task Offloading [3.427366431933441]
当社のフレームワークは,指数的AoI指標を取り入れ,盗難や妨害の脅威に対処するための秘密保持率を強調している。
本稿では,タスクオフロードプロセスの最適化を目的とした,トランスフォーマー強化型Deep Reinforcement Learning (DRL) アプローチを提案する。
論文 参考訳(メタデータ) (2024-04-06T17:41:00Z) - Evidential Detection and Tracking Collaboration: New Problem, Benchmark
and Algorithm for Robust Anti-UAV System [56.51247807483176]
無人航空機(UAV)は輸送、監視、軍事など多くの地域で広く使われている。
従来は、UAVの先行情報が常に提供されていた追跡問題として、このようなアンチUAVタスクを単純化していた。
本稿では,従来のUAV情報を含まない複雑な場面において,UAVの認識を特徴とする新しい実用的対UAV問題を初めて定式化する。
論文 参考訳(メタデータ) (2023-06-27T19:30:23Z) - Integrated Sensing, Computation, and Communication for UAV-assisted
Federated Edge Learning [52.7230652428711]
フェデレーションエッジ学習(FEEL)は、エッジデバイスとサーバ間の定期的な通信を通じて、プライバシ保護モデルトレーニングを可能にする。
無人航空機(UAV)搭載エッジデバイスは、効率的なデータ収集における柔軟性と移動性のため、FEELにとって特に有利である。
論文 参考訳(メタデータ) (2023-06-05T16:01:33Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。