論文の概要: Knowledge Distillation for Object Detection: from generic to remote
sensing datasets
- arxiv url: http://arxiv.org/abs/2307.09264v1
- Date: Tue, 18 Jul 2023 13:49:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 14:35:22.200201
- Title: Knowledge Distillation for Object Detection: from generic to remote
sensing datasets
- Title(参考訳): 物体検出のための知識蒸留:汎用データからリモートセンシングデータへ
- Authors: Ho\`ang-\^An L\^e and Minh-Tan Pham
- Abstract要約: 汎用コンピュータビジョンデータセット上で開発された既成のオブジェクト知識蒸留法について検討した。
特に、xViewとVEDAIデータセットとしてよく知られたベンチマークを用いて、ロジットと機能模倣の両方のアプローチをカバーする手法を車両検出に適用する。
- 参考スコア(独自算出の注目度): 7.872075562968697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge distillation, a well-known model compression technique, is an
active research area in both computer vision and remote sensing communities. In
this paper, we evaluate in a remote sensing context various off-the-shelf
object detection knowledge distillation methods which have been originally
developed on generic computer vision datasets such as Pascal VOC. In
particular, methods covering both logit mimicking and feature imitation
approaches are applied for vehicle detection using the well-known benchmarks
such as xView and VEDAI datasets. Extensive experiments are performed to
compare the relative performance and interrelationships of the methods.
Experimental results show high variations and confirm the importance of result
aggregation and cross validation on remote sensing datasets.
- Abstract(参考訳): 知識蒸留は、よく知られたモデル圧縮技術であり、コンピュータビジョンとリモートセンシングコミュニティの両方において活発な研究領域である。
本稿では,pascal vocのような汎用コンピュータビジョンデータセット上で開発された様々なオフ・ザ・シェル・オブジェクト検出知識蒸留法について,遠隔センシング環境下で評価する。
特に、xViewやVEDAIデータセットなどのよく知られたベンチマークを用いて、ロジット模倣と特徴模倣の両方の手法を車両検出に適用する。
手法の相対的性能と相互関係を比較するために,広範囲にわたる実験を行った。
実験結果から,リモートセンシングデータセットにおける結果集約とクロス検証の重要性を確認した。
関連論文リスト
- UAV-Based Human Body Detector Selection and Fusion for Geolocated Saliency Map Generation [0.2499907423888049]
無人航空機(UAV)を用いた探索・救助など多くの応用分野において、ソフトリアルタイムの異なるクラスの物体を確実に検出・位置決めする問題は不可欠である。
本研究は、システムコンテキストの視覚に基づく検出器の選択、割り当て、実行の相補的な問題に対処する。
検出結果は,新しいセンサモデルを利用して,正と負の両方の観測を視覚ベースで検出する,有意な位置の地図を構築する手法を用いて融合される。
論文 参考訳(メタデータ) (2024-08-29T13:00:37Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Object-centric Cross-modal Feature Distillation for Event-based Object
Detection [87.50272918262361]
RGB検出器は、イベントデータのばらつきと視覚的詳細の欠如により、イベントベースの検出器よりも優れている。
これら2つのモード間の性能ギャップを縮めるための新しい知識蒸留手法を開発した。
対象中心蒸留により,イベントベースの学生物体検出装置の性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-11-09T16:33:08Z) - CrossDF: Improving Cross-Domain Deepfake Detection with Deep Information Decomposition [53.860796916196634]
クロスデータセットディープフェイク検出(CrossDF)の性能を高めるためのディープ情報分解(DID)フレームワークを提案する。
既存のディープフェイク検出方法とは異なり、我々のフレームワークは特定の視覚的アーティファクトよりも高いレベルのセマンティック特徴を優先する。
顔の特徴をディープフェイク関連情報と無関係情報に適応的に分解し、本質的なディープフェイク関連情報のみを用いてリアルタイム・フェイク識別を行う。
論文 参考訳(メタデータ) (2023-09-30T12:30:25Z) - A Functional Data Perspective and Baseline On Multi-Layer
Out-of-Distribution Detection [30.499548939422194]
複数のレイヤを探索するメソッドには、特別なアーキテクチャか、それを行うための管理対象が必要です。
この研究は、様々なレイヤとそれらの統計的依存関係を通してサンプルの軌跡を利用するネットワークの機能的なビューに基づいた、オリジナルのアプローチを採用する。
提案手法の有効性を実証的に検証し,OOD検出におけるOOD検出の有効性をコンピュータビジョンベンチマーク上での最先端のベースラインと比較した。
論文 参考訳(メタデータ) (2023-06-06T09:14:05Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Towards an efficient framework for Data Extraction from Chart Images [27.114170963444074]
データマイニングシステムにおいて,データ抽出段階において最先端のコンピュータビジョン技術を採用する。
堅牢な点検出器を構築するには、特徴融合モジュールを備えた完全な畳み込みネットワークを採用する。
データ変換では,検出した要素を意味値でデータに変換する。
論文 参考訳(メタデータ) (2021-05-05T13:18:53Z) - Visual Relationship Detection with Visual-Linguistic Knowledge from
Multimodal Representations [103.00383924074585]
視覚的関係検出は、画像内の有能なオブジェクト間の関係を推論することを目的としている。
変換器からの視覚言語表現(RVL-BERT)という新しい手法を提案する。
RVL-BERTは、自己教師付き事前学習を通じて学習した視覚的・言語的常識知識を用いて空間推論を行う。
論文 参考訳(メタデータ) (2020-09-10T16:15:09Z) - Sensor Data for Human Activity Recognition: Feature Representation and
Benchmarking [27.061240686613182]
HAR(Human Activity Recognition)の分野は、監視装置(センサなど)から取得したデータを取得し、分析することに焦点を当てている。
我々は、異なる機械学習(ML)技術を用いて、人間のアクティビティを正確に認識する問題に対処する。
論文 参考訳(メタデータ) (2020-05-15T00:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。