論文の概要: LEAP:D - A Novel Prompt-based Approach for Domain-Generalized Aerial Object Detection
- arxiv url: http://arxiv.org/abs/2411.09180v1
- Date: Thu, 14 Nov 2024 04:39:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 15:25:09.466217
- Title: LEAP:D - A Novel Prompt-based Approach for Domain-Generalized Aerial Object Detection
- Title(参考訳): LEAP:D - ドメイン一般化空中物体検出のための新しいプロンプトベースアプローチ
- Authors: Chanyeong Park, Heegwang Kim, Joonki Paik,
- Abstract要約: 学習可能なプロンプトを用いた革新的な視覚言語アプローチを提案する。
この手動プロンプトからのシフトは、ドメイン固有の知識干渉を減らすことを目的としている。
トレーニングプロセスを一段階のアプローチで合理化し、学習可能なプロンプトとモデルトレーニングを同時に更新する。
- 参考スコア(独自算出の注目度): 2.1233286062376497
- License:
- Abstract: Drone-captured images present significant challenges in object detection due to varying shooting conditions, which can alter object appearance and shape. Factors such as drone altitude, angle, and weather cause these variations, influencing the performance of object detection algorithms. To tackle these challenges, we introduce an innovative vision-language approach using learnable prompts. This shift from conventional manual prompts aims to reduce domain-specific knowledge interference, ultimately improving object detection capabilities. Furthermore, we streamline the training process with a one-step approach, updating the learnable prompt concurrently with model training, enhancing efficiency without compromising performance. Our study contributes to domain-generalized object detection by leveraging learnable prompts and optimizing training processes. This enhances model robustness and adaptability across diverse environments, leading to more effective aerial object detection.
- Abstract(参考訳): ドローンで撮影した画像は、様々な撮影条件によって物体の外観や形状を変える可能性があるため、物体検出において重要な課題を呈している。
ドローンの高度、角度、天候などの要因がこれらの変化を引き起こし、物体検出アルゴリズムの性能に影響を与える。
これらの課題に対処するために、学習可能なプロンプトを用いた革新的な視覚言語アプローチを導入する。
従来の手動プロンプトからのこのシフトは、ドメイン固有の知識干渉を減らすことを目的としており、最終的にはオブジェクト検出機能を改善する。
さらに,1段階のアプローチでトレーニングプロセスの合理化,学習可能なプロンプトとモデルトレーニングを同時に更新し,性能を損なうことなく効率を向上する。
本研究は,学習可能なプロンプトを活用し,学習過程を最適化することにより,ドメイン汎用オブジェクト検出に寄与する。
これにより、様々な環境にまたがるモデルの堅牢性と適応性が向上し、より効果的な空中物体検出が実現される。
関連論文リスト
- Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。
近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。
本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-01T17:32:26Z) - Active Object Detection with Knowledge Aggregation and Distillation from Large Models [5.669106489320257]
状態変化中のアクティブオブジェクトを正確に検出することは、人間のインタラクションを理解し、意思決定を容易にするために不可欠である。
既存のアクティブオブジェクト検出法(AOD)は主に、サイズ、形状、手との関係など、入力内のオブジェクトの視覚的外観に依存する。
状態変化は、しばしばオブジェクト上で実行される相互作用の結果であり、AODに対してより信頼性の高い手がかりを提供するために、オブジェクトに関連する可視的相互作用に関する情報的事前利用を提案する。
提案するフレームワークは,Ego4D,Epic-Kitchens,MECCANOの4つのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-05-21T05:39:31Z) - Zero-shot Degree of Ill-posedness Estimation for Active Small Object Change Detection [8.977792536037956]
日常的な屋内ナビゲーションでは、ロボットは区別できない小さな変化物体を検出する必要がある。
既存の技術は、変更検出モデルを正規化するために、高品質なクラス固有オブジェクトに依存している。
本研究では,受動とアクティブビジョンの両方を改善するために,DoIの概念を検討する。
論文 参考訳(メタデータ) (2024-05-10T01:56:39Z) - Deep Active Perception for Object Detection using Navigation Proposals [39.52573252842573]
オブジェクト検出のための汎用的な教師付き能動知覚パイプラインを提案する。
既存のオフ・ザ・シェルフ・オブジェクト・ディテクターを使って訓練でき、シミュレーション環境の進歩も活用できる。
提案手法は, Webots ロボットシミュレータ内に構築された合成データセットを用いて評価した。
論文 参考訳(メタデータ) (2023-12-15T20:55:52Z) - Lifelong Change Detection: Continuous Domain Adaptation for Small Object
Change Detection in Every Robot Navigation [5.8010446129208155]
地表面の視界変化検出は, 複雑な非線形視点投影と相まって, 視界の不確かさに悩まされる。
正規化のためには,手動で注釈付けされた高品質なオブジェクトクラス固有の先行手法が一般的である。
本手法は,日常のロボットナビゲーションにおいて検出される物体の変化を,将来的な変化検出タスクを改善するために,追加の事前として再利用できるという,強力で汎用的な考え方を採用する。
論文 参考訳(メタデータ) (2023-06-28T10:34:59Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Object Detection and Recognition of Swap-Bodies using Camera mounted on
a Vehicle [13.702911401489427]
本研究の目的は、スワップボディのオブジェクト検出を共同で行い、ILUコードを読み取ってスワップボディの種類を見つけることである。
近年の研究活動は、コンピュータビジョンの分野を強化する深層学習技術を大幅に改善している。
論文 参考訳(メタデータ) (2020-04-17T08:49:54Z) - Incremental Object Detection via Meta-Learning [77.55310507917012]
本稿では,段階的タスク間の情報を最適に共有するように,モデル勾配を再形成するメタラーニング手法を提案する。
既存のメタ学習法と比較して,本手法はタスク非依存であり,オブジェクト検出のための高容量モデルに新たなクラスやスケールを段階的に追加することができる。
論文 参考訳(メタデータ) (2020-03-17T13:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。