論文の概要: Exponentially Weighted Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection Model Training in Unmanned Aerial Vehicles Surveillance Scenarios
- arxiv url: http://arxiv.org/abs/2503.21893v1
- Date: Thu, 27 Mar 2025 18:09:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-31 15:32:53.171507
- Title: Exponentially Weighted Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection Model Training in Unmanned Aerial Vehicles Surveillance Scenarios
- Title(参考訳): 無人航空機サーベイランスシナリオにおける長距離物体検出モデルトレーニングのための指数重み付きインスタンス認識繰り返し因子サンプリング
- Authors: Taufiq Ahmed, Abhishek Kumar, Constantino Álvarez Casado, Anlan Zhang, Tuomo Hänninen, Lauri Loven, Miguel Bordallo López, Sasu Tarkoma,
- Abstract要約: E-IRFS(Exponentially Weighted Instance-Aware Repeat Factor Smpling)を導入する。
E-IRFSは、稀なクラスと頻繁なクラスを区別するために指数スケーリングを適用している。
本研究では,Fireman-UAV-RGBTデータセットから得られたデータセットからE-IRFSを評価する。
- 参考スコア(独自算出の注目度): 7.807810158327325
- License:
- Abstract: Object detection models often struggle with class imbalance, where rare categories appear significantly less frequently than common ones. Existing sampling-based rebalancing strategies, such as Repeat Factor Sampling (RFS) and Instance-Aware Repeat Factor Sampling (IRFS), mitigate this issue by adjusting sample frequencies based on image and instance counts. However, these methods are based on linear adjustments, which limit their effectiveness in long-tailed distributions. This work introduces Exponentially Weighted Instance-Aware Repeat Factor Sampling (E-IRFS), an extension of IRFS that applies exponential scaling to better differentiate between rare and frequent classes. E-IRFS adjusts sampling probabilities using an exponential function applied to the geometric mean of image and instance frequencies, ensuring a more adaptive rebalancing strategy. We evaluate E-IRFS on a dataset derived from the Fireman-UAV-RGBT Dataset and four additional public datasets, using YOLOv11 object detection models to identify fire, smoke, people and lakes in emergency scenarios. The results show that E-IRFS improves detection performance by 22\% over the baseline and outperforms RFS and IRFS, particularly for rare categories. The analysis also highlights that E-IRFS has a stronger effect on lightweight models with limited capacity, as these models rely more on data sampling strategies to address class imbalance. The findings demonstrate that E-IRFS improves rare object detection in resource-constrained environments, making it a suitable solution for real-time applications such as UAV-based emergency monitoring.
- Abstract(参考訳): オブジェクト検出モデルは、しばしばクラス不均衡に苦しむ。
Repeat Factor Smpling (RFS) や Instance-Aware Repeat Factor Smpling (IRFS) のような既存のサンプリングベースのリバランス戦略は、画像とインスタンス数に基づいてサンプル周波数を調整することでこの問題を軽減する。
しかし、これらの手法は、長い尾の分布における有効性を制限する線形調整に基づいている。
IRFSの拡張であるExponentially Weighted Instance-Aware Repeat Factor Sampling(E-IRFS)を導入し、希少なクラスと頻繁なクラスの区別を改善するために指数スケーリングを適用した。
E-IRFSは、画像の幾何平均とインスタンス周波数に適用される指数関数を用いてサンプリング確率を調整し、より適応的な再バランス戦略を保証する。
我々は,消防団UAV-RGBTデータセットから得られたデータセットと,さらに4つの公開データセットを用いて,緊急時の火災・煙・人・湖の識別にYOLOv11オブジェクト検出モデルを用いてE-IRFSを評価した。
その結果,E-IRFSは検出性能を22倍に向上し,RASやIRFSよりも高い性能を示した。
この分析はまた、E-IRFSはクラス不均衡に対応するためにデータサンプリング戦略に依存するため、限られたキャパシティを持つ軽量モデルに強い影響を与えることを強調している。
その結果,E-IRFSは資源制約環境下での希少物体検出を改良し,UAVによる緊急監視などのリアルタイムアプリケーションに適したソリューションであることがわかった。
関連論文リスト
- Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文 参考訳(メタデータ) (2024-03-27T02:24:00Z) - On Optimal Sampling for Learning SDF Using MLPs Equipped with Positional Encoding [76.78321723602636]
我々は、好ましくない副作用を伴わずに、正確な暗黙の場を学習するための適切なサンプリング率を決定するツールを考案した。
PEを具備したPEは、PE層の最高周波数成分よりも内在周波数がはるかに高いことが観察された。
SDFフィッティングの設定において,この推奨サンプリングレートは正確なフィッティング結果の確保に十分であることを示す。
論文 参考訳(メタデータ) (2024-01-02T10:51:52Z) - Let's Roll: Synthetic Dataset Analysis for Pedestrian Detection Across
Different Shutter Types [7.0441427250832644]
本稿では,機械学習(ML)オブジェクト検出モデルに異なるシャッター機構が与える影響について検討する。
特に、合成合成されたGSとRSのデータセットを用いて、主流検出モデルを訓練し、評価する。
論文 参考訳(メタデータ) (2023-09-15T04:07:42Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection [3.4913694429616022]
現実世界のオブジェクト検出における不均衡なデータセットは、各クラスのインスタンス数に大きな差がある場合が多い。
本稿では,再サンプリングプロセスのインスタンス数とイメージ数を統一し,異なる視点を意識するIRFSを提案する。
提案手法は,LVIS v1.0ベンチマークデータセットにおいて有望な結果を示す。
論文 参考訳(メタデータ) (2023-05-14T04:53:05Z) - EARL: An Elliptical Distribution aided Adaptive Rotation Label
Assignment for Oriented Object Detection in Remote Sensing Images [22.963695067213084]
アダプティブ・ローテーション・ラベル・アサインメント (EARL) は、アンカーフリー検出器において、高品質な正のサンプルを適応的に選択するために提案される。
本稿では,ターゲットの規模に応じて多レベル特徴写像の中から適応的にサンプルを選択するために,適応型スケールサンプリング(ADS)戦略を提案する。
さらに, 動的楕円分布支援サンプリング (DED) 戦略を提案し, 試料分布をより柔軟にし, ターゲットの形状や配向に適合させる。
論文 参考訳(メタデータ) (2023-01-14T08:32:16Z) - Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。
グループサンプリングを提案し、同じクラスのサンプルをグループに集める。
Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文 参考訳(メタデータ) (2021-07-07T05:39:58Z) - FASA: Feature Augmentation and Sampling Adaptation for Long-Tailed
Instance Segmentation [91.129039760095]
ロングテールインスタンスセグメンテーションの最近の手法は、トレーニングデータが少ないレアオブジェクトクラスで未だに苦労している。
本稿では,FASA(Feature Augmentation and Smpling Adaptation)を提案する。
FASAは、標準またはロングテールのセグメンテーションフレームワークに簡単に接続できる、高速で汎用的な方法です。
論文 参考訳(メタデータ) (2021-02-25T14:07:23Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。