論文の概要: ABBSPO: Adaptive Bounding Box Scaling and Symmetric Prior based Orientation Prediction for Detecting Aerial Image Objects
- arxiv url: http://arxiv.org/abs/2512.10031v1
- Date: Wed, 10 Dec 2025 19:37:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.02648
- Title: ABBSPO: Adaptive Bounding Box Scaling and Symmetric Prior based Orientation Prediction for Detecting Aerial Image Objects
- Title(参考訳): ABBSPO:アダプティブバウンディングボックススケーリングと空画像物体検出のための対称性優先配向予測
- Authors: Woojin Lee, Hyugjae Chang, Jaeho Moon, Jaehyup Lee, Munchurl Kim,
- Abstract要約: 本稿では適応的バウンディングボックススケーリングと対称性に基づく配向予測を導入する。
ABBSPOは最先端のパフォーマンスを実現し、既存の手法よりも優れています。
- 参考スコア(独自算出の注目度): 34.272230256257934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised oriented object detection (WS-OOD) has gained attention as a cost-effective alternative to fully supervised methods, providing both efficiency and high accuracy. Among weakly supervised approaches, horizontal bounding box (HBox)-supervised OOD stands out for its ability to directly leverage existing HBox annotations while achieving the highest accuracy under weak supervision settings. This paper introduces adaptive bounding box scaling and symmetry-prior-based orientation prediction, called ABBSPO, a framework for WS-OOD. Our ABBSPO addresses limitations of previous HBox-supervised OOD methods, which compare ground truth (GT) HBoxes directly with the minimum circumscribed rectangles of predicted RBoxes, often leading to inaccurate scale estimation. To overcome this, we propose: (i) Adaptive Bounding Box Scaling (ABBS), which appropriately scales GT HBoxes to optimize for the size of each predicted RBox, ensuring more accurate scale prediction; and (ii) a Symmetric Prior Angle (SPA) loss that exploits inherent symmetry of aerial objects for self-supervised learning, resolving issues in previous methods where learning collapses when predictions for all three augmented views (original, rotated, and flipped) are consistently incorrect. Extensive experimental results demonstrate that ABBSPO achieves state-of-the-art performance, outperforming existing methods.
- Abstract(参考訳): 弱教師付きオブジェクト指向検出(WS-OOD)は、完全教師付き手法に代えてコスト効率の高い代替手段として注目され、効率性と精度が向上している。
弱い教師付きアプローチの中で、水平バウンディングボックス(HBox)が監督するOODは、既存のHBoxアノテーションを直接活用すると同時に、弱い監督設定下で最高の精度を達成することができる。
本稿では,WS-OOD のフレームワークである ABBSPO と呼ばれる適応的バウンディングボックススケーリングと対称性に基づく配向予測を導入する。
我々のABBSPOは、予測されたRBoxの最小周長方形と接地真理(GT)HBoxを直接比較し、しばしば不正確なスケール推定を行う、従来のHBox制御OOD手法の制限に対処する。
これを克服するために、我々は次のように提案する。
(i)適応バウンディングボックススケーリング(ABBS)は、GT HBoxを適切にスケールし、予測された各RBoxのサイズを最適化し、より正確なスケール予測を保証する。
(II) 自己教師型学習において, 空中物体の固有対称性を利用したSPA(Symmetric Prior Angle)損失は, 従来の3つの拡張ビュー(元, 回転, 反転)の予測が常に正しくない場合に, 学習が崩壊する問題の解決である。
実験の結果, ABBSPOは従来の手法よりも優れ, 最先端の性能を実現していることがわかった。
関連論文リスト
- Bayesian Test-time Adaptation for Object Recognition and Detection with Vision-language Models [86.53246292425699]
我々は、オブジェクト認識と検出の両方のためのTTAのためのトレーニングフリーフレームワークであるBCA+を提案する。
我々はベイズ推論問題として適応を定式化し、キャッシュベースの予測で初期VLM出力を融合することで最終的な予測を生成する。
BCA+は、認識と検出のベンチマークの両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-10-03T06:27:33Z) - Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.61554561979589]
エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。
既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。
本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文 参考訳(メタデータ) (2024-12-24T07:28:10Z) - Towards Calibrated Robust Fine-Tuning of Vision-Language Models [97.19901765814431]
本研究は、視覚言語モデルにおいて、OOD精度と信頼性校正の両方を同時に改善する頑健な微調整法を提案する。
OOD分類とOOD校正誤差は2つのIDデータからなる共有上限を持つことを示す。
この知見に基づいて,最小の特異値を持つ制約付きマルチモーダルコントラスト損失を用いて微調整を行う新しいフレームワークを設計する。
論文 参考訳(メタデータ) (2023-11-03T05:41:25Z) - Unbalanced Optimal Transport: A Unified Framework for Object Detection [97.74382560746987]
不均衡最適輸送がオブジェクト検出に対する異なるアプローチをどのように統合するかを示す。
非平衡最適輸送を用いた物体検出モデルの訓練が最先端に到達可能であることを示す。
このアプローチはGPUの実装に適しており、大規模なモデルに有利であることが証明されている。
論文 参考訳(メタデータ) (2023-07-05T16:21:52Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - TSAA: A Two-Stage Anchor Assignment Method towards Anchor Drift in
Crowded Object Detection [0.0]
正のアンカーは、複数のオブジェクトが重なり合うときに最も重なるオブジェクトに対して常に回帰するとは限らない。
単純な適応型2段アンカーアサイン(TSAA)法を提案する。
論文 参考訳(メタデータ) (2022-11-02T02:05:00Z) - A General Gaussian Heatmap Labeling for Arbitrary-Oriented Object
Detection [11.954992010840833]
正の候補を定義するために、アンカーフリーなオブジェクト適応ラベル割り当て(OLA)戦略が提示される。
OBBを表すために、オブジェクト指向バウンディングボックス(OBB)表現コンポーネント(ORC)が開発された。
領域正規化と動的信頼度重み付けを併用した共同最適化損失(JOL)は、誤った最適結果を洗練するために設計されている。
論文 参考訳(メタデータ) (2021-09-27T07:46:09Z) - DAFNe: A One-Stage Anchor-Free Deep Model for Oriented Object Detection [16.21161769128316]
DAFNe: オブジェクト指向物体検出のためのワンステージアンカーフリーディープネットワークを提案する。
アンカーフリーモデルとして、DAFNeはバウンディングボックスアンカーの使用を控えることで予測複雑性を低減する。
低品質な予測に対する任意指向の有界箱に対する中心性関数の指向性を考慮した一般化を提案する。
論文 参考訳(メタデータ) (2021-09-13T17:37:20Z) - Nonlinear Projection Based Gradient Estimation for Query Efficient
Blackbox Attacks [21.718029193267526]
勾配推定とベクトル空間投影とのギャップを橋渡し, 投影された低次元空間に基づいて勾配を効率的に推定する方法を検討する。
理論解析に基づいて,新しいクエリ効率のグラディエントプロジェクションに基づく境界ブラックボックス攻撃を提案する。
予測に基づく境界ブラックボックス攻撃は、効率的なクエリに基づいて100%攻撃成功率で、はるかに小さな摂動を実現できることを示す。
論文 参考訳(メタデータ) (2021-02-25T21:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。