論文の概要: On the Importance of Large Objects in CNN Based Object Detection
Algorithms
- arxiv url: http://arxiv.org/abs/2311.11714v1
- Date: Mon, 20 Nov 2023 12:32:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 19:07:26.407965
- Title: On the Importance of Large Objects in CNN Based Object Detection
Algorithms
- Title(参考訳): CNNに基づく物体検出アルゴリズムにおける大規模物体の重要性について
- Authors: Ahmed Ben Saad (CB), Gabriele Facciolo (CB), Axel Davy (CB)
- Abstract要約: すべてのサイズで重要な学習機能において、大きなオブジェクトの重要性を強調します。
大きな物体により多くの重みを与えると、全ての物体の大きさに対する検出スコアが向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection models, a prominent class of machine learning algorithms,
aim to identify and precisely locate objects in images or videos. However, this
task might yield uneven performances sometimes caused by the objects sizes and
the quality of the images and labels used for training. In this paper, we
highlight the importance of large objects in learning features that are
critical for all sizes. Given these findings, we propose to introduce a
weighting term into the training loss. This term is a function of the object
area size. We show that giving more weight to large objects leads to improved
detection scores across all object sizes and so an overall improvement in
Object Detectors performances (+2 p.p. of mAP on small objects, +2 p.p. on
medium and +4 p.p. on large on COCO val 2017 with InternImage-T). Additional
experiments and ablation studies with different models and on a different
dataset further confirm the robustness of our findings.
- Abstract(参考訳): 機械学習アルゴリズムの傑出したクラスであるオブジェクト検出モデルは、画像やビデオ内のオブジェクトを特定し、正確に特定することを目的としている。
しかし、このタスクは、オブジェクトのサイズとトレーニングに使用される画像やラベルの品質によって、時々不均一なパフォーマンスをもたらす可能性がある。
本稿では,全ての規模で重要な学習機能において,大きな物体の重要性を強調する。
これらの結果を踏まえて,トレーニング損失に重み付け項を導入することを提案する。
この用語は対象領域の大きさの関数である。
大型オブジェクトに重みを与えると、すべてのオブジェクトサイズにわたって検出スコアが向上し、オブジェクト検出器のパフォーマンスが全体的に向上することを示した(小さなオブジェクトのマップ+2 p.p.、媒体の+2 p.p.、インターンイメージ-tのcoco val 2017 largeの+4 p.p.)。
異なるモデルと異なるデータセットを用いたさらなる実験とアブレーションの研究は、この発見のロバスト性をさらに確認する。
関連論文リスト
- Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Uncertainty Aware Active Learning for Reconfiguration of Pre-trained
Deep Object-Detection Networks for New Target Domains [0.0]
物体検出はコンピュータビジョンタスクの最も重要かつ基本的な側面の1つである。
オブジェクト検出モデルのトレーニングデータを効率的に取得するために、多くのデータセットは、ビデオフォーマットでアノテーションのないデータを取得することを選択します。
ビデオからすべてのフレームに注釈を付けるのは、多くのフレームがモデルが学ぶのに非常によく似た情報を含んでいるため、費用がかかり非効率である。
本稿では,この問題に対処するためのオブジェクト検出モデルのための新しい能動学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:14:10Z) - GOOD: Exploring Geometric Cues for Detecting Objects in an Open World [33.25263418112558]
最先端のRGBベースのモデルは、トレーニングクラスの過度な適合に悩まされ、新しいオブジェクトの検出に失敗することが多い。
汎用単分子推定器により予測される深度や正規度などの幾何学的手法を取り入れることを提案する。
我々のGeometry-Guided Open World Object Detector (GOOD)は、新しいオブジェクトカテゴリの検出リコールを大幅に改善し、いくつかのトレーニングクラスですでにうまく機能している。
論文 参考訳(メタデータ) (2022-12-22T14:13:33Z) - ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object
Detection [24.085715205081385]
我々は、オブジェクトのサイズを画像中の画素数、サイズ不均衡として、データセット内の特定のサイズのオブジェクトの過剰表現として表現する。
本稿では,任意のオブジェクト検出モデル上にプラグインとして適用可能な,新しいARchitectUre-Agnostic BAlanced Loss (ARUBA)を提案する。
論文 参考訳(メタデータ) (2022-10-10T11:28:16Z) - Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Quantum Tensor Network in Machine Learning: An Application to Tiny
Object Classification [39.027985567917455]
私たちの研究では、量子スピンモデルを画像分類に適用し、この理論を小さな物体分類のシナリオに持ち込む。
最後に,実験結果から,テンソルネットワークモデルが微小物体分類問題に有効であり,最新技術に勝る可能性が示唆された。
論文 参考訳(メタデータ) (2021-01-08T18:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。