論文の概要: A Systematic Evaluation of Object Detection Networks for Scientific
Plots
- arxiv url: http://arxiv.org/abs/2007.02240v2
- Date: Sat, 19 Dec 2020 07:37:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 08:23:15.620415
- Title: A Systematic Evaluation of Object Detection Networks for Scientific
Plots
- Title(参考訳): 科学的プロットのための物体検出ネットワークの系統的評価
- Authors: Pritha Ganguly, Nitesh Methani, Mitesh M. Khapra and Pratyush Kumar
- Abstract要約: PlotQAデータセット上で、様々なSOTAオブジェクト検出ネットワークの精度をトレーニングし比較する。
0.5の標準IOU設定では、ほとんどのネットワークはプロット内の比較的単純な物体を検出する場合、mAPスコアが80%以上である。
しかし、パフォーマンスは0.9のより厳格なIOUで評価されると大幅に低下し、最高のモデルでmAPは35.70%となった。
- 参考スコア(独自算出の注目度): 17.882932963813985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Are existing object detection methods adequate for detecting text and visual
elements in scientific plots which are arguably different than the objects
found in natural images? To answer this question, we train and compare the
accuracy of various SOTA object detection networks on the PlotQA dataset. At
the standard IOU setting of 0.5, most networks perform well with mAP scores
greater than 80% in detecting the relatively simple objects in plots. However,
the performance drops drastically when evaluated at a stricter IOU of 0.9 with
the best model giving a mAP of 35.70%. Note that such a stricter evaluation is
essential when dealing with scientific plots where even minor localisation
errors can lead to large errors in downstream numerical inferences. Given this
poor performance, we propose minor modifications to existing models by
combining ideas from different object detection networks. While this
significantly improves the performance, there are still 2 main issues: (i)
performance on text objects which are essential for reasoning is very poor, and
(ii) inference time is unacceptably large considering the simplicity of plots.
To solve this open problem, we make a series of contributions: (a) an efficient
region proposal method based on Laplacian edge detectors, (b) a feature
representation of region proposals that includes neighbouring information, (c)
a linking component to join multiple region proposals for detecting longer
textual objects, and (d) a custom loss function that combines a smooth L1-loss
with an IOU-based loss. Combining these ideas, our final model is very accurate
at extreme IOU values achieving a mAP of 93.44%@0.9 IOU. Simultaneously, our
model is very efficient with an inference time 16x lesser than the current
models, including one-stage detectors. With these contributions, we enable
further exploration on the automated reasoning of plots.
- Abstract(参考訳): 既存の物体検出法は、自然画像に見られる物体と明らかに異なる科学的プロットのテキストや視覚要素を検出するのに適切か?
この質問に答えるために、PlotQAデータセット上の様々なSOTAオブジェクト検出ネットワークの精度をトレーニングし比較する。
0.5の標準IOU設定では、ほとんどのネットワークはプロット内の比較的単純な物体を検出する場合、mAPスコアが80%以上である。
しかし、パフォーマンスは0.9のより厳格なIOUで評価されると大幅に低下し、最高のモデルでmAPは35.70%となった。
このような厳密な評価は、小さな局所化誤差でさえ下流の数値推論において大きな誤差をもたらす科学的なプロットを扱う際に必要である。
この性能が劣ると、異なるオブジェクト検出ネットワークのアイデアを組み合わせることで、既存のモデルに小さな修正を加えることを提案する。
これはパフォーマンスを大幅に改善するが、依然として2つの大きな問題がある。
(i)推論に欠かせないテキストオブジェクトのパフォーマンスは、非常に貧弱である。
(ii)プロットの単純さを考えると、推論時間は明らかに大きい。
この未解決の問題を解決するために 一連の貢献をします
(a)ラプラシアンエッジ検出器に基づく効率的な領域提案法
(b)隣接情報を含む地域提案の特徴表示
(c)より長いテキストオブジェクトを検出するための複数の領域提案に結合するリンクコンポーネント、
(d)スムーズなL1ロスとIOUベースのロスを組み合わせたカスタムロス関数。
これらのアイデアを組み合わせることで、最終モデルは、93.44%@0.9 IOUのmAPを達成する極端なIOU値において非常に正確である。
同時に、我々のモデルは1段検出器を含む現在のモデルよりも16倍少ない推論時間で非常に効率的である。
これらの貢献により、プロットの自動推論のさらなる探索が可能になる。
関連論文リスト
- Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Single Object Tracking through a Fast and Effective Single-Multiple
Model Convolutional Neural Network [0.0]
最近の最先端の(SOTA)アプローチは、エリア内の他のオブジェクトとターゲットを区別するために重い構造を持つマッチングネットワークを取ることに基づいて提案されています。
本稿では,これまでのアプローチとは対照的に,一つのショットで物体の位置を識別できる特殊なアーキテクチャを提案する。
提示されたトラッカーは、1080tiで最大120 fps$の超高速で、挑戦的な状況でsomaと比較してパフォーマンスする。
論文 参考訳(メタデータ) (2021-03-28T11:02:14Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Collaborative Training between Region Proposal Localization and
Classification for Domain Adaptive Object Detection [121.28769542994664]
オブジェクト検出のためのドメイン適応は、ラベル付きデータセットからラベル付きデータセットへの検出を適応させようとする。
本稿では,地域提案ネットワーク (RPN) と地域提案分類器 (RPC) が,大きなドメインギャップに直面した場合の転送可能性が大きく異なることを初めて明らかにする。
論文 参考訳(メタデータ) (2020-09-17T07:39:52Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。