論文の概要: Graph Fusion Network for Multi-Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2205.03562v3
- Date: Tue, 20 Jun 2023 03:50:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 06:16:42.918302
- Title: Graph Fusion Network for Multi-Oriented Object Detection
- Title(参考訳): 多目的物体検出のためのグラフ融合ネットワーク
- Authors: Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Xu-Cheng Yin
- Abstract要約: 本稿では,多目的物体検出のための新しいグラフ融合ネットワークGFNetを提案する。
我々のGFNetは、より正確で総合的な多目的オブジェクトインスタンスを検出するために、高密度検出ボックスを適応的に融合しています。
- 参考スコア(独自算出の注目度): 15.451824121019449
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In object detection, non-maximum suppression (NMS) methods are extensively
adopted to remove horizontal duplicates of detected dense boxes for generating
final object instances. However, due to the degraded quality of dense detection
boxes and not explicit exploration of the context information, existing NMS
methods via simple intersection-over-union (IoU) metrics tend to underperform
on multi-oriented and long-size objects detection. Distinguishing with general
NMS methods via duplicate removal, we propose a novel graph fusion network,
named GFNet, for multi-oriented object detection. Our GFNet is extensible and
adaptively fuse dense detection boxes to detect more accurate and holistic
multi-oriented object instances. Specifically, we first adopt a locality-aware
clustering algorithm to group dense detection boxes into different clusters. We
will construct an instance sub-graph for the detection boxes belonging to one
cluster. Then, we propose a graph-based fusion network via Graph Convolutional
Network (GCN) to learn to reason and fuse the detection boxes for generating
final instance boxes. Extensive experiments both on public available
multi-oriented text datasets (including MSRA-TD500, ICDAR2015, ICDAR2017-MLT)
and multi-oriented object datasets (DOTA) verify the effectiveness and
robustness of our method against general NMS methods in multi-oriented object
detection.
- Abstract(参考訳): オブジェクト検出では、検出された高密度ボックスの水平重複を除去して最終オブジェクトインスタンスを生成するために、非最大抑圧(NMS)法が広く採用されている。
しかしながら、密集した検出ボックスの品質が低下し、コンテキスト情報の明示的な探索は行わないため、単純なintersection-over-union(iou)メトリクスによる既存のnmsメソッドは、多目的および長大のオブジェクト検出に過小評価される傾向がある。
重複除去による一般的なNMS手法を駆使して,多目的物体検出のための新しいグラフ融合ネットワークGFNetを提案する。
我々のGFNetは拡張可能で適応的に高密度検出ボックスを融合し、より正確で総合的な多目的オブジェクトインスタンスを検出する。
具体的には,まず,局所性に着目したクラスタリングアルゴリズムを適用し,密度の高い検出ボックスを異なるクラスタにグループ化する。
1つのクラスタに属する検出ボックスのインスタンスサブグラフを構築します。
そこで我々は,グラフ畳み込みネットワーク(GCN)を用いたグラフベースの融合ネットワークを提案する。
マルチ指向テキストデータセット(msra-td500, icdar2015, icdar2017-mlt)とマルチ指向オブジェクトデータセット(dota)の両方において, 提案手法の有効性と頑健性を検証した。
関連論文リスト
- Consensus Focus for Object Detection and minority classes [3.739946023378878]
半教師付きおよび長い尾を持つ物体検出のための修正されたコンセンサス焦点を提案する。
実験では,NMS,ソフトNMS,WBFよりも信頼性が高く,バウンディングボックスの精度が高かった。
論文 参考訳(メタデータ) (2024-01-10T19:55:15Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Illicit item detection in X-ray images for security applications [7.519872646378835]
X線画像におけるコントラバンドアイテムの自動検出は、公共の安全を著しく向上させる。
ディープニューラルネットワーク(DNN)に依存する現代のコンピュータビジョンアルゴリズムは、このタスクを遂行できることを証明している。
本稿では,X線解析領域におけるそのようなアルゴリズムの2倍の改良を提案する。
論文 参考訳(メタデータ) (2023-05-03T07:28:05Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Multi-Source Domain Adaptation for Object Detection [52.87890831055648]
我々は、Divide-and-Merge Spindle Network (DMSN)と呼ばれる、より高速なR-CNNベースのフレームワークを提案する。
DMSNはドメイン非ネイティブを同時に強化し、識別力を維持することができる。
擬似目標部分集合の最適パラメータを近似する新しい擬似学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-30T03:17:20Z) - Global Correlation Network: End-to-End Joint Multi-Object Detection and
Tracking [2.749204052800622]
本稿では,global correlation network (gcnet) という,エンドツーエンドでマルチオブジェクト検出と追跡を行うネットワークを提案する。
gcnetはオフセット予測の代わりに絶対サイズと境界ボックスの座標の回帰のためにグローバル相関層を導入する。
GCNetによる検出と追跡のパイプラインは概念的にはシンプルで、非最大抑制、データアソシエーション、その他の複雑な追跡戦略を必要としない。
論文 参考訳(メタデータ) (2021-03-23T13:16:42Z) - Object Detection Made Simpler by Eliminating Heuristic NMS [70.93004137521946]
単純なNMSのないエンドツーエンドのオブジェクト検出フレームワークを示す。
検出精度は元の1段検出器と比べて同等か、さらに向上した。
論文 参考訳(メタデータ) (2021-01-28T02:38:29Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - End-to-End Multi-Object Tracking with Global Response Map [23.755882375664875]
画像シーケンス/映像を入力とし、学習対象の位置と追跡対象を直接出力する、完全にエンドツーエンドのアプローチを提案する。
具体的には,提案した多目的表現戦略により,グローバル応答マップをフレーム上で正確に生成することができる。
MOT16 と MOT17 のベンチマークによる実験結果から,提案したオンライントラッカーは,いくつかのトラッキング指標において最先端の性能を達成した。
論文 参考訳(メタデータ) (2020-07-13T12:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。