論文の概要: Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN
- arxiv url: http://arxiv.org/abs/2002.07417v1
- Date: Tue, 18 Feb 2020 07:57:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 20:19:39.871571
- Title: Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN
- Title(参考訳): Universal-RCNN: 転送可能なグラフR-CNNによるUniversal Object Detector
- Authors: Hang Xu, Linpu Fang, Xiaodan Liang, Wenxiong Kang, Zhenguo Li
- Abstract要約: 我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
- 参考スコア(独自算出の注目度): 117.80737222754306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The dominant object detection approaches treat each dataset separately and
fit towards a specific domain, which cannot adapt to other domains without
extensive retraining. In this paper, we address the problem of designing a
universal object detection model that exploits diverse category granularity
from multiple domains and predict all kinds of categories in one system.
Existing works treat this problem by integrating multiple detection branches
upon one shared backbone network. However, this paradigm overlooks the crucial
semantic correlations between multiple domains, such as categories hierarchy,
visual similarity, and linguistic relationship. To address these drawbacks, we
present a novel universal object detector called Universal-RCNN that
incorporates graph transfer learning for propagating relevant semantic
information across multiple datasets to reach semantic coherency. Specifically,
we first generate a global semantic pool by integrating all high-level semantic
representation of all the categories. Then an Intra-Domain Reasoning Module
learns and propagates the sparse graph representation within one dataset guided
by a spatial-aware GCN. Finally, an InterDomain Transfer Module is proposed to
exploit diverse transfer dependencies across all domains and enhance the
regional feature representation by attending and transferring semantic contexts
globally. Extensive experiments demonstrate that the proposed method
significantly outperforms multiple-branch models and achieves the
state-of-the-art results on multiple object detection benchmarks (mAP: 49.1% on
COCO).
- Abstract(参考訳): 支配的なオブジェクト検出アプローチは、各データセットを別々に扱い、広範囲な再トレーニングなしに他のドメインに適応できない特定のドメインに適合する。
本稿では,複数のドメインから多種多様なカテゴリの粒度を生かし,一つのシステムにおけるあらゆるカテゴリを予測できる汎用オブジェクト検出モデルの設計問題に対処する。
既存の作業では、複数の検出ブランチをひとつの共有バックボーンネットワークに統合することでこの問題を処理している。
しかし、このパラダイムは、カテゴリ階層、視覚の類似性、言語関係など、複数のドメイン間の重要な意味的相関を見落としている。
これらの欠点に対処するために,複数のデータセット間で関連する意味情報を伝播して意味的一貫性に達するグラフ伝達学習を取り入れたUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
具体的には、まず、すべてのカテゴリのすべてのハイレベルな意味表現を統合することで、グローバルセマンティクスプールを生成します。
次に、ドメイン内推論モジュールは、空間認識GCNによってガイドされた1つのデータセット内のスパースグラフ表現を学習し、伝播する。
最後に、InterDomain Transfer Moduleが提案され、すべてのドメインにまたがる多様な転送依存性を活用でき、グローバルなセマンティックコンテキストへの参加と転送によって、地域的特徴表現を強化する。
複数のオブジェクト検出ベンチマーク(mAP: 49.1% on COCO)において,提案手法がマルチブランチモデルを大幅に上回り,最先端の結果が得られることを示した。
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Improving Anomaly Segmentation with Multi-Granularity Cross-Domain
Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。
既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。
シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文 参考訳(メタデータ) (2023-08-16T22:54:49Z) - Mix and Reason: Reasoning over Semantic Topology with Data Mixing for
Domain Generalization [48.90173060487124]
ドメイン一般化(DG)は、複数のソースドメインから見えないターゲットドメインへの学習マシンを可能にする。
mire は2つのキーコンポーネント、すなわち Category-Aware Data Mixing (CDM) と Adaptive Semantic Topology Refinement (ASTR) で構成されている。
複数のDGベンチマーク実験により,提案法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2022-10-14T06:52:34Z) - Multi-Granularity Alignment Domain Adaptation for Object Detection [33.32519045960187]
ドメイン適応型オブジェクト検出は、ソースドメインとターゲットドメインの間に特有のデータ分布があるため、難しい。
ドメイン不変な特徴学習に向けた多粒度アライメントに基づくオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-31T09:05:06Z) - Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。