論文の概要: Deep Structured Instance Graph for Distilling Object Detectors
- arxiv url: http://arxiv.org/abs/2109.12862v1
- Date: Mon, 27 Sep 2021 08:26:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:25:57.752311
- Title: Deep Structured Instance Graph for Distilling Object Detectors
- Title(参考訳): オブジェクト検出器を蒸留するためのディープ構造化インスタンスグラフ
- Authors: Yixin Chen, Pengguang Chen, Shu Liu, Liwei Wang, Jiaya Jia
- Abstract要約: 本稿では,検出システム内の情報を利用して,検出知識の蒸留を容易にするための簡単な知識構造を提案する。
我々は,1段と2段の両方の検出器上で,多様な学生-教師ペアによるCOCOオブジェクト検出の課題に対して,新しい最先端の成果を達成した。
- 参考スコア(独自算出の注目度): 82.16270736573176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Effectively structuring deep knowledge plays a pivotal role in transfer from
teacher to student, especially in semantic vision tasks. In this paper, we
present a simple knowledge structure to exploit and encode information inside
the detection system to facilitate detector knowledge distillation.
Specifically, aiming at solving the feature imbalance problem while further
excavating the missing relation inside semantic instances, we design a graph
whose nodes correspond to instance proposal-level features and edges represent
the relation between nodes. To further refine this graph, we design an adaptive
background loss weight to reduce node noise and background samples mining to
prune trivial edges. We transfer the entire graph as encoded knowledge
representation from teacher to student, capturing local and global information
simultaneously. We achieve new state-of-the-art results on the challenging COCO
object detection task with diverse student-teacher pairs on both one- and
two-stage detectors. We also experiment with instance segmentation to
demonstrate robustness of our method. It is notable that distilled Faster R-CNN
with ResNet18-FPN and ResNet50-FPN yields 38.68 and 41.82 Box AP respectively
on the COCO benchmark, Faster R-CNN with ResNet101-FPN significantly achieves
43.38 AP, which outperforms ResNet152-FPN teacher about 0.7 AP. Code:
https://github.com/dvlab-research/Dsig.
- Abstract(参考訳): 深い知識を効果的に構造化することは、教師から生徒へ、特にセマンティックビジョンタスクにおいて重要な役割を果たす。
本稿では,検出システム内の情報を利用して,検出知識の蒸留を容易にするための簡単な知識構造を提案する。
具体的には、セマンティクスインスタンス内の欠落関係をさらに掘り下げながら、特徴の不均衡問題を解決することを目指して、ノードがインスタンスの提案レベルの特徴に対応し、エッジがノード間の関係を表すグラフを設計する。
このグラフをさらに洗練するために,ノードノイズや背景サンプルマイニングを小さくするために,適応的な背景損失重みを設計する。
教師から生徒へ知識表現をエンコードしたグラフ全体を転送し,ローカル情報とグローバル情報を同時に取得する。
本研究では,COCO物体検出の課題に対して,一段検出と二段検出の両方で多種多様な学生-教師ペアによる最新の結果を得る。
また,本手法の堅牢性を示すために,インスタンスセグメンテーションの実験を行った。
ResNet18-FPNとResNet50-FPNで蒸留したFaster R-CNNは、COCOベンチマークでそれぞれ38.68および41.82 Box AP、ResNet101-FPNでFaster R-CNNは43.38 AP、ResNet152-FPNの約0.7 APを上回った。
コード: https://github.com/dvlab-research/dsig。
関連論文リスト
- Lightweight Monocular Depth Estimation with an Edge Guided Network [34.03711454383413]
本稿では,新しいエッジガイド深度推定ネットワーク(EGD-Net)を提案する。
特に、軽量なエンコーダデコーダアーキテクチャから始め、エッジガイダンスブランチを組み込む。
コンテクスト情報とエッジアテンション特徴を集約するために,トランスフォーマーをベースとした機能アグリゲーションモジュールを設計する。
論文 参考訳(メタデータ) (2022-09-29T14:45:47Z) - Measuring and Sampling: A Metric-guided Subgraph Learning Framework for
Graph Neural Network [11.017348743924426]
グラフニューラルネットワーク(GNN)のためのMetric-Guided(MeGuide)サブグラフ学習フレームワークを提案する。
MeGuideでは、サブグラフサンプリングとミニバッチベースのトレーニングのガイドとして、Feature SmoothnessとConnection Failure Distanceという2つの新しいメトリクスを使用している。
複数のデータセット上で様々なGNNをトレーニングする上で,MeGuideの有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-12-30T11:00:00Z) - Distilling Object Detectors via Decoupled Features [69.62967325617632]
より優れた学生検出器を学習するための,デカップリング機能(DeFeat)を用いた新しい蒸留アルゴリズムを提案する。
バックボーンの異なる様々な検出器を用いた実験により, 提案手法の破れが, 被写体検出の最先端蒸留法を上回ることができることを示した。
論文 参考訳(メタデータ) (2021-03-26T13:58:49Z) - Node2Seq: Towards Trainable Convolutions in Graph Neural Networks [59.378148590027735]
今回提案するグラフネットワーク層であるNode2Seqは,隣接ノードの重みを明示的に調整可能なノード埋め込みを学習する。
対象ノードに対して,当手法は注意メカニズムを介して隣接ノードをソートし,さらに1D畳み込みニューラルネットワーク(CNN)を用いて情報集約のための明示的な重み付けを行う。
また, 特徴学習のための非局所的情報を, 注意スコアに基づいて適応的に組み込むことを提案する。
論文 参考訳(メタデータ) (2021-01-06T03:05:37Z) - Pathfinder Discovery Networks for Neural Message Passing [8.633430288397376]
Pathfinder Discovery Networks (PDN) は、多重ネットワーク上でメッセージパッシンググラフを共同で学習する手法である。
PDNは、各エッジの集約重みを誘導的に学習し、下流学習タスクに最適な結果をもたらすように最適化する。
論文 参考訳(メタデータ) (2020-10-24T11:28:57Z) - Information Obfuscation of Graph Neural Networks [96.8421624921384]
本稿では,グラフ構造化データを用いた学習において,情報難読化による機密属性保護の問題について検討する。
本稿では,全変動量とワッサーシュタイン距離を交互に学習することで,事前決定された機密属性を局所的にフィルタリングするフレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-28T17:55:04Z) - Structural Temporal Graph Neural Networks for Anomaly Detection in
Dynamic Graphs [54.13919050090926]
本稿では,動的グラフの異常エッジを検出するために,エンドツーエンドの時間構造グラフニューラルネットワークモデルを提案する。
特に,まずターゲットエッジを中心にした$h$ホップ囲むサブグラフを抽出し,各ノードの役割を識別するノードラベル機能を提案する。
抽出した特徴に基づき,GRU(Gated Recurrent Unit)を用いて,異常検出のための時間的情報を取得する。
論文 参考訳(メタデータ) (2020-05-15T09:17:08Z) - Learning to Hash with Graph Neural Networks for Recommender Systems [103.82479899868191]
グラフ表現学習は、大規模に高品質な候補探索をサポートすることに多くの注目を集めている。
ユーザ・イテム相互作用ネットワークにおけるオブジェクトの埋め込みベクトルの学習の有効性にもかかわらず、連続的な埋め込み空間におけるユーザの好みを推測する計算コストは膨大である。
連続的かつ離散的なコードとを協調的に学習するための,単純かつ効果的な離散表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-04T06:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。