論文の概要: Boundary and Relation Distillation for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2401.13174v1
- Date: Wed, 24 Jan 2024 01:41:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-25 15:40:18.724893
- Title: Boundary and Relation Distillation for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションにおける境界と関係蒸留
- Authors: Dong Zhang, Pingcheng Dong, Xinting Hu, Long Chen, Kwang-Ting Cheng
- Abstract要約: 小さなセマンティックセグメンテーションモデルでは、境界領域の完全性を維持し、ターゲット領域の接続性を維持する際にエラーが発生する。
本研究では,大規模教師モデルから小学生モデルへの知識蒸留を用いた境界・関係蒸留(BRD)戦略を提案する。
BRDは推論コストを増大させることなく、現在の手法を大幅に上回る。
- 参考スコア(独自算出の注目度): 32.700516989188536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, it has been revealed that small semantic segmentation (SS) models
exhibit a tendency to make errors in maintaining boundary region completeness
and preserving target region connectivity, despite their effective segmentation
of the main object regions. To address these errors, we propose a targeted
boundary and relation distillation (BRD) strategy using knowledge distillation
from large teacher models to small student models. Specifically, the boundary
distillation extracts explicit object boundaries from the hierarchical feature
maps of the backbone network, subsequently enhancing the student model's mask
quality in boundary regions. Concurrently, the relation distillation transfers
implicit relations from the teacher model to the student model using
pixel-level self-relation as a bridge, ensuring that the student's mask has
strong target region connectivity. The proposed BRD is designed concretely for
SS and is characterized by simplicity and efficiency. Through experimental
evaluations on multiple SS datasets, including Pascal VOC 2012, Cityscapes,
ADE20K, and COCO-Stuff 10K, we demonstrated that BRD significantly surpasses
the current methods without increasing the inference costs, generating crisp
region boundaries and smooth connecting regions that are challenging for small
models.
- Abstract(参考訳): 近年,スモールセマンティクスセグメンテーション(ss)モデルでは,主対象領域の効果的なセグメンテーションにもかかわらず,境界領域の完全性維持や対象領域の接続性維持に誤りが生じる傾向が明らかにされている。
これらの誤りに対処するために,大規模教師モデルから小学生モデルへの知識蒸留を用いた境界・関係蒸留(BRD)戦略を提案する。
具体的には、境界蒸留はバックボーンネットワークの階層的特徴マップから明示的なオブジェクト境界を抽出し、その後、境界領域における学生モデルのマスク品質を向上させる。
同時に, 教師モデルから学生モデルへの暗黙の関係を, 画素レベルの自己関係をブリッジとして伝達し, 生徒のマスクが強い目標領域接続性を持つことを保証する。
提案するbrdはss用に設計され,単純さと効率性が特徴である。
筆者らは,Pascal VOC 2012,Cityscapes,ADE20K,COCO-Stuff 10Kを含む複数のSSデータセットの実験的評価により,BRDが推定コストを増大させることなく現在の手法を大幅に上回ることを示した。
関連論文リスト
- Deep Boosting Learning: A Brand-new Cooperative Approach for Image-Text Matching [53.05954114863596]
画像テキストマッチングのための新しいDeep Boosting Learning (DBL)アルゴリズムを提案する。
アンカーブランチは、まずデータプロパティに関する洞察を提供するために訓練される。
ターゲットブランチは、一致したサンプルと未一致のサンプルとの相対距離をさらに拡大するために、より適応的なマージン制約を同時に課される。
論文 参考訳(メタデータ) (2024-04-28T08:44:28Z) - Attention-guided Feature Distillation for Semantic Segmentation [8.344263189293578]
本稿では,改良された特徴写像を用いて注目を伝達するための簡易かつ強力な手法の有効性を示す。
提案手法は, セマンティックセグメンテーションにおける既存手法を高密度な予測課題として優れ, リッチな情報の蒸留に有効であることが証明された。
論文 参考訳(メタデータ) (2024-03-08T16:57:47Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - BPKD: Boundary Privileged Knowledge Distillation For Semantic
Segmentation [20.450568708073767]
本稿では,セマンティックセグメンテーションのための境界優先型知識蒸留(BPKD)を提案する。
BPKDは、教師モデルの体とエッジの知識を、コンパクトな学生モデルと別々に蒸留する。
BPKD法は, エッジ領域とボディ領域を広範囲に改良し, 集約する手法であることを示す。
論文 参考訳(メタデータ) (2023-06-13T18:45:32Z) - Impact of a DCT-driven Loss in Attention-based Knowledge-Distillation
for Scene Recognition [64.29650787243443]
本稿では, アクティベーションマップの2次元周波数変換を転送前に提案し, 解析する。
この戦略は、シーン認識などのタスクにおける知識伝達可能性を高める。
我々は、この論文で使われているトレーニングおよび評価フレームワークを、http://www.vpu.eps.uam.es/publications/DCTBasedKDForSceneRecognitionで公開しています。
論文 参考訳(メタデータ) (2022-05-04T11:05:18Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - Weakly Supervised Semantic Segmentation via Alternative Self-Dual
Teaching [82.71578668091914]
本稿では,分類とマスク・リファインメント・コンポーネントを統合された深層モデルに組み込む,コンパクトな学習フレームワークを確立する。
本稿では,高品質な知識相互作用を促進するために,新たな自己双対学習(ASDT)機構を提案する。
論文 参考訳(メタデータ) (2021-12-17T11:56:56Z) - Boundary Guided Context Aggregation for Semantic Segmentation [23.709865471981313]
我々は、画像の全体的意味理解を促進するために、コンテキストアグリゲーションのための重要なガイダンスとして境界を利用する。
我々はCityscapesとADE20Kデータベースに関する広範な実験を行い、最先端の手法で同等の結果を得る。
論文 参考訳(メタデータ) (2021-10-27T17:04:38Z) - BiconNet: An Edge-preserved Connectivity-based Approach for Salient
Object Detection [3.3517146652431378]
既存のSaliencyベースのSODフレームワークをバックボーンとして使用できることを示す。
5つのベンチマークデータセットの総合的な実験を通して,提案手法が最先端のSOD手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-02-27T21:39:04Z) - Interpretable and Accurate Fine-grained Recognition via Region Grouping [14.28113520947247]
微粒な視覚認識のための解釈可能な深層モデルを提案する。
私たちの手法の中核は、ディープニューラルネットワーク内での領域ベースの部分発見と帰属の統合です。
本研究は,分類タスクの最先端手法と比較した。
論文 参考訳(メタデータ) (2020-05-21T01:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。