論文の概要: Semantic Distillation Guided Salient Object Detection
- arxiv url: http://arxiv.org/abs/2203.04076v1
- Date: Tue, 8 Mar 2022 13:40:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 13:30:17.764637
- Title: Semantic Distillation Guided Salient Object Detection
- Title(参考訳): セマンティック蒸留ガイドによる塩物検出
- Authors: Bo Xu and Guanze Liu and Han Huang and Cheng Lu and Yandong Guo
- Abstract要約: CNNに基づく正当性物体検出法は、SODタスクの主観性と畳み込み層の局所性により、実際の正当性を誤解することが多い。
生成した画像キャプションから意味蒸留された知識をVision-TransformerベースのSODフレームワークに融合させて,正確な結果を生成する意味蒸留誘導型SOD(SDG-SOD)手法を提案する。
- 参考スコア(独自算出の注目度): 17.653600212923223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing CNN-based salient object detection methods can identify local
segmentation details like hair and animal fur, but often misinterpret the real
saliency due to the lack of global contextual information caused by the
subjectiveness of the SOD task and the locality of convolution layers.
Moreover, due to the unrealistically expensive labeling costs, the current
existing SOD datasets are insufficient to cover the real data distribution. The
limitation and bias of the training data add additional difficulty to fully
exploring the semantic association between object-to-object and
object-to-environment in a given image. In this paper, we propose a semantic
distillation guided SOD (SDG-SOD) method that produces accurate results by
fusing semantically distilled knowledge from generated image captioning into
the Vision-Transformer-based SOD framework. SDG-SOD can better uncover
inter-objects and object-to-environment saliency and cover the gap between the
subjective nature of SOD and its expensive labeling. Comprehensive experiments
on five benchmark datasets demonstrate that the SDG-SOD outperforms the
state-of-the-art approaches on four evaluation metrics, and largely improves
the model performance on DUTS, ECSSD, DUT, HKU-IS, and PASCAL-S datasets.
- Abstract(参考訳): 既存のCNNベースのサルエントオブジェクト検出手法の多くは、毛髪や動物の毛皮のような局所的なセグメンテーションの詳細を識別することができるが、SODタスクの主観性と畳み込み層の局所性によって引き起こされるグローバルな文脈情報の欠如により、実際のサリエンシを誤解することが多い。
さらに、非現実的に高価なラベリングコストのため、既存のSODデータセットは実際のデータ分布をカバーするには不十分である。
トレーニングデータの制限とバイアスは、与えられた画像におけるオブジェクト間オブジェクトとオブジェクト間環境間のセマンティックな関係を十分に探求する上でさらに困難となる。
本稿では,生成した画像キャプションから意味蒸留された知識をVision-TransformerベースのSODフレームワークに融合させることにより,意味蒸留誘導型SOD(SDG-SOD)法を提案する。
SDG-SODは、オブジェクト間およびオブジェクト間サリバンスをよりよく発見し、SODの主観的性質と高価なラベリングとのギャップをカバーできる。
5つのベンチマークデータセットに関する総合的な実験により、SDG-SODは4つの評価指標に対する最先端のアプローチよりも優れており、DUTS、ECSSD、DUT、HKU-IS、PASCAL-Sデータセットのモデルパフォーマンスを大きく改善している。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - A Visual Representation-guided Framework with Global Affinity for Weakly
Supervised Salient Object Detection [8.823804648745487]
本稿では,スクリブルに基づくSODのためのコンテキスト意味知識を充実させた,一般的な視覚表現によってガイドされるフレームワークを提案する。
これらの一般的な視覚表現は、大規模未ラベルデータセットに基づいた自己教師付き学習によって生成される。
提案手法は,最先端の完全教師付きモデルに匹敵する,あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2023-02-21T14:31:57Z) - Interpretable Out-Of-Distribution Detection Using Pattern Identification [0.0]
データベースプログラムのアウト・オブ・ディストリビューション(OoD)検出は最重要課題である。
文献における一般的なアプローチは、イン・オブ・ディストリビューション(in-distriion、IoD)とOoDバリデーション・サンプルを必要とする検出器を訓練する傾向がある。
我々は、より解釈可能で堅牢なOoD検出器を構築するために、説明可能なAI、すなわちPartialulパターン識別アルゴリズムから既存の研究を活用することを提案する。
論文 参考訳(メタデータ) (2023-01-24T15:35:54Z) - Raising the Bar on the Evaluation of Out-of-Distribution Detection [88.70479625837152]
我々は、知覚/視覚的・意味的類似性の概念をiDデータと微妙に異なる概念を用いて、OoDデータの2つのカテゴリを定義した。
iD データセットが与えられた2つのカテゴリそれぞれから OoD サンプルを生成するための GAN ベースのフレームワークを提案する。
従来のベンチマークで非常によく機能する最先端のOoD検出手法は,提案したベンチマークよりもはるかに堅牢であることを示す。
論文 参考訳(メタデータ) (2022-09-24T08:48:36Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。