論文の概要: Salient Objects in Clutter
- arxiv url: http://arxiv.org/abs/2105.03053v1
- Date: Fri, 7 May 2021 03:49:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 21:45:44.909560
- Title: Salient Objects in Clutter
- Title(参考訳): クラッタ内の健全なオブジェクト
- Authors: Deng-Ping Fan, Jing Zhang, Gang Xu, Ming-Ming Cheng, Ling Shao
- Abstract要約: 本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
- 参考スコア(独自算出の注目度): 130.63976772770368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper identifies and addresses a serious design bias of existing salient
object detection (SOD) datasets, which unrealistically assume that each image
should contain at least one clear and uncluttered salient object. This design
bias has led to a saturation in performance for state-of-the-art SOD models
when evaluated on existing datasets. However, these models are still far from
satisfactory when applied to real-world scenes. Based on our analyses, we
propose a new high-quality dataset and update the previous saliency benchmark.
Specifically, our dataset, called Salient Objects in Clutter (SOC), includes
images with both salient and non-salient objects from several common object
categories. In addition to object category annotations, each salient image is
accompanied by attributes that reflect common challenges in real-world scenes,
which can help provide deeper insight into the SOD problem. Further, with a
given saliency encoder, e.g., the backbone network, existing saliency models
are designed to achieve mapping from the training image set to the training
ground-truth set. We, therefore, argue that improving the dataset can yield
higher performance gains than focusing only on the decoder design. With this in
mind, we investigate several dataset-enhancement strategies, including label
smoothing to implicitly emphasize salient boundaries, random image augmentation
to adapt saliency models to various scenarios, and self-supervised learning as
a regularization strategy to learn from small datasets. Our extensive results
demonstrate the effectiveness of these tricks. We also provide a comprehensive
benchmark for SOD, which can be found in our repository:
http://dpfan.net/SOCBenchmark.
- Abstract(参考訳): 本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処し,各画像が少なくとも1つの正当性オブジェクトを含むことを非現実的に仮定する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
しかし、これらのモデルは現実世界のシーンに適用しても満足できない。
分析結果に基づき,新しい高品質データセットを提案し,従来のsaliencyベンチマークを更新した。
特に、salient objects in clutter(soc)と呼ばれるデータセットには、いくつかの共通オブジェクトカテゴリからのsalient objectsとnon-salient objectsの両方のイメージが含まれています。
オブジェクトカテゴリアノテーションに加えて、それぞれの健全なイメージには、現実世界のシーンにおける共通の課題を反映した属性が伴い、SOD問題に関する深い洞察を提供するのに役立つ。
さらに、所定のサリエンシーエンコーダ、例えばバックボーンネットワークを用いて、トレーニング画像セットからトレーニンググランドルースセットへのマッピングを実現するために、既存のサリエンシーモデルが設計されている。
したがって、データセットの改善はデコーダ設計にのみフォーカスするよりも高いパフォーマンス向上をもたらすと我々は主張する。
このことを念頭に置いて,ラベルの平滑化と暗黙的な境界強調,さまざまなシナリオにサリエンシーモデルを適用するためのランダム画像拡張,小さなデータセットから学習するための正規化戦略としての自己教師あり学習など,いくつかのデータセット強化戦略を検討する。
我々はこれらのトリックの有効性を実証した。
また、当社のリポジトリにあるsodの包括的なベンチマークも提供しています。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Few-shot Object Localization [37.347898735345574]
本稿では,Few-Shot Object Localization (FSOL) という新しいタスクを定義する。
限られたサンプルで正確な位置決めを実現することを目的としている。
本課題は、少数のラベル付きサポートサンプルを利用して、対応する画像内のオブジェクトの位置情報をクエリすることで、一般化されたオブジェクトのローカライゼーションを実現する。
実験の結果,FSOLタスクにおけるアプローチの大幅な性能向上が示され,さらなる研究のための効率的なベンチマークが確立された。
論文 参考訳(メタデータ) (2024-03-19T05:50:48Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Labeling Indoor Scenes with Fusion of Out-of-the-Box Perception Models [4.157013247909771]
ボトムアップセグメンテーション(SAM)、オブジェクト検出(Detic)、セマンティックセグメンテーション(MaskFormer)の最先端モデルを活用することを提案する。
室内環境におけるセマンティックセグメンテーションとオブジェクトインスタンス検出のための擬似ラベルを得るための,コスト効率の高いラベリング手法を開発することを目的とする。
提案手法の有効性を,Active VisionデータセットとADE20Kデータセットに示す。
論文 参考訳(メタデータ) (2023-11-17T21:58:26Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。