論文の概要: DNA: Denoised Neighborhood Aggregation for Fine-grained Category
Discovery
- arxiv url: http://arxiv.org/abs/2310.10151v1
- Date: Mon, 16 Oct 2023 07:43:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 15:48:31.669030
- Title: DNA: Denoised Neighborhood Aggregation for Fine-grained Category
Discovery
- Title(参考訳): DNA: きめ細かいカテゴリー発見のための隣人集団の特定
- Authors: Wenbin An, Feng Tian, Wenkai Shi, Yan Chen, Qinghua Zheng, QianYing
Wang, Ping Chen
- Abstract要約: 本稿では,データのセマンティック構造を埋め込み空間にエンコードする自己教師型フレームワークを提案する。
我々は、クエリのk-nearest隣人を正のキーとして検索し、データ間のセマンティックな類似性を捉え、隣人からの情報を集約し、コンパクトなクラスタ表現を学ぶ。
我々の手法は、より正確な隣人(21.31%の精度改善)を検索し、最先端のモデルよりも大きなマージンで性能を向上することができる。
- 参考スコア(独自算出の注目度): 25.836440772705505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discovering fine-grained categories from coarsely labeled data is a practical
and challenging task, which can bridge the gap between the demand for
fine-grained analysis and the high annotation cost. Previous works mainly focus
on instance-level discrimination to learn low-level features, but ignore
semantic similarities between data, which may prevent these models learning
compact cluster representations. In this paper, we propose Denoised
Neighborhood Aggregation (DNA), a self-supervised framework that encodes
semantic structures of data into the embedding space. Specifically, we retrieve
k-nearest neighbors of a query as its positive keys to capture semantic
similarities between data and then aggregate information from the neighbors to
learn compact cluster representations, which can make fine-grained categories
more separatable. However, the retrieved neighbors can be noisy and contain
many false-positive keys, which can degrade the quality of learned embeddings.
To cope with this challenge, we propose three principles to filter out these
false neighbors for better representation learning. Furthermore, we
theoretically justify that the learning objective of our framework is
equivalent to a clustering loss, which can capture semantic similarities
between data to form compact fine-grained clusters. Extensive experiments on
three benchmark datasets show that our method can retrieve more accurate
neighbors (21.31% accuracy improvement) and outperform state-of-the-art models
by a large margin (average 9.96% improvement on three metrics). Our code and
data are available at https://github.com/Lackel/DNA.
- Abstract(参考訳): 粗いラベル付きデータからきめ細かいカテゴリを見つけることは実用的で困難な作業であり、細粒度分析の需要と高いアノテーションコストのギャップを埋めることができる。
これまでの研究は主に、低レベルの特徴を学ぶためのインスタンスレベルの識別に焦点を当てていたが、データ間のセマンティックな類似性は無視している。
本稿では,データのセマンティック構造を埋め込み空間にエンコードする自己教師型フレームワークであるDenoized Neighborhood Aggregation (DNA)を提案する。
具体的には、クエリのk-nearestの隣人を正のキーとして検索し、データ間の意味的類似性をキャプチャし、隣人から情報を集約してコンパクトなクラスタ表現を学ぶ。
しかし、抽出された隣人はうるさく、多くの偽陽性キーを含むことができ、学習された埋め込みの品質を低下させることができる。
この課題に対処するために、これらの偽隣人をより良い表現学習のためにフィルタリングする3つの原則を提案する。
さらに,このフレームワークの学習目的は,データ間の意味的類似性を捉え,コンパクトな細粒度クラスタを形成するクラスタリング損失に相当することを理論的に正当化する。
3つのベンチマークデータセットの大規模な実験により、我々の手法はより正確な隣人(21.31%の精度改善)と最先端のモデルを大きなマージン(平均して3つのメトリクスで9.96%の改善)で上回ることができることが示された。
コードとデータはhttps://github.com/lackel/dnaで入手できます。
関連論文リスト
- A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.39844791923145]
我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。
本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文 参考訳(メタデータ) (2024-07-03T08:54:45Z) - Influence of Swarm Intelligence in Data Clustering Mechanisms [0.0]
自然にインスパイアされたSwarmベースのアルゴリズムは、データの欠如と一貫性のない大規模なデータセットに対処するために、データクラスタリングに使用される。
本稿では、これらの新しいアプローチの性能を概観し、問題のある状況に最適な方法の比較を行う。
論文 参考訳(メタデータ) (2023-05-07T08:40:50Z) - Learn to Cluster Faces with Better Subgraphs [13.511058277653122]
顔クラスタリングは、巨大な未ラベルの顔データに擬似ラベルを提供することができる。
既存のクラスタリング手法は、均一な閾値や学習されたカットオフ位置に基づいて、サブグラフ内の特徴を集約する。
本研究は、ノイズを著しく低減できる効率的な近傍対応サブグラフ調整法を提案する。
論文 参考訳(メタデータ) (2023-04-21T09:18:55Z) - Nearest Neighbor-Based Contrastive Learning for Hyperspectral and LiDAR
Data Classification [45.026868970899514]
本稿では,Nearest Neighbor-based Contrastive Learning Network (NNCNet)を提案する。
具体的には,近隣地域間のセマンティック関係を強化した近傍データ拡張手法を提案する。
さらに,HSIデータとLiDARデータ間の2次・高次特徴相互作用を生かしたバイリニアアテンションモジュールを設計する。
論文 参考訳(メタデータ) (2023-01-09T13:43:54Z) - SSDBCODI: Semi-Supervised Density-Based Clustering with Outliers
Detection Integrated [1.8444322599555096]
クラスタリング分析は、機械学習における重要なタスクの1つだ。
クラスタリングクラスタリングのパフォーマンスが、異常値によって著しく損なわれる可能性があるため、アルゴリズムは、異常値検出のプロセスを組み込もうとする。
我々は,半教師付き検出素子であるSSDBCODIを提案する。
論文 参考訳(メタデータ) (2022-08-10T21:06:38Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Integrating Semantics and Neighborhood Information with Graph-Driven
Generative Models for Document Retrieval [51.823187647843945]
本稿では,周辺情報をグラフ誘導ガウス分布でエンコードし,その2種類の情報をグラフ駆動生成モデルと統合することを提案する。
この近似の下では、トレーニング対象がシングルトンまたはペアワイズ文書のみを含む用語に分解可能であることを証明し、モデルが非関連文書と同じくらい効率的にトレーニングできることを示す。
論文 参考訳(メタデータ) (2021-05-27T11:29:03Z) - How to Design Robust Algorithms using Noisy Comparison Oracle [12.353002222958605]
メトリクスに基づく比較操作は、様々なクラスタリング技術の研究に基本的である。
本稿では,最接近探索,最接近探索,最接近探索など様々な問題について検討する。
k中心クラスタリングと凝集階層クラスタリングのためのロバストなアルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-05-12T16:58:09Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。