論文の概要: Deep Clustering with Incomplete Noisy Pairwise Annotations: A Geometric
Regularization Approach
- arxiv url: http://arxiv.org/abs/2305.19391v1
- Date: Tue, 30 May 2023 20:06:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 19:47:56.298944
- Title: Deep Clustering with Incomplete Noisy Pairwise Annotations: A Geometric
Regularization Approach
- Title(参考訳): 不完全不完全なペアワイズアノテーションによるディープクラスタリング:幾何正規化アプローチ
- Authors: Tri Nguyen, Shahana Ibrahim, Xiao Fu
- Abstract要約: この研究は、最近出現したDCCのロジスティック損失関数を深く研究し、その理論的性質を特徴づける。
幾何学的因子分析に基づく新しい損失関数は、ノイズのあるアノテーションに対抗して提案される。
アノテーションの混乱があっても、データメンバーシップは$textitprovably$で識別できる。
- 参考スコア(独自算出の注目度): 21.32957828106532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The recent integration of deep learning and pairwise similarity
annotation-based constrained clustering -- i.e., $\textit{deep constrained
clustering}$ (DCC) -- has proven effective for incorporating weak supervision
into massive data clustering: Less than 1% of pair similarity annotations can
often substantially enhance the clustering accuracy. However, beyond empirical
successes, there is a lack of understanding of DCC. In addition, many DCC
paradigms are sensitive to annotation noise, but performance-guaranteed noisy
DCC methods have been largely elusive. This work first takes a deep look into a
recently emerged logistic loss function of DCC, and characterizes its
theoretical properties. Our result shows that the logistic DCC loss ensures the
identifiability of data membership under reasonable conditions, which may shed
light on its effectiveness in practice. Building upon this understanding, a new
loss function based on geometric factor analysis is proposed to fend against
noisy annotations. It is shown that even under $\textit{unknown}$ annotation
confusions, the data membership can still be $\textit{provably}$ identified
under our proposed learning criterion. The proposed approach is tested over
multiple datasets to validate our claims.
- Abstract(参考訳): ディープラーニングとペアワイズ類似性に基づく制約付きクラスタリング($\textit{deep constraintsed clustering}$ (dcc))の最近の統合は、大規模なデータクラスタリングに弱い監督を組み込むことに効果的であることが証明されている。
しかし、実証的な成功を超えて、DCCに対する理解の欠如がある。
さらに、多くのDCCパラダイムはアノテーションノイズに敏感であるが、性能保証されたDCC手法は大部分が解明されている。
この研究はまず、最近出現したDCCのロジスティック損失関数を深く研究し、その理論的性質を特徴づける。
以上の結果から,ロジスティックDCC損失は,妥当な条件下でのデータメンバシップの識別可能性を保証することが示唆された。
この理解に基づいて、幾何学的因子分析に基づく新しい損失関数を提案し、ノイズのあるアノテーションに対処する。
$\textit{unknown}$アノテーションの混乱の下でも、データメンバシップは、提案した学習基準の下で識別される$\textit{provably}$でなければならない。
提案手法は,複数のデータセット上でテストし,クレームの検証を行う。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - CoLiDE: Concomitant Linear DAG Estimation [12.415463205960156]
観測データから線形方程式への非巡回グラフ構造学習の問題に対処する。
本稿では,空間認識学習DAGのための新しい凸スコア関数を提案する。
論文 参考訳(メタデータ) (2023-10-04T15:32:27Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Doubly Robust Instance-Reweighted Adversarial Training [107.40683655362285]
本稿では,2重のインスタンス再重み付き対向フレームワークを提案する。
KL偏差正規化損失関数の最適化により重みを求める。
提案手法は, 平均ロバスト性能において, 最先端のベースライン法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-01T06:16:18Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Deep Clustering based Fair Outlier Detection [19.601280507914325]
本稿では,統合深層クラスタリングと外乱検出を強化するために,インスタンスレベルの重み付き表現学習戦略を提案する。
我々のDCFOD法は, 異常検出において, 異常検出の妥当性と2種類のフェアネス概念の両面において, 常に優れた性能を達成している。
論文 参考訳(メタデータ) (2021-06-09T15:12:26Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Pseudo-supervised Deep Subspace Clustering [27.139553299302754]
オートエンコーダ (AE) ベースのディープサブスペースクラスタリング (DSC) 手法は優れた性能を発揮している。
しかし、AEの自己再建損失は、豊富な有用な関係情報を無視する。
また、セマンティクスラベルを供給せずにハイレベルな類似性を学ぶことも困難である。
論文 参考訳(メタデータ) (2021-04-08T06:25:47Z) - Consistency of Anchor-based Spectral Clustering [0.0]
アンカーベースの手法は、スペクトルクラスタリングアルゴリズムの計算複雑性を低減する。
厳密な分析が可能であり,実践に有効であることを示す。
我々はChenとCaiの最先端のLCC法と競合することが判明した。
論文 参考訳(メタデータ) (2020-06-24T18:34:41Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。