論文の概要: Compositional Clustering: Applications to Multi-Label Object Recognition
and Speaker Identification
- arxiv url: http://arxiv.org/abs/2109.04160v4
- Date: Fri, 21 Jul 2023 19:42:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 01:29:28.899762
- Title: Compositional Clustering: Applications to Multi-Label Object Recognition
and Speaker Identification
- Title(参考訳): 合成クラスタリング:マルチラベルオブジェクト認識と話者識別への応用
- Authors: Zeqian Li, Xinlu He, and Jacob Whitehill
- Abstract要約: 本稿では,クラスタが構成的関係を持つことのできる,新たなクラスタリングタスクについて考察する。
サンプルをコヒーレントなグループに分割し,構成構造を推定できる3つの新しいアルゴリズムを提案する。
本研究は,複数話者からの同時発話によるオープンワールド多ラベル物体認識と話者識別・ダイアリゼーションへの応用について述べる。
- 参考スコア(独自算出の注目度): 19.470445399577265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a novel clustering task in which clusters can have compositional
relationships, e.g., one cluster contains images of rectangles, one contains
images of circles, and a third (compositional) cluster contains images with
both objects. In contrast to hierarchical clustering in which a parent cluster
represents the intersection of properties of the child clusters, our problem is
about finding compositional clusters that represent the union of the properties
of the constituent clusters. This task is motivated by recently developed
few-shot learning and embedding models can distinguish the label sets, not just
the individual labels, assigned to the examples. We propose three new
algorithms -- Compositional Affinity Propagation (CAP), Compositional k-means
(CKM), and Greedy Compositional Reassignment (GCR) -- that can partition
examples into coherent groups and infer the compositional structure among them.
We show promising results, compared to popular algorithms such as Gaussian
mixtures, Fuzzy c-means, and Agglomerative Clustering, on the OmniGlot and
LibriSpeech datasets. Our work has applications to open-world multi-label
object recognition and speaker identification & diarization with simultaneous
speech from multiple speakers.
- Abstract(参考訳): 例えば、1つのクラスタが長方形のイメージを、もう1つは円のイメージを、もう1つのクラスタが両方のオブジェクトを持つイメージをそれぞれ含むような、新しいクラスタリングタスクを考える。
親クラスタが子クラスタの性質の交点を表す階層的クラスタリングとは対照的に、本問題は構成クラスタの性質の結合を表す構成的クラスタを見つけることである。
このタスクは、最近開発された少数ショット学習と埋め込みモデルによって、サンプルに割り当てられた個々のラベルだけでなく、ラベルセットを区別することができる。
本稿では,構成親和性伝達(CAP),構成k平均(CKM),Greedy Composal Reassignment(GCR)の3つの新しいアルゴリズムを提案する。
我々は,OmniGlotとLibriSpeechのデータセット上で,ガウス混合,ファジィc平均,Agglomerative Clusteringなどの一般的なアルゴリズムと比較して,有望な結果を示す。
本研究は,マルチラベル物体認識と話者識別とダイアリゼーションを,複数話者の同時発話に応用する。
関連論文リスト
- Text-Guided Alternative Image Clustering [11.103514372355088]
この研究は、代替画像クラスタリングを容易にするために、大きな視覚言語モデルの可能性を探るものである。
本稿では,ユーザの興味をプロンプトを通じて活用する新たなアプローチとして,テキストガイドによる代替イメージコンセンサスクラスタリング(TGAICC)を提案する。
TGAICCは、4つの代替イメージクラスタリングベンチマークデータセットで画像とテキストベースのベースラインを上回っている。
論文 参考訳(メタデータ) (2024-06-07T08:37:57Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Visualizing Overlapping Biclusterings and Boolean Matrix Factorizations [7.509129971169722]
重なり合うクラスタのクラスタリングを二部グラフで可視化する問題について検討する。
優れた視覚化が満たすべき3つの異なる目的を概念化します。
実世界のデータセットの実験では、これらの競合する目標間の最良のトレードオフは、小説によって達成される。
論文 参考訳(メタデータ) (2023-07-14T15:12:55Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - CLUSTSEG: Clustering for Universal Segmentation [56.58677563046506]
CLUSTSEGは画像セグメンテーションのための一般的なトランスフォーマーベースのフレームワークである。
これは、統合されたニューラルクラスタリングスキームを通じて、異なるイメージセグメンテーションタスク(スーパーピクセル、セマンティック、インスタンス、パノプティクス)に取り組む。
論文 参考訳(メタデータ) (2023-05-03T15:31:16Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Efficient Algorithms for Generating Provably Near-Optimal Cluster
Descriptors for Explainability [36.11663695534294]
本稿では,クラスタに対する簡潔な表現を構築するための最近のアプローチを拡張して,クラスタをより解釈しやすくする問題について検討する。
我々は,その問題に対する性能保証を証明可能な近似アルゴリズムを開発した。
また、異なる脅威レベルを表すゲノム配列のクラスタを含むデータセットからのクラスタを説明するアプリケーションを示す。
論文 参考訳(メタデータ) (2020-02-06T19:49:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。